天津工生所在哺乳動物細胞高通量基因編輯平臺構建及堿基編輯AI預測模型方面獲進展
堿基編輯器(Base Editor,BEs)能夠有效修改基因組的特定堿基,為糾正人類已知的致病性單核苷酸變異(Single nucleotide variations,SNVs)帶來希望。基礎科學探索和疾病治療應用亟需構建大量具有致病性SNV的疾病細胞模型用于科學研究,而傳統(tǒng)疾病細胞模型的構建主要依賴人工操作,不僅耗時,而且成本高昂、易出錯。
中國科學院天津工業(yè)生物技術研究所研究員王猛帶領的高通量編輯與篩選平臺實驗室、研究員畢昌昊帶領的合成生物技術實驗室、研究員張學禮帶領的微生物代謝工程實驗室合作,首次建立了自動化的哺乳動物細胞高通量基因操作平臺,可在一周內(nèi)實現(xiàn)上千個動物細胞樣本的自動化編輯,且編輯效率與手動操作效率相當?;诟咄科脚_獲得的293T細胞大量原位基因組編輯數(shù)據(jù),研究人員開發(fā)了機器學習模型(CAELM)來預測胞嘧啶堿基編輯器(BE4max)的性能。與基于慢病毒整合靶點的傳統(tǒng)機器學習建模相比,本研究創(chuàng)新性地在模型構建中考慮目標序列的真實染色體環(huán)境,結(jié)合編輯靶點序列信息進行機器學習,首次提出染色質(zhì)可及性對編輯結(jié)果的影響權重相對于靶點序列是1/6。為了擴展CAELM預測的兼容性,使CAELM模型適用于更多類型的細胞及不同的CBE堿基編輯器,科研人員在追加的相對較小的不同細胞類型(HepG2)及堿基編輯器(hyA3A-BE4max和Anc-BE4max)的編輯數(shù)據(jù)集上,使模型進行進一步訓練學習,擴展了CAELM的預測范圍。該模型可以比現(xiàn)有模型更準確的預測細胞原位靶點的堿基編輯結(jié)果,并為準確預測人類或其他物種細胞堿基編輯結(jié)果的機器學習模型的構建奠定了基礎。這一工作有望加速基于BEs的基因療法的開發(fā)和臨床應用。
相關研究成果發(fā)表在《自然-通訊》(Nature Communications)上。研究工作得到國家自然科學基金、國家重點研發(fā)計劃、天津市合成生物技術創(chuàng)新能力提升行動、天津市自然科學基金的支持。

高通量自動化哺乳動物細胞編輯流程示意圖
來源:中科院
本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。



