北京生科院環(huán)形RNA數(shù)據(jù)挖掘新技術(shù)研究獲進展
3月12日,中國科學(xué)院北京生命科學(xué)研究院研究員趙方慶團隊在Nature Biotechnology上發(fā)表了題為Comprehensive profiling of circular RNAs with nanopore sequencing and CIRI-long的論文,研究內(nèi)容為高效測定環(huán)形RNA全長轉(zhuǎn)錄本的實驗和計算方法。該研究主要是利用隨機引物對環(huán)形RNA進行的滾環(huán)反轉(zhuǎn)錄擴增,而后應(yīng)用納米孔測序技術(shù)對環(huán)形RNA的全長序列進行直接測序,并使用開發(fā)的CIRI-long算法識別長測序讀段中的環(huán)形RNA序列并進行全長重構(gòu)。實驗結(jié)果表明,與傳統(tǒng)的環(huán)形RNA二代測序技術(shù)相比,該方法將環(huán)形RNA檢測靈敏度提升了20倍,并可實現(xiàn)對不同長度(<100bp-5kb)的環(huán)形RNA全長序列的無偏識別,大幅提升了環(huán)形轉(zhuǎn)錄本的重構(gòu)能力,為其功能研究提供了重要的實驗方法和計算工具。
環(huán)形RNA是一類在真核生物中廣泛存在的具有特殊環(huán)狀結(jié)構(gòu)的RNA分子。研究表明,在生物體內(nèi),環(huán)形RNA主要通過其序列特征,發(fā)揮miRNA海綿、RBP海綿及翻譯短肽等重要的生物學(xué)功能。因而環(huán)形RNA的全長序列確定是進行環(huán)形RNA功能研究的重要基礎(chǔ)。由于環(huán)形RNA的內(nèi)部序列與線性mRNA分子高度相似,在數(shù)據(jù)中很難區(qū)分來自環(huán)形RNA和線性RNA分子的讀段。研究方法對于環(huán)形RNA結(jié)構(gòu)的識別能力主要被二代測序的讀長所限制,對于長度較長(>500bp)的環(huán)形RNA分子,仍缺少有效的全長重構(gòu)手段。
針對這一問題,研究團隊構(gòu)建并優(yōu)化環(huán)形RNA建庫流程,使用隨機引物對環(huán)形RNA進行滾環(huán)反轉(zhuǎn)錄擴增,結(jié)合片段長度篩選(~1kb),針對長度更長的目標(biāo)cDNA片段進行富集,最后使用納米孔測序技術(shù),實現(xiàn)了對目標(biāo)環(huán)形RNA的全長序列進行直接測定。同時,研究人員進一步開發(fā)了CIRI-long算法,識別納米孔測序數(shù)據(jù)中的環(huán)形RNA結(jié)構(gòu),并使用偏序比對算法,校正納米孔測序帶來的測序錯誤。隨后,CIRI-long基于基因注釋和剪接信號信息,提供單一樣本內(nèi)和多樣本間結(jié)果的整合與校正方法,實現(xiàn)了環(huán)形RNA的準(zhǔn)確識別和全長重構(gòu)。
為了評估CIRI-long方法的準(zhǔn)確性和效率,研究人員利用模擬數(shù)據(jù)和多次實驗重復(fù),綜合評估CIRI-long結(jié)果,發(fā)現(xiàn)該方法具有較高的靈敏度,且與實驗結(jié)果保持了高度的一致性。同時,結(jié)合二代測序結(jié)果及公共數(shù)據(jù)庫的全面分析,表明CIRI-long可有效地對高表達環(huán)形RNA進行識別,且與二代測序方法相比,CIRI-long對環(huán)形RNA的檢測效率有著近20倍的提升,對表達豐度較低的環(huán)形RNA有著更好的識別效果,同時可以識別到長度更長的環(huán)形RNA分子,大幅提升了環(huán)形RNA全長的檢測能力。
利用該方法,研究進一步發(fā)現(xiàn)了一類由內(nèi)含子自連形成的新型環(huán)形RNA分子(Intronic self-ligated circRNA)。這類環(huán)形RNA具有特殊的剪接位點內(nèi)側(cè)的GT-AG信號和較高的兩側(cè)序列保守性,在之前工作中缺乏普遍研究。此外,研究人員在小鼠不同組織中,對內(nèi)含子自連型環(huán)形RNA的表達模式開展了進一步探究,發(fā)現(xiàn)Tpm1基因可以產(chǎn)生一個長度為767bp的內(nèi)含子自連型環(huán)形RNA——circTpm1。與Tpm1基因的其他內(nèi)含子相比,該分子成環(huán)區(qū)域具有相對較高的保守性,且與線性mRNA在組織間具有不同的表達模式,說明circTpm1并非其母本基因轉(zhuǎn)錄的副產(chǎn)物,可能具有一定的生物學(xué)功能。
綜上,研究人員開發(fā)了基于納米孔測序技術(shù)的環(huán)形RNA全長識別流程CIRI-long,通過結(jié)合滾環(huán)反轉(zhuǎn)錄擴增和納米孔長讀長測序技術(shù),可直接測定環(huán)形RNA的全長序列,實現(xiàn)了對環(huán)形RNA的高靈敏度檢測和內(nèi)部結(jié)構(gòu)重構(gòu)。與傳統(tǒng)的二代測序方法相比,CIRI-long大幅提升了環(huán)形RNA全長重構(gòu)能力,并可實現(xiàn)與二代測序相近的分析成本。同時,CIRI-long提供了樣本間整合分析的工具,并針對納米孔測序的高錯誤率建立了有效校正方法,為環(huán)形RNA的功能研究提供了重要的方法學(xué)工具,具有很高的應(yīng)用價值。
該研究工作由趙方慶團隊完成,獲得國家杰出青年科學(xué)基金、國家重點研發(fā)計劃及中科院的支持。趙方慶團隊在前期的工作中建立了環(huán)形RNA識別、可變剪接檢測及定量等方法,相關(guān)研究發(fā)表在Nature Biotechnology(2021)、Nature Communications(2016,2020)、Genome Biology(2015,2020)、Briefings in Bioinformatics(2018)、Trends in Genetics(2018)、Genome Medicine(2019)、Cell Reports(2019)和Bioinformatics(2020)上。這些研究成果豐富了我們對環(huán)形RNA的組成及結(jié)構(gòu)的認(rèn)識,為深入了解這一類特殊的RNA分子提供了重要工具和數(shù)據(jù)支持。
圖1.環(huán)形RNA全長重構(gòu)的實驗與計算流程
圖2.基于納米孔測序全面揭示環(huán)形RNA的多樣性
來源:中科院

