2020年1月3日,中國科學(xué)院北京生命科學(xué)研究院趙方慶團(tuán)隊在《自然-通訊》(Nature Communications)雜志上發(fā)表題為Accurate quantification of circular RNAs identifies extensive circular isoform switching events 的文章。該研究開發(fā)了環(huán)形RNA定量和差異表達(dá)分析的新方法——CIRIquant。與常用的環(huán)形RNA分析軟件相比,CIRIquant可以更準(zhǔn)確對環(huán)形RNA轉(zhuǎn)錄本進(jìn)行識別和定量,并為環(huán)形RNA的差異表達(dá)分析提供了便捷的一站式分析工具。

環(huán)形RNA是一類在真核生物中廣泛存在的具有特殊環(huán)狀結(jié)構(gòu)的非編碼RNA分子。已有文獻(xiàn)表明,在生物體內(nèi),環(huán)形RNA有著miRNA海綿、RBP海綿以及翻譯短肽等多項功能,在許多生物學(xué)過程中發(fā)揮著重要作用。目前研究表明,大部分環(huán)形RNA來源于蛋白編碼基因的外顯子區(qū)域。在pre-mRNA剪接的過程中,除典型的內(nèi)含子剪接事件外,還可能會發(fā)生5’端到3’端的反向剪接事件,從而形成環(huán)形RNA。因此,剪接產(chǎn)物中環(huán)形RNA所占比例是環(huán)形RNA分析的重要指標(biāo)之一,具有高成環(huán)比例的環(huán)形RNA分子,可能具有更加重要的生物學(xué)功能。同時,同一基因內(nèi)部也可能產(chǎn)生多種不同的環(huán)形RNA,基因內(nèi)對環(huán)形RNA產(chǎn)生位點的使用偏好,也在一定程度上反映了轉(zhuǎn)錄過程對環(huán)形RNA產(chǎn)生的調(diào)控。因此,環(huán)形RNA轉(zhuǎn)錄本水平的準(zhǔn)確定量,是目前環(huán)形RNA分析的重要基礎(chǔ)。

在此基礎(chǔ)上,趙方慶團(tuán)隊開發(fā)了CIRIquant。根據(jù)該算法鑒定出的環(huán)形RNA成環(huán)位點信息,研究人員重構(gòu)了具有反向剪接特征的環(huán)形RNA參考序列,簡化了復(fù)雜的反向剪接位點比對問題,并結(jié)合測序讀段比對到參考基因組和環(huán)形序列的結(jié)果,篩選出了高置信度的來自環(huán)形RNA的讀段,解決了目前環(huán)形RNA識別和定量方法中準(zhǔn)確度低和假陽性率高的問題。作者在模擬數(shù)據(jù)和真實轉(zhuǎn)錄組數(shù)據(jù)中,對多種常用環(huán)形RNA識別軟件的表現(xiàn)進(jìn)行了綜合評估,發(fā)現(xiàn)該研究中開發(fā)的方法在環(huán)形RNA表達(dá)量和成環(huán)比例的計算中,均取得了最佳的結(jié)果。

接著,研究團(tuán)隊還通過統(tǒng)計模型,對環(huán)形RNA建庫過程中常用的RNase R處理效率進(jìn)行了擬合和校正,從而在RNase R處理后的樣本中,消除了RNase R處理步驟引入的偏差,取得了更準(zhǔn)確的定量結(jié)果。在此基礎(chǔ)上,該團(tuán)隊還對環(huán)形RNA的差異表達(dá)計算方法進(jìn)行了改進(jìn),提出了新的評估表達(dá)水平和剪接傾向變化程度的打分方法。

利用上述方法,研究人員在三個剪接因子較低的HeLa細(xì)胞和20對肝癌-癌旁樣本中,發(fā)現(xiàn)了兩類線性-環(huán)形比例和成環(huán)位點使用偏好發(fā)生變化的環(huán)形RNA。這兩類環(huán)形RNA在成環(huán)比例以及基因內(nèi)成環(huán)位點使用水平上具有非常顯著的改變,反映了環(huán)形RNA轉(zhuǎn)錄過程以及轉(zhuǎn)錄后水平調(diào)控情況的變化。此外,在阿爾茲海默癥以及腎細(xì)胞癌的樣本中,研究人員也發(fā)現(xiàn)了這兩類事件的廣泛存在,說明這兩類環(huán)形RNA可能擁有更加重要的生物學(xué)功能。

該研究在轉(zhuǎn)錄組數(shù)據(jù)中實現(xiàn)了環(huán)形RNA的準(zhǔn)確識別和定量,并對環(huán)形RNA差異表達(dá)分析方法進(jìn)行了改進(jìn),提供了便捷的分析流程,為后續(xù)具有潛在功能的環(huán)形RNA篩選提供了重要的方法學(xué)工具。

該工作由趙方慶課題組的研究生張金陽、陳帥和楊靜雯完成,并得到了科技部重點研發(fā)計劃和國家自然科學(xué)基金委及中科院的經(jīng)費支持。趙方慶團(tuán)隊在前期的工作中建立了環(huán)形RNA識別、轉(zhuǎn)錄本組裝、可變剪接檢測及定量等方法,相關(guān)工作發(fā)表在Genome Biology (2015)、Nature Communications (2016,2020)、Briefings in Bioinformatics (2017)、Trends in Genetics (2018)、Genome Medicine (2019)和Cell Reports (2019)。這些研究豐富了人們對環(huán)形RNA的組成及結(jié)構(gòu)的認(rèn)識,為深入了解這一嶄新類型的非編碼RNA分子提供了重要工具和數(shù)據(jù)支持。

論文鏈接

北京生科院開發(fā)環(huán)形RNA定量和剪接體轉(zhuǎn)換識別新方法-肽度TIMEDOO

圖1. CIRIquant算法流程

北京生科院開發(fā)環(huán)形RNA定量和剪接體轉(zhuǎn)換識別新方法-肽度TIMEDOO

圖2. RBP介導(dǎo)的線性與環(huán)形轉(zhuǎn)錄本的競爭性剪接