華南農(nóng)業(yè)大學(xué)園藝學(xué)院教授夏瑞團(tuán)隊(duì)在國(guó)家自然科學(xué)基金等項(xiàng)目的資助下,開(kāi)發(fā)了一種基于基因共線性進(jìn)行物種基因組基因結(jié)構(gòu)注釋矯正的工具——SynGAP(Synteny-based Gene structure Annotation Polisher)。相關(guān)成果近日在線發(fā)表于《基因組生物學(xué)》(Genome Biology)。

學(xué)者開(kāi)發(fā)出基因結(jié)構(gòu)注釋“拋光”工具-肽度TIMEDOO

SynGAP基因結(jié)構(gòu)注釋矯正的設(shè)計(jì)邏輯與流程。研究團(tuán)隊(duì) 供圖

演化過(guò)程中,在具有共同祖先的近緣物種之間,染色體上同源基因存在保守排列的現(xiàn)象,被稱為基因共線性。近緣物種的基因共線性區(qū)塊中,部分基因丟失了與其對(duì)應(yīng)的共線性基因,進(jìn)而在區(qū)塊內(nèi)形成共線性對(duì)的間隔。共線性基因的缺失,可能由基因組序列的變化引起的,同時(shí)還有可能是錯(cuò)誤注釋或缺失的基因模型導(dǎo)致的。

基于后一種可能性,夏瑞團(tuán)隊(duì)通過(guò)兩物種的共線性分析,檢測(cè)出共線性區(qū)塊中共線性對(duì)的空缺位置。隨后進(jìn)行雙向的同源比對(duì)以實(shí)現(xiàn)對(duì)間隔內(nèi)潛在注釋錯(cuò)漏的初步鑒定與矯正。再通過(guò)去冗余、可靠性指標(biāo)計(jì)算篩選、參考注釋質(zhì)量分級(jí)等步驟對(duì)初步矯正結(jié)果進(jìn)行質(zhì)控,最終獲得兩物種的高質(zhì)量矯正注釋?zhuān)⑶覍?shí)現(xiàn)對(duì)間隔的填補(bǔ)。

論文第一作者、華南農(nóng)業(yè)大學(xué)園藝學(xué)院博士研究生吳鋒琦表示,通過(guò)多個(gè)植物、動(dòng)物物種組合的測(cè)試與統(tǒng)計(jì),明確SynGAP可以對(duì)被測(cè)試基因組基因結(jié)構(gòu)注釋進(jìn)行優(yōu)化——增加優(yōu)質(zhì)新基因注釋以及共線性基因?qū)?,同時(shí)提高了BUSCO完整度。

除了基因結(jié)構(gòu)注釋矯正功能模塊外,SynGAP還包含了一套物種間比較轉(zhuǎn)錄組分析流程。通過(guò)該流程可實(shí)現(xiàn)近緣物種間的準(zhǔn)確基因配對(duì),并結(jié)合轉(zhuǎn)錄組數(shù)據(jù)完成跨物種時(shí)序性轉(zhuǎn)錄組分析,高效地篩選鑒定候選關(guān)鍵差異表達(dá)基因。其中,設(shè)計(jì)了EVI這一基因差異表達(dá)指標(biāo),可同時(shí)體現(xiàn)物種間對(duì)應(yīng)基因的表達(dá)水平差異、表達(dá)量倍數(shù)差異以及表達(dá)模式變化差異?;?qū)Φ腅VI值越高,兩個(gè)同源基因的差異表達(dá)就越顯著。經(jīng)測(cè)試,EVI可以作為鑒定控制特定性狀或發(fā)育過(guò)程(如花色素苷合成、辣椒素合成、內(nèi)果皮木質(zhì)化和大腦體積增大)的候選關(guān)鍵基因的有效指標(biāo)。

論文共同通訊作者夏瑞表示,SynGAP基于近緣物種基因共線性,去鑒定并矯正原始基因結(jié)構(gòu)注釋中的潛在錯(cuò)漏,實(shí)現(xiàn)了基因結(jié)構(gòu)注釋的優(yōu)化;并為更精準(zhǔn)的比較基因組和比較轉(zhuǎn)錄數(shù)據(jù)分析提供了新策略。

相關(guān)論文信息:https://doi.org/10.1186/s13059-024-03359-8

來(lái)源:中國(guó)科學(xué)報(bào)