我國(guó)學(xué)者開(kāi)發(fā)出病毒分類新工具
3月5日,中國(guó)海洋大學(xué)海洋生命學(xué)院教授汪岷團(tuán)隊(duì)基于序列比對(duì)和圖論方法,開(kāi)發(fā)了病毒分類新工具VITAP(Viral Taxonomic Assignment Pipeline)。該成果在《自然·通訊》)在線發(fā)表,為病毒組學(xué)和病毒生態(tài)學(xué)研究提供了重要工具。

VITAP的技術(shù)原理和方法流程??中國(guó)海洋大學(xué)供圖
病毒,是地球上最小且豐度最高的非細(xì)胞生物,不僅對(duì)人類健康產(chǎn)生了深遠(yuǎn)的影響,也是全球生物地球化學(xué)循環(huán)的幕后推手。隨著宏基因組技術(shù)的迅速發(fā)展,發(fā)現(xiàn)了海量新型的DNA和RNA病毒。然而,目前大多數(shù)病毒分類方法仍主要依賴于接近完整的病毒基因組數(shù)據(jù),對(duì)片段化和不完整的病毒序列分類效果較差。此外,目前的技術(shù)手段大多對(duì)雙鏈DNA病毒的分類效果較好,而對(duì)RNA病毒和單鏈DNA病毒的高通量準(zhǔn)確分類仍存在困難。
這些問(wèn)題限制了我們對(duì)環(huán)境中復(fù)雜病毒群體的深入解析。因此,如何準(zhǔn)確細(xì)致地對(duì)環(huán)境病毒進(jìn)行分類,已成為當(dāng)今生物學(xué)、醫(yī)學(xué)與生態(tài)學(xué)研究亟待突破的重要挑戰(zhàn)。
該方法通過(guò)結(jié)合序列比對(duì)與圖論算法,不僅能對(duì)DNA及RNA病毒進(jìn)行精準(zhǔn)分類,還為每個(gè)分類單元提供了置信度評(píng)估,可對(duì)長(zhǎng)度短至1000個(gè)堿基對(duì)的病毒基因組序列進(jìn)行從門到屬水平的高效分類,并大幅提升了病毒注釋率。此外,新工具能夠基于國(guó)際病毒分類委員會(huì)制定的最新分類數(shù)據(jù)庫(kù)進(jìn)行自動(dòng)更新,并支持用戶自定義分類數(shù)據(jù)庫(kù),具有良好的用戶體驗(yàn)。
在后續(xù)的分析測(cè)試中,研究團(tuán)隊(duì)將新工具方法成功應(yīng)用于宏病毒組和病毒基因組的注釋,結(jié)果顯示新工具在科級(jí)和屬級(jí)的分類分析中不僅能保持超過(guò)0.9的準(zhǔn)確率、精度和召回率,還顯示出了優(yōu)于其他方法的注釋率。具體而言,對(duì)于1kb的短序列,新工具在所有病毒門中的注釋率均優(yōu)于其他方法;而在近完整基因組的分類中,新工具對(duì)RNA病毒和大部分DNA病毒也表現(xiàn)出更高的注釋率。
總體上,新工具在保證高準(zhǔn)確率的前提下,實(shí)現(xiàn)了更全面、穩(wěn)定的病毒分類,并為病毒基因組學(xué)、分類學(xué)和生態(tài)學(xué)研究提供了一個(gè)高效的自動(dòng)化新工具。
研究得到了中國(guó)海洋大學(xué)海洋高等研究院海洋大數(shù)據(jù)中心、大生命學(xué)科超算集群、海洋生物多樣性與進(jìn)化研究所高性能計(jì)算集群、嶗山實(shí)驗(yàn)室科技創(chuàng)新項(xiàng)目、海洋負(fù)排放國(guó)際大科學(xué)計(jì)劃(ONCE)、國(guó)家自然科學(xué)基金、中央高?;究蒲袑m?xiàng)資金的聯(lián)合支持。
論文相關(guān)信息:
https://doi.org/10.1038/s41467-025-57500-7
來(lái)源:中國(guó)科學(xué)報(bào)


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。