近日,由中國科學院北京基因組研究所(國家生物信息中心)國家基因組科學數(shù)據(jù)中心(NGDC)開發(fā)的表觀基因組關聯(lián)研究資源開放平臺EWAS Open Platform上線。相關研究成果以EWAS Open Platform: integrated data, knowledge and toolkit for epigenome-wide association study為題在Nucleic Acids Research上在線發(fā)表。

隨著表觀基因組關聯(lián)研究(EWAS)的爆炸式增長,出現(xiàn)了大量EWAS學術論文,積累了海量EWAS相關數(shù)據(jù)。對這些數(shù)據(jù)進行標準化整合,并從已發(fā)表論文中提取和挖掘表觀關聯(lián)知識,對于系統(tǒng)的表征和研究不同實驗條件下的甲基化狀態(tài)、探索與各種性狀相關的表觀遺傳分子機制具有重要意義。NGDC在2019年和2020年先后開發(fā)了基于高質量的人工審編EWAS知識庫(EWAS Atlas)和存儲了海量標準化DNA甲基化芯片數(shù)據(jù)的EWAS數(shù)據(jù)庫(EWAS Data Hub)。

為了提供從數(shù)據(jù)瀏覽與下載、在線分析與可視化到知識解釋與驗證的全面系統(tǒng)的資源和服務,NGDC研究團隊在不斷整合和更新中心已有EWAS資源基礎上,構建了表觀組關聯(lián)研究資源開放平臺(EWAS Open Platform)。EWAS Open Platform包括標準化的數(shù)據(jù)信息庫 (EWAS Data Hub)、人工信息提取的知識庫(EWAS Atlas)和表觀-特征關聯(lián)在線工具(EWAS Toolkit) 三部分。EWAS Data Hub整合了115852個樣本的DNA甲基化芯片數(shù)據(jù)和對應的元數(shù)據(jù),并統(tǒng)一采用GMQN方法進行標準化。同時,EWAS Data Hub利用海量高質量DNA甲基化芯片數(shù)據(jù)和標準化元數(shù)據(jù)的優(yōu)勢,為485512個探針和36397個基因提供了一系列重要的評估值(包括組織特異性、年齡相關性、性別差異和種族特異性)和不同背景下的參考DNA甲基化圖譜;EWAS Atlas共整合了910篇文獻中報道的617018個高質量的甲基化與表型關聯(lián),涉及618種表型和3385個隊列;EWAS Toolkit利用EWAS Atlas和EWAS Data Hub提供的高質量的甲基化與表型關聯(lián)知識和標準化的DNA甲基化芯片數(shù)據(jù),為用戶提供多種在線分析和可視化工具,包括富集分析、注釋、知識圖譜可視化等。

該研究得到了中科院戰(zhàn)略性先導科技專項、國家重點研發(fā)計劃、中科院關鍵技術人才等項目資助。

論文鏈接

北京基因組所發(fā)布表觀基因組關聯(lián)研究開放平臺EWAS Open Platform-肽度TIMEDOO

EWAS Open Platform數(shù)據(jù)處理流程示意圖

來源: 北京基因組研究所