基因組測(cè)序表明,除了少數(shù)常見(jiàn)的突變基因外,影響癌癥基因組的大多數(shù)突變都很罕見(jiàn)。為了解釋這些罕見(jiàn)突變,一種有力的方法是依據(jù)突變所影響的蛋白質(zhì)系統(tǒng)將他們進(jìn)行劃分。以這種方式來(lái)理解癌癥基因組需要克服兩個(gè)關(guān)鍵的挑戰(zhàn):(i) 我們?nèi)绾稳胬L制癌細(xì)胞中的蛋白質(zhì)系統(tǒng)?(ii) 我們?nèi)绾未_定哪些系統(tǒng)處于突變選擇之下?近日,由加州大學(xué)舊金山分校(UCSF)和圣地亞哥分校(UCSD)主導(dǎo)的研究團(tuán)隊(duì)在Science雜志上背靠背發(fā)表了三篇文章,以親和純化質(zhì)譜(AP-MS)測(cè)定了癌細(xì)胞中以關(guān)鍵癌癥蛋白為中心的蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò),并通過(guò)和現(xiàn)有的蛋白質(zhì)互作網(wǎng)絡(luò)和癌癥基因組數(shù)據(jù)整合,構(gòu)建了一個(gè)多尺度的圖譜,對(duì)癌癥中具有顯著突變的蛋白質(zhì)系統(tǒng)進(jìn)行了研究。其中兩篇文章分別側(cè)重于對(duì)乳腺癌和頭頸癌細(xì)胞系中發(fā)現(xiàn)的的描述和下游生物功能分析。最后一篇文章(Zheng et al.)系統(tǒng)描述了構(gòu)建癌癥突變的圖譜的信息學(xué)方法,題為:Interpretation of cancer mutations using a multiscale map of protein systems。研究者進(jìn)一步通過(guò)多種實(shí)驗(yàn)手段研究圖譜中全新的蛋白質(zhì)系統(tǒng),并發(fā)現(xiàn)了之前未知的突變促致癌癥的機(jī)理。
系統(tǒng)生物學(xué):通過(guò)多尺度蛋白質(zhì)系統(tǒng)圖譜理解癌癥中的突變-肽度TIMEDOO系統(tǒng)生物學(xué):通過(guò)多尺度蛋白質(zhì)系統(tǒng)圖譜理解癌癥中的突變-肽度TIMEDOO
在本文中,研究者首先整合了兩篇配套文章中的PPI和先前研究中的PPI數(shù)據(jù)以及四種其他類型的證據(jù)——包括mRNA和蛋白質(zhì)的共表達(dá),序列相似性以及遺傳共依賴性?;诒O(jiān)督機(jī)器學(xué)習(xí),對(duì)所有證據(jù)進(jìn)行定量加權(quán)和組合,以創(chuàng)建每對(duì)人類蛋白質(zhì)的綜合關(guān)聯(lián)嚴(yán)格性?(Integrated Association Stringency,?IAS)?。由于IAS分?jǐn)?shù)代表了蛋白質(zhì)關(guān)聯(lián)的連續(xù)度量,在不同的IAS閾值下可從PPI網(wǎng)絡(luò)中識(shí)別出不同強(qiáng)度和大小的蛋白質(zhì)系統(tǒng)。通過(guò)分層社區(qū)檢測(cè)(hierarchical community detection)算法,強(qiáng)關(guān)聯(lián)且較小的蛋白質(zhì)復(fù)合體被包含在較大的組件中,從而形成了層次結(jié)構(gòu)。當(dāng)應(yīng)用于整個(gè) IAS 網(wǎng)絡(luò)時(shí),分層社區(qū)檢測(cè)總共識(shí)別出 2338 個(gè)蛋白質(zhì)系統(tǒng)。值得注意的是,當(dāng)數(shù)據(jù)支持時(shí),該方法允許蛋白質(zhì)出現(xiàn)在不同的系統(tǒng)中。例如,β-catenin被置于不同的系統(tǒng),分別代表了其在adherens junction和β-catenin destruction complex中的功能。為確定哪些系統(tǒng)在癌癥中面臨突變的壓力,研究者開(kāi)發(fā)了一個(gè)統(tǒng)計(jì)模型HiSig,以確定一組系統(tǒng),可以最佳地解釋所有基因中觀察到的突變模式,同時(shí)尋求盡量減少此類解釋所需的系統(tǒng)數(shù)量。利用TCGA的癌癥體細(xì)胞突變數(shù)據(jù),在13種常見(jiàn)癌癥中,HiSig分析共確定了319個(gè)在一種或多種癌癥中存在突變選擇的系統(tǒng),從而產(chǎn)生了稱為NeST(Nested Systems in Tumors)的最終圖譜。研究者對(duì)NeST的系統(tǒng)做了全面的注釋,并使用獨(dú)立的癌癥數(shù)據(jù)集進(jìn)行了重復(fù)性驗(yàn)證。

接下來(lái),研究者選擇了兩個(gè)新發(fā)現(xiàn)的NeST系統(tǒng)進(jìn)行實(shí)驗(yàn)驗(yàn)證。AP-MS數(shù)據(jù)中的PPI建立了PIK3CA和一組肌動(dòng)球蛋白(myosin; 包括MYH9和MYH10)之間的新的特異性物理關(guān)聯(lián)。通過(guò)鄰近連接測(cè)定(Proximity Ligation Assay)和超分辨率顯微鏡,研究者證明了PIK3CA和MYH9在頭頸癌細(xì)胞系CAL-33中共定位。通過(guò)測(cè)量PI3K信號(hào)通路的下游標(biāo)志物AKT和S6的磷酸化水平,實(shí)驗(yàn)結(jié)果表明抑制myosin功能可激活PIK3CA介導(dǎo)的的信號(hào)傳導(dǎo)。

系統(tǒng)生物學(xué):通過(guò)多尺度蛋白質(zhì)系統(tǒng)圖譜理解癌癥中的突變-肽度TIMEDOO
在另一個(gè)由纖維狀膠原蛋白(fibrillar collagen)組成的系統(tǒng)中,HiSig分析在多種癌癥中發(fā)現(xiàn)了這一系統(tǒng)具有顯著升高的突變頻率——這些突變?cè)谶^(guò)去對(duì)顯著突變的單基因分析中往往被忽略。膠原蛋白含有富含甘氨酸和脯氨酸殘基的螺旋重復(fù)區(qū)域,這些結(jié)構(gòu)域?qū)τ谀z原蛋白正確折疊成三聚體束至關(guān)重要。研究者假設(shè)膠原蛋白的突變可能通過(guò)破壞蛋白質(zhì)折疊從而破壞細(xì)胞外基質(zhì)的結(jié)構(gòu)來(lái)促進(jìn)腫瘤進(jìn)展。使用成纖維細(xì)胞(fibroblast)表達(dá)正?;蛲蛔凅w的膠原蛋白基質(zhì),研究者發(fā)現(xiàn)在突變體基質(zhì)中培養(yǎng)的肺癌細(xì)胞的增殖大大增加,這些數(shù)據(jù)支持膠原蛋白突變?cè)谄茐哪[瘤微環(huán)境以促進(jìn)癌癥進(jìn)展方面的作用。
系統(tǒng)生物學(xué):通過(guò)多尺度蛋白質(zhì)系統(tǒng)圖譜理解癌癥中的突變-肽度TIMEDOO
最后,研究者分析了NeST系統(tǒng)的突變和癌癥預(yù)后的關(guān)聯(lián),并使用NeST系統(tǒng)提名了一個(gè)548個(gè)基因的癌癥基因目錄。目錄中預(yù)測(cè)的新的癌基因和已知的癌癥基因具有相似的性質(zhì),而和其他的基因顯著不同。研究者們展望,相對(duì)于單基因水平的突變,系統(tǒng)水平的突變有望成為更有效的預(yù)后分析和藥物治療響應(yīng)的生物標(biāo)志物。同時(shí),文章中的信息學(xué)方法不僅適用于癌癥,未來(lái)可用于分析和研究其他多基因突變導(dǎo)致的疾病。UCSD的Trey Ideker教授和UCSF的Nevan Krogan教授共同領(lǐng)導(dǎo)了此項(xiàng)研究。

鄭凡博士(時(shí)為UCSD博士后)為此文的第一作者。UCSD的J. Silvio Gutkind教授,Stephanie Fraley教授,和俄勒岡健康與科學(xué)大學(xué)(Oregon Health and Science University)的南小林教授也為本研究提供了關(guān)鍵數(shù)據(jù)。

原文鏈接:
https://doi.org/10.1126/science.abf3067

來(lái)源:結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心