近日,北京大學(xué)深圳研究生院信息工程學(xué)院AI4S平臺(tái)中心主任與化學(xué)生物學(xué)與生物技術(shù)學(xué)院合聘研究員陳語謙發(fā)表綜述文章,聚焦人工智能(AI)對傳統(tǒng)中醫(yī)藥(TCM)研究賦能這一主題,總結(jié)了過去二十幾年來世界最大的中醫(yī)藥數(shù)據(jù)庫(TCMBank)建立、維護(hù)和更新過程,并且深入探討了TCM與AI在多個(gè)研究領(lǐng)域的整合應(yīng)用,包括草藥篩選、新藥發(fā)現(xiàn)、診斷治療原則、藥理機(jī)制和網(wǎng)絡(luò)藥理學(xué)等。該綜述還詳細(xì)探討了AI通過數(shù)據(jù)挖掘、模式識(shí)別和預(yù)測分析,揭示TCM復(fù)雜配方活性成分和作用機(jī)制的過程。AI與TCM的結(jié)合不僅幫助人們從新的角度理解傳統(tǒng)的中醫(yī)藥知識(shí),還開辟了新的研究方法和治療策略。該成果發(fā)表在2024年9月的Chemical Science,第一作者為北京大學(xué)化學(xué)生物學(xué)與生物技術(shù)學(xué)院博士生宋治霖和中山大學(xué)智能工程學(xué)院博士生陳觀興,通訊作者為陳語謙,其他相關(guān)工作還包括發(fā)表于2023年的Chemical Science和2023年的Signal Transduction and Targeted Therapy(STTT,IF=40.8)。

TCM是天然產(chǎn)物的重要來源,從1981年到2019年,超過60%的FDA批準(zhǔn)的小分子藥物直接或間接來源于天然產(chǎn)物。此外,TCM還能根據(jù)患者的具體需求和偏好提供多種治療選擇。近年來,人工智能(AI)技術(shù)的發(fā)展為TCM研究帶來了巨大潛力。通過AI技術(shù)加速藥物發(fā)現(xiàn)、優(yōu)化配方和推動(dòng)TCM現(xiàn)代化,AI技術(shù)可以確保TCM在保留傳統(tǒng)根基的同時(shí),與最新的科學(xué)進(jìn)展同步發(fā)展。目前,在中醫(yī)院里臨床治療研究中,引入AI不僅提高了診斷的準(zhǔn)確性,還促進(jìn)了個(gè)性化醫(yī)療的發(fā)展,使TCM研究更加高效和精準(zhǔn)。

深圳研究生院陳語謙團(tuán)隊(duì)發(fā)表綜述文章,聚焦人工智能賦能中醫(yī)藥創(chuàng)新發(fā)展-肽度TIMEDOO

基于人工智能的中醫(yī)藥化學(xué)數(shù)據(jù)分析促進(jìn)了化學(xué)成分的識(shí)別、藥物發(fā)現(xiàn)、個(gè)性化治療和藥理作用的闡明,推動(dòng)了中醫(yī)藥的現(xiàn)代化和可持續(xù)發(fā)展

目前,中醫(yī)藥的網(wǎng)絡(luò)藥理學(xué)研究主要集中在證明中醫(yī)藥理論上,缺乏網(wǎng)絡(luò)設(shè)計(jì)和優(yōu)化原則的明確定義。合理的處方設(shè)計(jì)可分為自上而下和自下而上兩種類型。自上而下的方法基于舊處方設(shè)計(jì)新處方,而自下而上的方法則不考慮舊處方,完全基于疾病網(wǎng)絡(luò)設(shè)計(jì)新處方。陳語謙團(tuán)隊(duì)結(jié)合了多種可行的方法,首先定義了幾種未來最常見的自上而下優(yōu)化模型。自上而下和自下而上的設(shè)計(jì)方法都基于計(jì)算系統(tǒng)生物學(xué)原理利用生物網(wǎng)絡(luò)建立相關(guān)性,但考慮現(xiàn)有處方和中醫(yī)理論方面存在差異,在中醫(yī)理論尚未定量表達(dá)之前,不考慮舊處方的新公式設(shè)計(jì)更可能與中醫(yī)原則相沖突。近年來,中醫(yī)逐漸向天然產(chǎn)品的分類和組織發(fā)展。在人類過度開發(fā)的背景下,許多中醫(yī)藥品種面臨滅絕,因此陳語謙團(tuán)隊(duì)建立一種計(jì)算天然產(chǎn)品與中醫(yī)藥物種個(gè)體之間相關(guān)性的方法,并使用高可靠性模型快速篩選可替代、可優(yōu)化和可去除的處方成分。作者認(rèn)為,新處方公式的設(shè)計(jì)必將成為一個(gè)核心研究領(lǐng)域,為中藥的可持續(xù)發(fā)展帶來重要影響。

深圳研究生院陳語謙團(tuán)隊(duì)發(fā)表綜述文章,聚焦人工智能賦能中醫(yī)藥創(chuàng)新發(fā)展-肽度TIMEDOO

中醫(yī)處方網(wǎng)絡(luò)設(shè)計(jì)與優(yōu)化方法概述

在中醫(yī)領(lǐng)域,了解草藥與常規(guī)藥物之間的相互作用對于確?;颊甙踩椭委熜Ч陵P(guān)重要。作者針對中藥與西藥相互作用的綜合臨床研究給出了一種提案。該提案設(shè)定了一個(gè)綜合臨床研究系統(tǒng),旨在全面探索這些相互作用,如下圖所示,該系統(tǒng)分為三個(gè)主要模塊:臨床研究系統(tǒng)、綜合系統(tǒng)和基礎(chǔ)研究,每個(gè)模塊關(guān)注化學(xué)分析和數(shù)據(jù)整合的不同方面,以預(yù)測和分析藥物不相容性。臨床研究系統(tǒng)主要負(fù)責(zé)收集和分析臨床數(shù)據(jù),以評(píng)估草藥與藥物組合的藥代動(dòng)力學(xué)和藥效學(xué)特性。該模塊可以利用先進(jìn)的化學(xué)提取方法和分析技術(shù),旨在通過嚴(yán)格的臨床測試和化學(xué)分析識(shí)別潛在的不良相互作用。同時(shí),該模塊也可以利用數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)算法處理復(fù)雜的臨床數(shù)據(jù),識(shí)別預(yù)測藥物相互作用結(jié)果的模式。綜合方法的核心是綜合系統(tǒng),其中包含HAZA@home平臺(tái)。該系統(tǒng)可以結(jié)合臨床研究和基礎(chǔ)研究的數(shù)據(jù),為患者提供實(shí)時(shí)健康監(jiān)測和預(yù)測分析,也可以使用廣泛的數(shù)據(jù)庫網(wǎng)絡(luò)和模擬工具,個(gè)性化健康評(píng)估和藥物相互作用警示,利用人工智能根據(jù)個(gè)體患者數(shù)據(jù)調(diào)整建議?;A(chǔ)研究系統(tǒng)模塊通過深入的化學(xué)分析和計(jì)算建模來支持綜合系統(tǒng),預(yù)測藥物靶點(diǎn)并模擬藥物相互作用。這包括使用中醫(yī)和臨床藥物數(shù)據(jù)庫、ADMET預(yù)測模型及創(chuàng)建小分子數(shù)據(jù)庫。這些工具對理解藥物相互作用的生化機(jī)制至關(guān)重要,有助于開發(fā)預(yù)防潛在不良反應(yīng)的策略。該提案體現(xiàn)了在中醫(yī)藥相互作用研究中臨床與基礎(chǔ)科學(xué)方法的整合。通過結(jié)合化學(xué)分析、實(shí)時(shí)數(shù)據(jù)監(jiān)測和人工智能驅(qū)動(dòng)的預(yù)測建模,該系統(tǒng)不僅可以增強(qiáng)對復(fù)雜藥物相互作用的理解,還將開創(chuàng)中藥與藥物治療整合中患者安全的新方法,為未來的研究和應(yīng)用設(shè)定基準(zhǔn)。相關(guān)研究成果已發(fā)表在Chem. Sci. 2024, 15 (41), 16844—16886. (https://doi.org/10.1039/D4SC04107K

深圳研究生院陳語謙團(tuán)隊(duì)發(fā)表綜述文章,聚焦人工智能賦能中醫(yī)藥創(chuàng)新發(fā)展-肽度TIMEDOO

一個(gè)全面的自動(dòng)臨床研究系統(tǒng)提案

在中醫(yī)藥(TCM)的現(xiàn)代化過程中,確定草藥中的活性成分以及闡明活性成分與靶標(biāo)之間的作用機(jī)制是兩個(gè)關(guān)鍵方面。構(gòu)建一個(gè)全面且高度可靠的中醫(yī)藥數(shù)據(jù)庫顯得尤為重要。自2011年建立以來,陳語謙團(tuán)隊(duì)的TCM Database@Taiwan得到了廣泛使用和大量引用,并被納入ZINC數(shù)據(jù)庫。為了進(jìn)一步推進(jìn)中醫(yī)藥研究,作者利用自然語言處理技術(shù),建立了知識(shí)圖譜和分子信號(hào)通路,開發(fā)了TCMBank,該數(shù)據(jù)庫是TCM Database@Taiwan的升級(jí)版,包含9192種草藥、61,966種化學(xué)成分、15,179個(gè)靶標(biāo)和32,529種疾病,相關(guān)研究成果已發(fā)表在Chem. Sci. 2023, 14 (39), 10684—10701. (https://doi.org/10.1039/D3SC02139D)。

深圳研究生院陳語謙團(tuán)隊(duì)發(fā)表綜述文章,聚焦人工智能賦能中醫(yī)藥創(chuàng)新發(fā)展-肽度TIMEDOO

TCMBank的數(shù)據(jù)處理框架和目標(biāo)示意圖

在當(dāng)今醫(yī)療領(lǐng)域,中西藥的結(jié)合治療越來越普遍,但同時(shí)也帶來了藥物相互作用的風(fēng)險(xiǎn)。為了更好地預(yù)測和管理中西藥之間的相互作用,減少醫(yī)療風(fēng)險(xiǎn),本研究利用先進(jìn)的AI技術(shù)和大數(shù)據(jù)分析,開發(fā)了多個(gè)創(chuàng)新模型和數(shù)據(jù)庫,為中西藥相互作用的研究提供了強(qiáng)有力的支持。研究團(tuán)隊(duì)發(fā)現(xiàn),超過10%的患者需要同時(shí)服用5種藥物,20%的老年患者需要同時(shí)服用至少10種藥物。這一現(xiàn)象對藥物相互作用的研究提出了新的挑戰(zhàn)?;谒幬锘瘜W(xué)知識(shí),研究團(tuán)隊(duì)認(rèn)為藥物的官能團(tuán)/化學(xué)子結(jié)構(gòu)決定了其藥代動(dòng)力學(xué)、藥效學(xué)特性以及中西藥的互斥性。因此,他們提出了一個(gè)創(chuàng)新的算法,通過建立藥物相互作用網(wǎng)絡(luò)來預(yù)測多種藥物之間的相互作用。在這個(gè)網(wǎng)絡(luò)中,化合物作為節(jié)點(diǎn),它們的因果關(guān)系作為邊。中藥中所有成分對應(yīng)的節(jié)點(diǎn)形成了一個(gè)子網(wǎng)絡(luò)。通過分析子網(wǎng)絡(luò)之間的連接,研究團(tuán)隊(duì)可以預(yù)測中藥之間或中藥與西藥之間是否存在不良反應(yīng)。未來,AI輔助模型將結(jié)合大規(guī)模語言模型、自然語言處理和文本挖掘知識(shí)圖譜技術(shù),開發(fā)中西藥不良反應(yīng)數(shù)據(jù)庫,進(jìn)一步提高預(yù)測的準(zhǔn)確性和實(shí)用性。研究團(tuán)隊(duì)在兩個(gè)現(xiàn)實(shí)世界的公共藥物相互作用(DDI)數(shù)據(jù)集上提出了兩個(gè)模型:3DGT-DDI和SA-DDI。這兩個(gè)模型在兩個(gè)公共DDI數(shù)據(jù)集上實(shí)現(xiàn)了最精確的預(yù)測性能?;谶@些模型的預(yù)測結(jié)果,研究團(tuán)隊(duì)進(jìn)一步推廣到中西藥不良反應(yīng)的預(yù)測中。利用TCMBank的大數(shù)據(jù)驅(qū)動(dòng),研究團(tuán)隊(duì)進(jìn)行了無監(jiān)督學(xué)習(xí),預(yù)測中西藥的不良反應(yīng)。假設(shè)中藥中的所有成分與西藥均不發(fā)生不良反應(yīng),則確定它們之間不存在相互排斥的反應(yīng)。如果中藥中的一種或多種成分與西藥發(fā)生不良反應(yīng),則存在可能產(chǎn)生不良反應(yīng)的風(fēng)險(xiǎn)。研究團(tuán)隊(duì)利用AI輔助的DDI預(yù)測模型獲得了中西醫(yī)可能的不良反應(yīng)風(fēng)險(xiǎn)的預(yù)測結(jié)果,相關(guān)研究成果已發(fā)表在Signal Transduction and Targeted Therapy上(https://doi.org/10.1038/s41392-023-01339-1)。

深圳研究生院陳語謙團(tuán)隊(duì)發(fā)表綜述文章,聚焦人工智能賦能中醫(yī)藥創(chuàng)新發(fā)展-肽度TIMEDOO

世界最大的智能中醫(yī)藥數(shù)據(jù)庫TCMBank的綜合分析

上述三項(xiàng)工作論文通訊作者為陳語謙,研究得到了國家自然科學(xué)基金面上和重點(diǎn)項(xiàng)目支持。

參考文獻(xiàn)

[1] Song, Z.; Chen, G.; Chen, C. Y.-C. AI Empowering Traditional Chinese Medicine? Chem. Sci. 2024,15 (41), 16844—16886.https://doi.org/10.1039/D4SC04107K.

[2] Lv, Q.; Chen, G.; He, H.; Yang, Z.; Zhao, L.; Chen, H.-Y.; Chen, C. Y.-C. TCMBank: Bridges between the Largest Herbal Medicines, Chemical Ingredients, Target Proteins, and Associated Diseases with Intelligence Text Mining. Chem. Sci. 2023, 14 (39), 10684–10701. https://doi.org/10.1039/D3SC02139D.

[3] Lv, Q.; Chen, G.; He, H.; Yang, Z.; Zhao, L.; Zhang, K.; Chen, C. Y.-C. TCMBank-the Largest TCM Database Provides Deep Learning-Based Chinese-Western Medicine Exclusion Prediction. Signal Transduct. Target. Ther. 2023, 8 (1), 127. https://doi.org/10.1038/s41392-023-01339-1.

來源:北京大學(xué)