人機(jī)對(duì)決的主角已經(jīng)不再限于谷歌的 AlphaGo 。

5 月 20 日,《自然-醫(yī)學(xué)》報(bào)道了來(lái)自谷歌 AI 團(tuán)隊(duì)的一項(xiàng)人工智能研究,這是根據(jù)低劑量計(jì)算機(jī)斷層掃描圖像來(lái)預(yù)測(cè)肺癌的。其結(jié)論是,AI 表現(xiàn)超越了 6 位專業(yè)的放射醫(yī)學(xué)專家。

4D預(yù)測(cè)肺癌

肺癌預(yù)測(cè)的人機(jī)對(duì)決:谷歌 AI 挫敗 6 位放射專家-肽度TIMEDOO圖 | 肺癌細(xì)胞的掃描電子顯微鏡照片。(來(lái)源:ANNE WESTON / FRANCIS CRICK INSTITUTE / WELLCOME )

2018 年,全世界有 960 萬(wàn)人死于癌癥,其中肺癌死者就有 176 萬(wàn),高居癌癥死亡率第一位。在中國(guó),由于人口老齡化和空氣污染的嚴(yán)重態(tài)勢(shì),且吸煙率居高不下,肺癌也已成為死亡率最高的惡性腫瘤。據(jù)《中國(guó)肺癌低劑量螺旋 CT 篩查指南( 2018 年版)》,在 2015 年,中國(guó)肺癌的發(fā)病和死亡例數(shù)分別達(dá) 73萬(wàn) 和 61 萬(wàn),發(fā)病率和死亡率非常接近,其主要原因是臨床診斷病例多已為晚期,失去了手術(shù)機(jī)會(huì)。

早期診斷和早期治療是提高肺癌生存、降低肺癌死亡率的重要措施。在高危人群中,與 X 線胸片比較,低劑量計(jì)算機(jī)斷層掃描( LDCT )可降低 20% 的肺癌死亡率。2013 年,美國(guó)預(yù)防醫(yī)學(xué)工作組( USPSTF )推薦對(duì)高危人群進(jìn)行低劑量計(jì)算機(jī)斷層掃描篩查肺癌。

不過(guò)今天也只有 2% 到 4% 的符合條件的美國(guó)患者進(jìn)行了篩查。谷歌產(chǎn)品經(jīng)理 Lily Peng 博士指出,早期的微小腫瘤很難看到,超過(guò) 80% 的肺癌病例無(wú)法及早發(fā)現(xiàn)。

肺部影像的評(píng)估是基于圖像中肺部的結(jié)節(jié)大小、密度和生長(zhǎng)情況,但是假陰性和假陽(yáng)性會(huì)導(dǎo)致很多不必要的活檢與漏診,于是大量肺癌在發(fā)現(xiàn)時(shí)已是晚期,這帶來(lái)高昂的臨床成本和經(jīng)濟(jì)成本。

目前美國(guó)食品藥品監(jiān)督管理局(FDA)已經(jīng)批準(zhǔn)了一些軟件應(yīng)用,這些應(yīng)用主要是為醫(yī)學(xué)成像專家提供特定圖像的診斷支持,屬于計(jì)算機(jī)輔助檢測(cè)范疇。

為了超越先前計(jì)算機(jī)輔助檢測(cè)方法的局限性,來(lái)自谷歌 AI 部門(mén)的 Daniel Tse 及同事建立了一種端到端的分析方法,僅使用輸入 CT 圖像就可以來(lái)預(yù)測(cè)肺癌風(fēng)險(xiǎn)。此外,他們還使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來(lái)進(jìn)行訓(xùn)練,這種技術(shù)在圖像識(shí)別方面能夠給出更好的結(jié)果。

肺癌預(yù)測(cè)的人機(jī)對(duì)決:谷歌 AI 挫敗 6 位放射專家-肽度TIMEDOO圖 | 谷歌肺癌 AI 模型的整體建??蚣?。(來(lái)源:《自然-醫(yī)學(xué)》論文)

肺癌預(yù)測(cè)的人機(jī)對(duì)決:谷歌 AI 挫敗 6 位放射專家-肽度TIMEDOO圖 | 對(duì)于每個(gè)患者,新模型采用已有的低劑量計(jì)算機(jī)斷層掃描數(shù)據(jù)集,輸入患者 CT 圖像,經(jīng)過(guò)分析輸出該病例的癌癥風(fēng)險(xiǎn)預(yù)測(cè)和風(fēng)險(xiǎn)評(píng)分。(來(lái)源:谷歌)

肺癌預(yù)測(cè)的人機(jī)對(duì)決:谷歌 AI 挫敗 6 位放射專家-肽度TIMEDOO圖 | 對(duì)于無(wú)癌癥病史的無(wú)癥狀患者,發(fā)現(xiàn)了潛在的肺癌腫瘤。(來(lái)源:谷歌)

放射科醫(yī)生無(wú)法像計(jì)算機(jī)一樣檢查 3D 掃描,他們必須審查數(shù)百個(gè)單獨(dú)的 2D 掃描切片以發(fā)現(xiàn)問(wèn)題,而腫瘤可能會(huì)很微小以至難以察覺(jué),這種新的機(jī)器學(xué)習(xí)系統(tǒng)則可以分析高通量的 3D 肺部圖像,不僅可以對(duì)整體腫瘤進(jìn)行預(yù)測(cè),還可以通過(guò)肺結(jié)節(jié)識(shí)別細(xì)微的惡性組織。再加上先前的掃描數(shù)據(jù)對(duì)比,就可以用來(lái)評(píng)估肺結(jié)節(jié)的生長(zhǎng)速度。

論文共同作者、美國(guó)西北大學(xué)醫(yī)學(xué)院 Mozziyar Etemadi 博士說(shuō),3D 檢測(cè)早期肺癌的能力比人眼檢測(cè) 2D 圖像要敏感得多。事實(shí)上,新系統(tǒng)在技術(shù)上可以納入 4D 范疇,因?yàn)樗粌H僅是一次 CT 掃描,而是包括了當(dāng)前和先前共計(jì)兩次的掃描,所以可以檢測(cè)肺結(jié)節(jié)隨時(shí)間的生長(zhǎng)變化。

在這項(xiàng)研究中,谷歌的 AI 算法至關(guān)重要。當(dāng)然,這也受益于谷歌強(qiáng)大的計(jì)算機(jī)運(yùn)行能力。

Daniel Tse 團(tuán)隊(duì)用 42290 張 CT 掃描圖像進(jìn)行訓(xùn)練,以便在無(wú)人類參與的情況下預(yù)測(cè)肺結(jié)節(jié)的惡性程度。他們發(fā)現(xiàn),在 6716 個(gè)測(cè)試病例中,該人工智能系統(tǒng)能夠以 94% 的準(zhǔn)確率發(fā)現(xiàn)極小的惡性肺結(jié)節(jié)。在無(wú)先前 CT 掃描圖像的情況下,該系統(tǒng)的表現(xiàn)超越所有 6 位放射醫(yī)學(xué)專家,假陽(yáng)性減少 11% ,假陰性減少 5% ;而在有先前 CT 掃描圖像的情況下,兩者表現(xiàn)不相上下。這 6 位放射專家有平均 8 年( 4 年到 20 年)的讀片經(jīng)驗(yàn)。

2019 年 5 月 7 日,Lily Peng 在 2019 年開(kāi)發(fā)者大會(huì)上稱,他們研發(fā)的人工智能技術(shù)可以比醫(yī)生早一年查出肺癌,使患者存活的概率提升 40% 。

開(kāi)發(fā)人工智能系統(tǒng)的谷歌工程師強(qiáng)調(diào),它不是為了取代放射科醫(yī)生,而是為了提高醫(yī)生檢測(cè)結(jié)節(jié)的能力并確定它們是否有危險(xiǎn)。作者提醒說(shuō),這些發(fā)現(xiàn)還需要經(jīng)過(guò)大規(guī)模的臨床驗(yàn)證,但現(xiàn)有研究,仍說(shuō)明這一模型有望推動(dòng)改善肺癌患者的管理和預(yù)后。

鑒于專業(yè)的胸透放射醫(yī)生缺乏,谷歌這個(gè)新系統(tǒng)對(duì)于社區(qū)醫(yī)院的普通放射科醫(yī)生將會(huì)是一個(gè)便捷工具,這可能會(huì)成為肺癌篩查推廣的利器。

不僅僅是輔助檢測(cè)

那么,這個(gè)系統(tǒng)能否達(dá)到 100% 的肺癌預(yù)測(cè)率呢?他們下一步有什么規(guī)劃呢?對(duì)此,這項(xiàng)研究的負(fù)責(zé)人 Daniel Tse 接受了 DeepTech 的專訪。

DeepTech:這項(xiàng)研究方法的特點(diǎn)是哪些呢?

Daniel Tse:今天的肺癌篩查存在若干挑戰(zhàn),包括高頻率的假陽(yáng)性和假陰性、評(píng)估者差異可變性(inter-grader variability)以及實(shí)施廣泛成像篩查計(jì)劃的現(xiàn)實(shí)障礙。這些弊端就給 AI 留下了施展拳腳的空間。深度學(xué)習(xí)方法可以進(jìn)行復(fù)雜的自動(dòng)化圖像分析,檢測(cè)細(xì)微的圖像變化以及統(tǒng)一圖像評(píng)估方法。

我們的模型結(jié)合了檢測(cè)和診斷雙重功能,并且經(jīng)過(guò)深度學(xué)習(xí)算法,擁有計(jì)算機(jī)輔助檢測(cè)所不能進(jìn)行的解釋功能。這套系統(tǒng)可以使用患者當(dāng)前和先前的 3D CT圖像來(lái)預(yù)測(cè)肺癌發(fā)展。

DeepTech:AI 的肺癌評(píng)估準(zhǔn)確率有極限嗎?現(xiàn)在是 94% 的準(zhǔn)確率,那么是不是意味著還有接近 6% 的提升空間?

Daniel Tse:目前的研究主要目的是為了創(chuàng)建深度學(xué)習(xí)的模型,且可以解決目前肺癌篩查中的高假陽(yáng)性和高假陰性問(wèn)題。而現(xiàn)實(shí)應(yīng)用中,總會(huì)有一些限制因素,這就使得 AI 不能得到 100% 的精確度。

事實(shí)上,AI 并不以精確度為唯一追求,而是兼顧特異性(假陽(yáng)性)和敏感性(假陰性)?;趯?duì)實(shí)際結(jié)果的意義,后兩者的重要性可能不同。比如,減少假陰性意味著將檢測(cè)到更多的癌癥,也就減少漏診。

下一步,我們的系統(tǒng)要給醫(yī)生提供這些預(yù)測(cè)結(jié)論的表述方式,以及給患者提供積極的建議。

DeepTech:下一步會(huì)如何推進(jìn)大規(guī)模臨床驗(yàn)證?在將來(lái)如何推進(jìn)這方面研究的產(chǎn)品化?

Daniel Tse:目前這些結(jié)果令人鼓舞,但還是早期階段。我們需要進(jìn)一步改進(jìn)和驗(yàn)證這套系統(tǒng),并探索放射科醫(yī)生更實(shí)用的使用方法。此外,還要與世界各地的監(jiān)管機(jī)構(gòu)合作,確保產(chǎn)品應(yīng)用前有充分的研究。

DeepTech:谷歌 AI 部門(mén)之前在視網(wǎng)膜病變和乳腺癌方面都有很重要的工作,這些產(chǎn)品有哪些進(jìn)展?目前你們?cè)谶@方面的工作與美國(guó) FDA 有溝通嗎?

Daniel Tse:我們的大部分工作仍處于研究階段,但我們與谷歌旗下子公司 Verily-Alphabet 合作的糖尿病視網(wǎng)膜病變計(jì)劃現(xiàn)已部署在印度的診所。這也得到了歐洲的健康、安全和環(huán)保的CE認(rèn)證。我們正在與 FDA 進(jìn)行研發(fā)產(chǎn)品的溝通。

在印度,7200 萬(wàn)糖尿病患者中只有 600 萬(wàn)人有機(jī)會(huì)接受糖尿病視網(wǎng)膜病變篩查,他們的眼科醫(yī)生缺口超過(guò) 10 萬(wàn)名。在過(guò)去 3 年中,我們開(kāi)發(fā)了一種機(jī)器學(xué)習(xí)算法,更容易篩查糖尿病性視網(wǎng)膜病變(DR)和糖尿病性黃斑水腫(DME)。

2018 年年末,我們?cè)谔﹪?guó)也開(kāi)展了這項(xiàng)工作。今年我們會(huì)在全球開(kāi)展更多工作。

業(yè)內(nèi)點(diǎn)評(píng)

關(guān)于這篇文章,DeepTech 也專訪了醫(yī)學(xué)成像國(guó)際權(quán)威、美國(guó)倫斯勒理工學(xué)院講席教授王革。

“低劑量 CT 檢查對(duì)于肺癌普查極為重要”, 王革說(shuō),“在這個(gè)領(lǐng)域人工智能 AI 方法大有作為。若干團(tuán)隊(duì)都先后獨(dú)立報(bào)告了令人鼓舞的結(jié)果,而這篇文章是一個(gè)杰出的代表?!?/p>

王革贊同 Daniel Tse 的觀點(diǎn),這些結(jié)果還在早期階段。如何改進(jìn)、優(yōu)化和驗(yàn)證,以及如何融入放射科醫(yī)生的工作流程、如何實(shí)現(xiàn)可解釋性等方面均有大量的工作要做。他最后強(qiáng)調(diào),“人工智能 AI 是新的范式,道路曲折,前景光明。必將顯著提高醫(yī)療質(zhì)量,造福民眾。”

《麻省理工科技評(píng)論》發(fā)表評(píng)論認(rèn)為,這些研究雖然是令人興奮的,但應(yīng)該被視為小的進(jìn)步。因?yàn)槌鲇陔[私原因,在醫(yī)療保健中使用 AI 仍然具有挑戰(zhàn)性。此外,現(xiàn)實(shí)世界的數(shù)據(jù)集很少像研究中使用的那樣完美。

值得注意的是,治療癌癥不僅僅涉及檢測(cè)。例如,患者與患者之間多種因素的差異使得診治難以完全實(shí)現(xiàn)自動(dòng)化。

不過(guò),紐約時(shí)報(bào)提出了疑問(wèn):如果這套 AI 系統(tǒng)得到 FDA 的批準(zhǔn),那么隨著系統(tǒng)經(jīng)驗(yàn)和更多數(shù)據(jù)的更新,開(kāi)發(fā)商是否需要再次提交申請(qǐng)?如果是這樣,多久提交一次呢?

來(lái)源:麻省理工中文評(píng)論