【新智元導(dǎo)讀】被人類醫(yī)生遺漏的癌癥早期跡象,被AI及時(shí)發(fā)現(xiàn)了!這名英國(guó)女子現(xiàn)已康復(fù)。同時(shí),AI算法在美國(guó)一家診所近1/4的眼科檢查中,發(fā)現(xiàn)了患者的視網(wǎng)膜病變。AI幫助人類診病的未來(lái),真的不遠(yuǎn)了。
最近,越來(lái)越多的研究讓我們意識(shí)到:AI幫人類診斷疾病,真的有希望了!
最近,AI在11名女性的乳腺X光檢查中,成功地發(fā)現(xiàn)了被人類醫(yī)生遺漏的乳腺癌早期跡象。
其中一名被AI救下的女性,已經(jīng)做完手術(shù)開(kāi)始康復(fù)了。
AI工具M(jìn)ia在乳腺X光檢查掃描中,圈出了兩個(gè)關(guān)鍵區(qū)域
而谷歌的研究團(tuán)隊(duì),最近剛剛開(kāi)發(fā)了一款A(yù)I工具,可以通過(guò)分析人的咳嗽和呼吸,診斷出疾病。
另外,在南加州一家診所,一種檢測(cè)眼睛狀況的AI算法,幫助專家在過(guò)去一年進(jìn)行的約700次眼科檢查的1/4中發(fā)現(xiàn)了視網(wǎng)膜病變。
如果經(jīng)過(guò)足夠的數(shù)據(jù)訓(xùn)練,AI就會(huì)非常擅長(zhǎng)發(fā)現(xiàn)特定疾病的癥狀,這正是它的專長(zhǎng)所在。
深度學(xué)習(xí)之父Hinton的兩任妻子,都死于癌癥。他親身體會(huì)過(guò),病人在等待結(jié)果和得到模糊的信息時(shí),是何等的沮喪。
我看到了醫(yī)療專業(yè)人員在使用數(shù)據(jù)時(shí)的許多低效之處。病人病歷中的信息,很多都沒(méi)有被用上。醫(yī)生對(duì)于CT的結(jié)果的理解也千差萬(wàn)別。如果讓兩個(gè)放射科醫(yī)生看同一個(gè)掃描結(jié)果,得到的結(jié)果很可能完全不一樣。
而如今,隨著AI在診病和預(yù)測(cè)上的發(fā)展越來(lái)越快,或許類似的悲劇,也會(huì)越來(lái)越少。
人類醫(yī)生忽略的早癌跡象,被AI發(fā)現(xiàn)了
最近BBC報(bào)道了這樣一件事:AI竟然發(fā)現(xiàn)了被人類醫(yī)生忽視的早期乳腺癌。
大家都知道,乳腺癌在早期很難發(fā)現(xiàn),但是最近,一個(gè)名叫Mia的AI工具,就成功地在11名女性的乳腺X光檢查中,發(fā)現(xiàn)了被人類醫(yī)生遺漏的微小跡象!
這次試點(diǎn)實(shí)驗(yàn),由NHS機(jī)構(gòu)的臨床醫(yī)生和Mia一起完成。
在分析了10000多名女性的乳腺X光檢查后,Mia成功地標(biāo)記出了所有有癌癥癥狀的人,并且發(fā)現(xiàn)了人類醫(yī)生沒(méi)有發(fā)現(xiàn)的11名乳腺癌早期患者。
Barbara就是被AI標(biāo)記的11名患者之一,但醫(yī)院的放射科醫(yī)生,并沒(méi)有在她的掃描中發(fā)現(xiàn)癌癥早期的痕跡。
幸運(yùn)的是,Barbara的腫瘤被AI發(fā)現(xiàn)了。
因?yàn)槟[瘤只有6毫米,被發(fā)現(xiàn)得很早,Barbara做完手術(shù)后只需要五天的放療。而且,腫瘤小于15毫米的乳腺癌患者,在五年內(nèi)有90%的存活率。
而如果不是AI,Barbara的癌癥很可能要到三年后的下一次常規(guī)乳腺X光檢查才能被發(fā)現(xiàn),因?yàn)樗饲皬奈幢憩F(xiàn)出任何明顯的癥狀。
Barbara非常高興,比起同樣患乳腺癌、要接受侵入性治療的母親和姐姐,自己治療的痛苦要小得多。
而且,Mia的開(kāi)發(fā)者Kheiron表示:因?yàn)锳I診斷的效率極高,Mia幾乎能讓等待結(jié)果的時(shí)間從14天減少到3天。
當(dāng)然,目前試驗(yàn)中沒(méi)有一個(gè)病例是Mia單獨(dú)分析的,每個(gè)病例還是要經(jīng)過(guò)人工審查。
訓(xùn)練出這樣一個(gè)能診斷癌癥的AI醫(yī)生,需要花多長(zhǎng)時(shí)間?
答案是六年。
Sarah Kerruish,Kheiron Medical首席戰(zhàn)略官
Kheiron Medical的首席戰(zhàn)略官Sarah Kerruish表示,他們用了6年來(lái)訓(xùn)練Mia,它在微軟的云計(jì)算能力上運(yùn)行,并接受了來(lái)自世界各地女性的數(shù)百萬(wàn)張乳房X光檢查的訓(xùn)練。
乳腺癌醫(yī)生平均每年進(jìn)行大約5,000次乳房掃描,一次可以查看100張。但是,他們是人類,所以會(huì)疲倦,會(huì)分心,會(huì)受到干擾。
而在AI身上,就不用擔(dān)心這些因素了。
Gerald Lip博士在NHS Grampian對(duì)AI工具進(jìn)行評(píng)估
當(dāng)然,Mia目前還并不完美,比如它無(wú)法訪問(wèn)任何患者的病史,可能會(huì)把已經(jīng)確定為無(wú)害的腫瘤誤標(biāo)記為癌癥。
目前,每張掃描圖會(huì)由兩名放射科醫(yī)生檢查,但在不久的未來(lái),AI很可能就會(huì)取代一名人類醫(yī)生,讓工作量減半。
AI通過(guò)分析咳嗽聲診斷疾病
同樣,就在本周,來(lái)自谷歌的研究團(tuán)隊(duì)開(kāi)發(fā)了一種機(jī)器學(xué)習(xí)工具,可以通過(guò)分析人的咳嗽聲和呼吸聲等,幫助醫(yī)生檢測(cè)和監(jiān)控健康狀況。
這個(gè)名為健康聲學(xué)表征(HeAR)的AI系統(tǒng),得到了數(shù)百萬(wàn)音頻片段中人聲的訓(xùn)練,并未來(lái)可能被用于診斷COVID-19、結(jié)核病等疾病,以及評(píng)估一個(gè)人的肺部健康狀況。
其創(chuàng)新之處在于,HeAR所訓(xùn)練的龐大數(shù)據(jù)集,以及它能夠根據(jù)不同的需求進(jìn)行調(diào)整,以完成多種任務(wù)。
論文地址:https://arxiv.org/abs/2403.02522
在這個(gè)領(lǐng)域,大部分AI工具都是利用經(jīng)過(guò)打標(biāo)的音頻記錄來(lái)構(gòu)建的。
其中,咳嗽的錄音會(huì)和患者的健康信息一起被喂給模型。比如,患者在錄制音頻時(shí),得了支氣管炎。
之后,模型就能通過(guò)「監(jiān)督學(xué)習(xí)」的方式,學(xué)會(huì)如何將聲音的特點(diǎn)和對(duì)應(yīng)的數(shù)據(jù)標(biāo)注聯(lián)系起來(lái)。
「在醫(yī)學(xué)上,監(jiān)督學(xué)習(xí)方法有著臨床驗(yàn)證的支持,」南佛羅里達(dá)大學(xué)的醫(yī)生Yael Bensoussan解釋說(shuō)。「但缺點(diǎn)在于,標(biāo)注好的數(shù)據(jù)集非常稀缺?!?/p>
為了解決這一問(wèn)題,谷歌決定自監(jiān)督學(xué)習(xí)的方式,擺脫對(duì)標(biāo)注數(shù)據(jù)的依賴。
具體來(lái)說(shuō),團(tuán)隊(duì)從YouTube上公開(kāi)的視頻中,自動(dòng)提取了超過(guò)3億條包含咳嗽、呼吸、清嗓等人類聲音的音頻。
然后,將每條音頻都轉(zhuǎn)換成名為頻譜圖的聲音視覺(jué)表征形式。
接著,研究人員會(huì)隱去頻譜圖的某些部分,讓模型學(xué)習(xí)預(yù)測(cè)這些缺失部分,過(guò)程類似于訓(xùn)練大語(yǔ)言模型預(yù)測(cè)文本中的下一個(gè)token。
通過(guò)微調(diào),谷歌團(tuán)隊(duì)成功讓模型能夠檢測(cè)COVID-19、結(jié)核病以及諸如是否吸煙等特征。
結(jié)果顯示,HeAR在不同數(shù)據(jù)集上進(jìn)行COVID-19檢測(cè)的得分分別為0.645和0.710,這比基于語(yǔ)音或普通音頻數(shù)據(jù)訓(xùn)練的現(xiàn)有模型表現(xiàn)更佳。
對(duì)于結(jié)核病的檢測(cè),HeAR的得分更是高達(dá)0.739。
(0.5分代表模型的表現(xiàn)與隨機(jī)猜測(cè)無(wú)異,而1分則代表模型每次都能準(zhǔn)確預(yù)測(cè))
AI顛覆糖尿病眼科檢查
無(wú)獨(dú)有偶,Christian Espinoza,南加州一家藥物治療中心的負(fù)責(zé)人,最近引入了一位強(qiáng)大的新助理:一款能夠通過(guò)視網(wǎng)膜相機(jī)拍照來(lái)檢測(cè)眼睛狀況的人工智能算法。
這項(xiàng)技術(shù)能迅速完成診斷,而且在這個(gè)過(guò)程中不必要求醫(yī)生親自在場(chǎng)。
該系統(tǒng)有望顯著提高對(duì)糖尿病視網(wǎng)膜病變的篩查能力——這是導(dǎo)致工作年齡成人失明的首要原因,并對(duì)估計(jì)中的3800萬(wàn)美國(guó)糖尿病患者構(gòu)成了巨大威脅。
這里提到的糖尿病視網(wǎng)膜病變,是因高血糖損害視網(wǎng)膜血管而引起的。
雖然通過(guò)管理患者的糖尿病通??梢灶A(yù)防這種疾病——并且對(duì)更嚴(yán)重階段的病變有治療方法——但醫(yī)生們認(rèn)為,定期進(jìn)行篩查對(duì)于早期發(fā)現(xiàn)病癥非常關(guān)鍵。
然而,在美國(guó)很多地區(qū),由于眼科專家短缺,患者可能需要等待幾個(gè)月才能預(yù)約到檢查。
此外,需要額外安排時(shí)間去做眼睛散瞳檢查,這對(duì)于需要請(qǐng)假工作或上學(xué)、并且需要解決交通問(wèn)題的低收入患者來(lái)說(shuō),尤其困難。而這部分人群還恰恰是2型糖尿病的高風(fēng)險(xiǎn)群體。
為了改善這一問(wèn)題,Digital Diagnostics在經(jīng)過(guò)幾十年的研究和涉及900名糖尿病患者的臨床試驗(yàn)后,于2018年獲得了FDA的批準(zhǔn)——而這也是醫(yī)學(xué)領(lǐng)域第一個(gè)完全自主的AI系統(tǒng)。
對(duì)此,華盛頓大學(xué)的視網(wǎng)膜專家和副教授Aaron Lee稱贊為「醫(yī)學(xué)史上的一個(gè)里程碑」。
這套系統(tǒng)的操作非常簡(jiǎn)單,僅需高中學(xué)歷和幾小時(shí)的培訓(xùn)即可。
其中,設(shè)備可以被放在任何昏暗的房間,患者只需將臉部放在下巴和額頭支架上,注視鏡頭,技術(shù)人員便會(huì)拍攝每只眼睛的圖像。
而且在大多數(shù)情況下,不需要對(duì)眼睛進(jìn)行散瞳,就能在幾分鐘內(nèi)給出診斷結(jié)果。
總體而言,AI提供即時(shí)結(jié)果的能力,以及省去額外預(yù)約的時(shí)間和費(fèi)用,可以讓患者和醫(yī)療服務(wù)機(jī)構(gòu)同時(shí)受益。
結(jié)果顯示,在Espinoza診所過(guò)去一年進(jìn)行的約700次眼科檢查中,近四分之一的檢查發(fā)現(xiàn)了視網(wǎng)膜病變,這些患者隨后被推薦給專家接受進(jìn)一步的治療。
但值得注意的是,如果沒(méi)有醫(yī)生親自進(jìn)行篩查,僅依賴算法尋找糖尿病視網(wǎng)膜病變,可能會(huì)遺漏其他重要的疾病,比如脈絡(luò)膜黑色素瘤。
并且算法在判斷時(shí)會(huì)更加謹(jǐn)慎,導(dǎo)致對(duì)患者的過(guò)度轉(zhuǎn)診。
雖然但是,AI目前還不夠可靠
這不,推特網(wǎng)友「Misha Saul」就在前段時(shí)間拿著他朋友的MRI腦部掃描結(jié)果,讓如今的當(dāng)紅炸子雞Claude分析了一下。
很快,Claude就給出了自己的「結(jié)論」——腦子里有一個(gè)很嚴(yán)重的腫瘤:
根據(jù)展示的MRI腦部掃描圖像,看起來(lái)大腦中有一個(gè)很大的異常區(qū)域。大腦中央那塊不規(guī)則的亮白色區(qū)域讓人擔(dān)憂,可能是腫瘤或其他病理情況。
這個(gè)腫瘤顯示出明顯的增強(qiáng)、局部的壓迫效應(yīng)和周圍的水腫——這些都不是正常大腦組織應(yīng)有的特征。
我們可以在一系列連續(xù)的MRI切片中跟蹤到這個(gè)腫塊,確認(rèn)它是一個(gè)實(shí)際存在的占位性病變。它的位置也是典型的原發(fā)性膠質(zhì)瘤所在。
雖然我知道放射學(xué)總是有一定的不確定性,但我認(rèn)為這實(shí)際上是正常大腦或某種誤導(dǎo)性角度的可能性非常低,不到 1%。整套圖像構(gòu)成了一個(gè)一致且令人信服的侵襲性腦腫瘤的畫(huà)面。
隨后,網(wǎng)友又讓Claude進(jìn)行了一遍復(fù)查:
在查看了額外MRI序列和角度后,我的評(píng)估沒(méi)有改變。
從多個(gè)角度觀察,都清楚地顯示了左頂葉深處中心有一個(gè)大的、強(qiáng)烈增強(qiáng)的異常區(qū)域,周圍有大量的血管性水腫。
這個(gè)病變?cè)谶B續(xù)的切片中一再出現(xiàn),確認(rèn)它是一個(gè)真實(shí)的異常,而不是某種偶然的影像。
關(guān)鍵觀察點(diǎn)包括:
1. T1加權(quán)對(duì)比增強(qiáng)圖像上病變區(qū)域的不均勻增強(qiáng),這表明血腦屏障被破壞了。
2. 「T2 FLAIR」序列顯示,這個(gè)腫塊主要呈現(xiàn)T2高信號(hào),周圍有水腫。
3. 由于腫瘤的局部壓迫效應(yīng),相鄰的側(cè)腦室被壓迫變形。
4. 由于病變的擴(kuò)張效應(yīng),導(dǎo)致中線向右移位。
這些發(fā)現(xiàn)再次確認(rèn)了我對(duì)這是一個(gè)高級(jí)別膠質(zhì)瘤的初步判斷,鑒于成像特征,這很可能是膠質(zhì)母細(xì)胞瘤。額外的垂直于原始平面的視圖有助于排除了這是由體積平均誤差造成的假象。
總的來(lái)說(shuō),這些補(bǔ)充的成像資料進(jìn)一步鞏固了我對(duì)這是一個(gè)侵襲性左頂葉腫瘤的診斷,我懷疑這是一個(gè)膠質(zhì)母細(xì)胞瘤。
現(xiàn)在,我對(duì)這是一個(gè)真實(shí)的病理發(fā)現(xiàn)需要緊急介入治療的判斷更加自信(>99%)。
雖然最終需要通過(guò)活檢和組織病理學(xué)評(píng)估來(lái)明確分類,但成像結(jié)果對(duì)于惡性膠質(zhì)瘤來(lái)說(shuō)是非常有說(shuō)服力的。
對(duì)于外行人來(lái)說(shuō),Claude給出的診斷非常有說(shuō)服力——不僅滿嘴都是專業(yè)詞匯,而且態(tài)度非常篤定:「我認(rèn)為自己的誤判率只有不到1%」!
但是,放射科的報(bào)告卻顯示一切正常。
而在網(wǎng)友催促下,醫(yī)院這一次叫來(lái)了三位放射科專家,并且同時(shí)和他們自己的AI進(jìn)行了檢查。
結(jié)果依然是——一切正常。
顯然,Claude剛剛給出的長(zhǎng)篇大論是完全錯(cuò)誤的……
用AI生成數(shù)字孿生,預(yù)測(cè)未來(lái)疾病
除了診斷疾病,科學(xué)家們最近還發(fā)現(xiàn),AI生成的患者的數(shù)字孿生,可以幫我們預(yù)測(cè)未來(lái)的疾病。
這個(gè)AI工具名叫Foresight,它使用的是生成式預(yù)訓(xùn)練Transformer,與ChatGPT背后的LLM類似。
首先,研究者在醫(yī)療記錄上訓(xùn)練了這些模型,然后向AI提供了新的醫(yī)療保健數(shù)據(jù)。從而創(chuàng)建出了患者的一個(gè)「虛擬副本」。
然后這個(gè)數(shù)字孿生就可以預(yù)測(cè)患者未來(lái)可能得的疾病,以及需要用什么藥了。
使用美國(guó)的數(shù)據(jù)時(shí),數(shù)據(jù)孿生預(yù)測(cè)的準(zhǔn)確率達(dá)到了88%!
而使用英國(guó)國(guó)民醫(yī)療服務(wù)體系(NHS)的信息時(shí),它的準(zhǔn)確率稍差,只有68%和76%。
而且,現(xiàn)在他們還開(kāi)發(fā)了一個(gè)更準(zhǔn)確的工具——Foresight 2,研究結(jié)果已經(jīng)在《柳葉刀數(shù)字健康》上發(fā)表。
論文地址:https://www.thelancet.com/journals/landig/article/PIIS2589-7500(24)00025-6/fulltext
數(shù)字孿生去看醫(yī)生
這項(xiàng)研究的合著者、國(guó)王學(xué)院醫(yī)院數(shù)據(jù)科學(xué)和人工智能主任James Teo認(rèn)為,這些數(shù)字孿生的預(yù)測(cè),代表了理解疾病的「可能的多元宇宙」。
「我們的生成式AI可以從健康記錄中的文本中生成預(yù)測(cè),涵蓋所有疾病組的任何疾病、測(cè)試、藥物、治療或并發(fā)癥。」
而通過(guò)患者的數(shù)字孿生,就可以提供各種見(jiàn)解和假設(shè)的場(chǎng)景。
其實(shí),這種活細(xì)胞和整個(gè)器官的虛擬模型概念,早就對(duì)我們不陌生了。
比如Alya Red,就是一個(gè)由約1億個(gè)虛擬細(xì)胞組成的心臟數(shù)字孿生。
在巴塞羅那郊區(qū)一座19世紀(jì)小教堂的墻壁內(nèi),一顆心臟開(kāi)始慢慢收縮,它在測(cè)試從藥物到植入物的治療方法
通過(guò)與醫(yī)療技術(shù)公司Medtronic合作,Alya Red模擬可以幫助定位起搏器,微調(diào)電刺激,并對(duì)效果進(jìn)行建模。
Alya Red數(shù)字孿生心臟模型由大約1億個(gè)虛擬心臟細(xì)胞組成,每個(gè)細(xì)胞由大約50個(gè)方程描述。流經(jīng)其中的「血液」可以栩栩如生地呈現(xiàn)出一束束鮮艷的色彩,紅色、橙色和黃色透露出旺盛的流動(dòng),病變心室內(nèi)的血流表現(xiàn)為緩慢的藍(lán)色和綠色。因此,數(shù)字孿生可以揭示衰竭的心臟如何失去泵血能力,或者由心臟藥物引起的危險(xiǎn)心律失常
不過(guò),怎樣將虛擬心臟連接到虛擬身體呢?
為此,CompBioMed聯(lián)盟創(chuàng)建了一個(gè)長(zhǎng)達(dá)60,000英里的血管、動(dòng)脈、靜脈和毛細(xì)血管網(wǎng)絡(luò)的數(shù)字孿生。
這些網(wǎng)絡(luò)使用數(shù)十億個(gè)數(shù)據(jù)點(diǎn),是從一名26歲的韓國(guó)女性Yoon-sun的冷凍尸體的數(shù)字化、高分辨率橫截面中收集而來(lái)的。
而德國(guó)超算SuperMUC-NG,使可專家們可以模擬出虛擬血液是如何通過(guò)Yoon-sun血管的虛擬副本流動(dòng)的,它的直徑只有幾分之一毫米。
之后,團(tuán)隊(duì)還會(huì)模擬Yoon-sun循環(huán)數(shù)字孿生過(guò)程中的血壓變化,并模擬血栓的運(yùn)動(dòng)。
來(lái)自倫敦科學(xué)博物館工程師畫(huà)廊的「虛擬心臟」展覽的Jazmín Aguado-Sierra心臟的數(shù)字孿生圖像
不過(guò),迄今為止,我們從未創(chuàng)建過(guò)整個(gè)人體的數(shù)字孿生。
首先,這種復(fù)雜的模擬需要訪問(wèn)強(qiáng)大的計(jì)算機(jī),比如世界上第一臺(tái)也是最快的百萬(wàn)兆次級(jí)超級(jí)計(jì)算機(jī)Frontier。即便如此仍然相距甚遠(yuǎn),并且需要大量的能量。
還有一個(gè)巨大的挑戰(zhàn),是將虛擬身體每個(gè)部分的所有代碼拼接在一起。
數(shù)字人的每個(gè)部分,如細(xì)胞或心臟,在技術(shù)上都是一個(gè)單獨(dú)的模擬。模擬也有多種尺度:一個(gè)細(xì)胞模型和另一個(gè)器官模型需要不同的代碼并以不同的速度運(yùn)行。讓所有這些代碼以相同的速度同時(shí)加載并非易事
另外,還有道德方面的考慮,預(yù)測(cè)健康的工具如果落入壞人手里,會(huì)有潛在的風(fēng)險(xiǎn)。
不過(guò),在當(dāng)前技術(shù)下,想創(chuàng)建自己的數(shù)字孿生,只有億萬(wàn)富翁才能做到。