Nat Mac Int | 可解釋的乳腺癌AI幫助培訓(xùn)影像科醫(yī)生
原創(chuàng)?圖靈基因?圖靈基因?2022-01-25 09:20
收錄于話(huà)題#前沿生物大數(shù)據(jù)分析
杜克大學(xué)的計(jì)算機(jī)工程師和放射科醫(yī)生開(kāi)發(fā)了一個(gè)人工智能(AI)平臺(tái),可以分析乳房X光掃描中潛在的癌性病變,以幫助確定患者是否應(yīng)該接受侵入性活檢。然而,與其他AI平臺(tái)不同的是,該算法是可解釋的,這意味著它可以準(zhǔn)確地向醫(yī)生展示它是如何得出結(jié)論的。
研究人員訓(xùn)練了他們可解釋的乳腺病變AI算法(IAIA-BL)來(lái)定位和評(píng)估病變,就像訓(xùn)練真正的放射科醫(yī)生一樣,而不是讓它自由地開(kāi)發(fā)自己的程序。他們認(rèn)為,與“黑匣子”平臺(tái)相比,這為新平臺(tái)提供了一些優(yōu)勢(shì),并且可以提供一個(gè)有用的培訓(xùn)平臺(tái)來(lái)教學(xué)生如何閱讀乳房X光檢查圖像。它還可以幫助世界上人口稀少地區(qū)不經(jīng)常閱讀乳房X光掃描的醫(yī)生做出更好的醫(yī)療保健決策。
杜克大學(xué)放射學(xué)教授Joseph Lo博士說(shuō):“如果計(jì)算機(jī)要幫助做出重要的醫(yī)療決策,醫(yī)生需要相信人工智能是基于有意義的東西得出結(jié)論的。我們需要的算法不僅能起作用,還能自我解釋?zhuān)⑴e例說(shuō)明他們的結(jié)論是基于什么。這樣,無(wú)論醫(yī)生是否同意結(jié)果,人工智能都能幫助做出更好的決定?!?/p>
Lo及其同事在《Nature Machine Intelligence》雜志上發(fā)表了一篇題為“A case-based interpretable deep learning model for classification of mass lesions in digital mammography”的論文,報(bào)告了AI平臺(tái)。
讀取醫(yī)學(xué)圖像的工程AI是一個(gè)巨大的產(chǎn)業(yè)。已經(jīng)存在數(shù)千種獨(dú)立算法,F(xiàn)DA已經(jīng)批準(zhǔn)100多種用于臨床。正如作者所說(shuō),“人工智能正在徹底改變放射學(xué)?!比欢麄兙嬲f(shuō),無(wú)論是讀取MRI、CT還是乳房X光掃描,很少有算法使用包含1000多張圖像或包含人口統(tǒng)計(jì)信息的驗(yàn)證數(shù)據(jù)集?!啊_(kāi)可用的乳房X光檢查數(shù)據(jù)集很少,因此許多模型都是針對(duì)相對(duì)較少的病例進(jìn)行訓(xùn)練的,而社區(qū)缺乏外部驗(yàn)證這些模型的數(shù)據(jù)集?!毙畔⒌膮T乏,加上最近幾個(gè)著名例子的失敗,導(dǎo)致許多醫(yī)生質(zhì)疑人工智能在關(guān)鍵醫(yī)療決策中的應(yīng)用。
在一個(gè)例子中,即使研究人員使用不同設(shè)備從不同設(shè)施拍攝的圖像對(duì)其進(jìn)行訓(xùn)練,人工智能模型還是失敗了。AI不再只關(guān)注感興趣的病變,而是學(xué)會(huì)了使用設(shè)備本身引入的細(xì)微差異來(lái)識(shí)別來(lái)自癌癥病房的圖像,并賦予這些病變更高的癌變概率。正如人們所預(yù)料的那樣,人工智能并沒(méi)有很好地轉(zhuǎn)移到使用不同設(shè)備的其他醫(yī)院。但是,因?yàn)闆](méi)有人知道算法在做決策時(shí)是在看什么,所以沒(méi)有人知道它在實(shí)際應(yīng)用中注定會(huì)失敗。
正如作者所指出的,“盡管計(jì)算機(jī)輔助放射學(xué)有望用于乳房X光攝影”,但目前的方法與“嚴(yán)重問(wèn)題”有關(guān),包括混淆。研究小組補(bǔ)充說(shuō),當(dāng)預(yù)測(cè)模型使用不正確的信息或推理做出決策時(shí),即使決策是正確的,也會(huì)發(fā)生混淆?!霸谝郧暗难芯恐?,研究人員創(chuàng)建的模型似乎在測(cè)試集上表現(xiàn)良好,但在進(jìn)一步的檢查中,他們的決定是基于混淆信息(例如設(shè)備類(lèi)型)而不是醫(yī)學(xué)信息?!?/p>
機(jī)器學(xué)習(xí)模型的可解釋性對(duì)于作者所說(shuō)的“高風(fēng)險(xiǎn)決策”很重要,例如是否根據(jù)乳房X光掃描進(jìn)行活檢?!叭榉縓光檢查提出了其他計(jì)算機(jī)視覺(jué)任務(wù)中不存在的重要挑戰(zhàn):數(shù)據(jù)集很小,存在混淆信息,甚至放射科醫(yī)生也很難僅根據(jù)乳房X光檢查在觀(guān)察等待和活檢之間做出決定。”他們寫(xiě)道。
“我們的想法是建立一個(gè)系統(tǒng),說(shuō)明潛在癌病變的這一特定部分與我以前見(jiàn)過(guò)的另一部分非常相似。”杜克大學(xué)計(jì)算機(jī)科學(xué)博士研究生、新報(bào)告研究的第一作者Alina Barnett說(shuō),“如果沒(méi)有這些明確的細(xì)節(jié),如果無(wú)法理解為什么它有時(shí)會(huì)出錯(cuò),醫(yī)生就會(huì)失去時(shí)間和對(duì)該系統(tǒng)的信心?!?/p>
杜克大學(xué)電氣與計(jì)算機(jī)工程和計(jì)算機(jī)科學(xué)教授Cynthia Rudin博士將新AI平臺(tái)的流程與房地產(chǎn)評(píng)估師的流程進(jìn)行了比較。在該領(lǐng)域占主導(dǎo)地位的黑匣子模型中,評(píng)估師會(huì)提供一個(gè)房屋的價(jià)格,而不做任何解釋。在一個(gè)包含所謂“顯著性地圖”的模型中,評(píng)估師可能會(huì)指出,房屋的屋頂和后院是其定價(jià)決策的關(guān)鍵因素,但不會(huì)提供除此之外的任何細(xì)節(jié)。
“我們的方法會(huì)說(shuō)你有一個(gè)獨(dú)特的銅屋頂和一個(gè)后院游泳池,與你附近的其他房屋相似,這使得它們的價(jià)格上漲了這么多?!毖芯咳藛T說(shuō),“這就是醫(yī)學(xué)成像AI的透明度可能看起來(lái)的樣子,也是醫(yī)學(xué)領(lǐng)域的人員應(yīng)對(duì)任何放射挑戰(zhàn)的要求?!?/p>
正如作者進(jìn)一步評(píng)論的那樣,“為了確保臨床接受,人工智能工具需要向人類(lèi)放射科醫(yī)生合作者提供其推理過(guò)程,以便在這些困難和高風(fēng)險(xiǎn)的決策過(guò)程中成為有用的助手?!崩硐肭闆r下,任何模型的推理過(guò)程都將類(lèi)似于實(shí)際放射科醫(yī)生的推理過(guò)程,放射科醫(yī)生將根據(jù)乳腺組織內(nèi)病變發(fā)展的生理學(xué),觀(guān)察圖像中已知重要的特定方面。
研究人員利用從杜克大學(xué)衛(wèi)生系統(tǒng)484名患者身上采集的1136張圖像對(duì)新AI進(jìn)行了訓(xùn)練。他們首先教人工智能找到有問(wèn)題的可疑病變,忽略所有健康組織和其他無(wú)關(guān)數(shù)據(jù)。然后,他們聘請(qǐng)放射科醫(yī)生仔細(xì)標(biāo)記圖像,讓人工智能關(guān)注病變邊緣,即潛在腫瘤與健康周?chē)M織的交界處,并將這些邊緣與已知癌性和良性結(jié)果的圖像邊緣進(jìn)行比較。放射線(xiàn)或模糊邊緣,醫(yī)學(xué)上稱(chēng)為腫塊邊緣,是乳腺癌的最佳預(yù)測(cè)指標(biāo),也是放射科醫(yī)生首先要尋找的。這是因?yàn)榘┘?xì)胞復(fù)制和擴(kuò)張的速度如此之快,以至于不是所有正在發(fā)展的腫瘤邊緣都能在乳房X光片上看到。
研究人員在他們的論文中指出,“除了預(yù)測(cè)病變是惡性還是良性之外,我們的工作還旨在遵循放射科醫(yī)生的推理過(guò)程,檢測(cè)每幅圖像的臨床相關(guān)語(yǔ)義特征,如腫塊邊緣的特征。該框架包括一種使用基于案例推理的新型可解釋神經(jīng)網(wǎng)絡(luò)算法用于乳房X光檢查。”
“這是一種訓(xùn)練AI如何查看醫(yī)學(xué)圖像的獨(dú)特方法?!毖芯咳藛T說(shuō),“其他人工智能并沒(méi)有試圖模仿放射科醫(yī)生;他們提出了自己的方法來(lái)回答這個(gè)問(wèn)題,這些方法通常沒(méi)有幫助,或者在某些情況下,依賴(lài)于有缺陷的推理過(guò)程?!?/p>
訓(xùn)練完成后,研究人員對(duì)人工智能進(jìn)行了測(cè)試。雖然它的表現(xiàn)并沒(méi)有超過(guò)人類(lèi)放射科醫(yī)生,但它的表現(xiàn)與其他黑匣子計(jì)算機(jī)模型一樣出色。重要的是,當(dāng)新的人工智能出錯(cuò)時(shí),使用它的人將能夠認(rèn)識(shí)到它是錯(cuò)誤的,以及它出錯(cuò)的原因?!拔覀兊哪P褪菦Q策輔助工具——而不是決策者——旨在實(shí)現(xiàn)更好的整體人機(jī)協(xié)作?!弊髡咧赋?,“因此,與旨在取代醫(yī)生的現(xiàn)有黑匣子系統(tǒng)不同,我們的目標(biāo)是創(chuàng)建一個(gè)IAIA-BL,其明確的推理可以被醫(yī)生理解和驗(yàn)證……我們新穎的深度學(xué)習(xí)架構(gòu)使IAIA-BL能夠提供解釋?zhuān)@示每個(gè)病例的基本決策過(guò)程?!?/p>
展望未來(lái),該團(tuán)隊(duì)正在努力為AI添加其他物理特征,以便在做出決策時(shí)考慮,例如病變的形狀,這是放射科醫(yī)生學(xué)習(xí)觀(guān)察的第二個(gè)特征。Rudin和Lo最近還獲得了Duke MEDx高風(fēng)險(xiǎn)高影響?yīng)劊岳^續(xù)開(kāi)發(fā)該算法,并進(jìn)行放射科醫(yī)生讀者研究,看看它是否有助于臨床表現(xiàn)和/或信心。
“當(dāng)研究人員第一次開(kāi)始將AI應(yīng)用于醫(yī)學(xué)圖像時(shí),人們非常興奮,也許計(jì)算機(jī)將能夠看到人們看不到的東西或發(fā)現(xiàn)人們看不到的東西?!倍趴朔派鋵W(xué)研究員、共同作者Fides Schwartz博士說(shuō),“在極少數(shù)情況下可能會(huì)出現(xiàn)這種情況,但在大多數(shù)情況下可能并非如此。因此,我們最好確保作為人類(lèi)的我們了解計(jì)算機(jī)用來(lái)做出決策的信息?!?/p>
正如該團(tuán)隊(duì)在他們的報(bào)告中總結(jié)的那樣,“該模型的未來(lái)工作可能包括讀者研究,在該研究中,我們衡量準(zhǔn)確性的任何改進(jìn),放射科醫(yī)生報(bào)告他們對(duì)我們系統(tǒng)的信任。鑒于其他AI幫助對(duì)經(jīng)驗(yàn)不足的讀者的好處越來(lái)越大,將這個(gè)系統(tǒng)的好處與可能只是偶爾被要求做這項(xiàng)工作的次級(jí)專(zhuān)家和社區(qū)放射科醫(yī)生進(jìn)行比較可能是有價(jià)值的?!?/p>