醫(yī)學(xué)頂刊BMJ:全球醫(yī)學(xué)AI聯(lián)盟耗時(shí)兩年推出國(guó)際共識(shí)指南

原文鏈接:https://mp.weixin.qq.com/s/WZoPzs6rq92mnJLLRhrZjA

文獻(xiàn)來源:Lekadir K, Frangi A F, Porras A R, et al. FUTURE-AI: international consensus guideline for trustworthy and deployable artificial intelligence in healthcare[J]. BMJ, 2023, 388: e081554. DOI: 10.1136/bmj-2024-081554.

摘要

本文提出了 FUTURE-AI 框架,這是一個(gè)為醫(yī)療保健中可信賴且可部署的人工智能(AI)工具的開發(fā)和應(yīng)用提供指導(dǎo)的國(guó)際共識(shí)指南。FUTURE-AI 聯(lián)盟成立于 2021 年,由來自 50 個(gè)國(guó)家的 117 名跨學(xué)科專家組成,包括 AI 科學(xué)家、臨床研究人員、生物醫(yī)學(xué)倫理學(xué)家和社會(huì)科學(xué)家。經(jīng)過兩年的共識(shí)過程,該框架確立了六項(xiàng)核心指導(dǎo)原則:公平性、通用性、可追溯性、可用性、穩(wěn)健性和可解釋性。這些原則旨在確保 AI 工具在技術(shù)上可靠、臨床上安全、倫理上健全并符合法律要求。為了實(shí)現(xiàn)這一目標(biāo),研究團(tuán)隊(duì)制定了 30 條最佳實(shí)踐建議,涵蓋 AI 生命周期的各個(gè)階段——從設(shè)計(jì)、開發(fā)、驗(yàn)證到監(jiān)管、部署和監(jiān)控。這些建議不僅關(guān)注技術(shù)實(shí)現(xiàn),還涉及臨床應(yīng)用、社會(huì)倫理和法律合規(guī)性等多重維度。

FUTURE-AI 的核心在于解決醫(yī)療 AI 臨床應(yīng)用中的信任和倫理挑戰(zhàn)。盡管 AI 在疾病診斷、預(yù)后預(yù)測(cè)和患者分層等方面取得了顯著進(jìn)展,但其在現(xiàn)實(shí)世界中的部署仍受限于偏見、透明度不足和數(shù)據(jù)隱私等問題。該框架通過國(guó)際協(xié)作和多學(xué)科視角,提出了一套系統(tǒng)化的解決方案,旨在提升 AI 工具對(duì)患者、臨床醫(yī)生和衛(wèi)生機(jī)構(gòu)的接受度。例如,公平性原則要求 AI 在不同人群中保持一致性能,通用性原則強(qiáng)調(diào) AI 應(yīng)適應(yīng)多樣化的臨床環(huán)境,而可解釋性則確保 AI 決策對(duì)醫(yī)務(wù)人員和患者透明。通過這些努力,F(xiàn)UTURE-AI 不僅為當(dāng)前的醫(yī)療 AI 開發(fā)提供了實(shí)用指南,還為未來的技術(shù)進(jìn)步和政策制定奠定了基礎(chǔ),助力全球醫(yī)療保健質(zhì)量和可及性的提升。

引言

人工智能(AI)在醫(yī)療保健領(lǐng)域的應(yīng)用近年來呈現(xiàn)爆發(fā)式增長(zhǎng),尤其是在磁共振成像(MRI)、計(jì)算機(jī)斷層掃描(CT)等生物醫(yī)學(xué)成像技術(shù)中,AI 已展現(xiàn)出在疾病診斷、治療規(guī)劃和預(yù)后評(píng)估中的巨大潛力。然而,盡管技術(shù)進(jìn)步顯著,醫(yī)療 AI 在臨床實(shí)踐中的實(shí)際部署卻進(jìn)展緩慢。究其原因,主要包括技術(shù)風(fēng)險(xiǎn)(如模型錯(cuò)誤或偏見)、臨床安全隱患(如患者傷害)、倫理困境(如健康不平等和隱私問題)以及缺乏透明度和問責(zé)制。這些挑戰(zhàn)導(dǎo)致患者、臨床醫(yī)生和監(jiān)管機(jī)構(gòu)對(duì) AI 工具的信任度不足,阻礙了其在現(xiàn)實(shí)世界中的廣泛應(yīng)用。在磁共振成像領(lǐng)域,例如,AI 模型可能因訓(xùn)練數(shù)據(jù)的不均衡而對(duì)某些人群(如少數(shù)族裔或老年患者)的影像分析表現(xiàn)較差,這不僅降低了診斷準(zhǔn)確性,還可能加劇健康不平等。

為應(yīng)對(duì)這些問題,制定一套清晰、廣泛認(rèn)可的指南顯得尤為重要。然而,此前關(guān)于醫(yī)療 AI 的研究多集中于技術(shù)開發(fā)或特定任務(wù)的報(bào)告規(guī)范(如 TRIPOD+AI、CONSORT-AI),缺乏對(duì) AI 全生命周期(從設(shè)計(jì)到部署)的全面指導(dǎo)。此外,世界衛(wèi)生組織(WHO)和歐盟等機(jī)構(gòu)雖提出了倫理和治理建議,但這些建議往往針對(duì)政策制定者,未能深入探討技術(shù)與臨床實(shí)踐的結(jié)合。因此,F(xiàn)UTURE-AI 框架的提出填補(bǔ)了這一空白,通過國(guó)際共識(shí)為可信賴的醫(yī)療 AI 提供了結(jié)構(gòu)化的指導(dǎo)。本文的目的是為 AI 開發(fā)者、臨床醫(yī)生、政策制定者和研究人員提供一個(gè)實(shí)用框架,促進(jìn) AI 在臨床中的安全、有效和倫理應(yīng)用,從而改善全球醫(yī)療保健的質(zhì)量和公平性。

本文的主要內(nèi)容基于 FUTURE-AI 框架的六項(xiàng)指導(dǎo)原則展開,包括公平性、通用性、可追溯性、可用性、穩(wěn)健性和可解釋性。報(bào)道結(jié)構(gòu)如下:首先介紹通訊作者及其研究背景,隨后提供文獻(xiàn)來源和摘要概述核心內(nèi)容。引言部分闡述背景和目的,正文則詳細(xì)解讀六項(xiàng)原則,每項(xiàng)原則對(duì)應(yīng)一段,結(jié)合原文數(shù)據(jù)和潛在圖表進(jìn)行分析。總結(jié)部分提煉主要發(fā)現(xiàn)并展望未來研究方向,點(diǎn)評(píng)部分評(píng)估框架的優(yōu)缺點(diǎn),思維發(fā)散部分探討其更廣泛的影響,最后提供擴(kuò)展閱讀材料。本綜述不僅適用于磁共振成像等成像技術(shù)的研究者,也為所有醫(yī)療 AI 從業(yè)者提供參考,具有重要的學(xué)術(shù)和實(shí)踐意義。

主要內(nèi)容

主要內(nèi)容一:公平性

公平性是 FUTURE-AI 框架的首要原則,要求醫(yī)療 AI 工具在不同個(gè)體和群體(包括弱勢(shì)群體)之間保持一致的性能。這一原則旨在確保 AI 驅(qū)動(dòng)的醫(yī)療服務(wù)平等惠及所有人群,避免因性別、年齡、種族或經(jīng)濟(jì)社會(huì)地位等因素導(dǎo)致的偏見。在磁共振成像領(lǐng)域,例如,訓(xùn)練數(shù)據(jù)若主要來自某一特定人群(如白人男性),模型可能在分析其他人群的腦部或心臟影像時(shí)表現(xiàn)不佳,從而加劇健康不平等。原文指出,偏見的來源可能包括個(gè)體屬性(如醫(yī)療條件)和數(shù)據(jù)屬性(如采集地點(diǎn)或設(shè)備差異)。盡管完美公平性難以實(shí)現(xiàn),F(xiàn)UTURE-AI 建議通過識(shí)別、報(bào)告和減少偏見來接近這一目標(biāo),提出了三條最佳實(shí)踐:定義偏見來源、收集個(gè)體和數(shù)據(jù)屬性信息、評(píng)估和糾正偏見。

在實(shí)踐中,公平性對(duì) MRI 研究尤為重要。例如,若 AI 用于檢測(cè)腦卒中,模型需在不同年齡段和種族的患者中保持高靈敏度,否則可能漏診某些群體的高危患者。

主要內(nèi)容二:通用性

通用性原則強(qiáng)調(diào)醫(yī)療 AI 工具應(yīng)超越其開發(fā)時(shí)的受控環(huán)境,能夠在新患者、新用戶和新臨床站點(diǎn)中有效運(yùn)作。這一原則對(duì)于 MRI 等技術(shù)至關(guān)重要,因?yàn)槌上裨O(shè)備、操作員技術(shù)和患者群體在不同醫(yī)院間差異顯著。FUTURE-AI 提出四條最佳實(shí)踐:定義目標(biāo)臨床環(huán)境、使用現(xiàn)有標(biāo)準(zhǔn)、利用外部數(shù)據(jù)評(píng)估通用性、在本地驗(yàn)證臨床有效性。例如,在 MRI 腦腫瘤分割任務(wù)中,AI 若僅在單一設(shè)備的數(shù)據(jù)上訓(xùn)練,可能無法適應(yīng)其他醫(yī)院的掃描參數(shù)或患者特征,導(dǎo)致性能下降

主要內(nèi)容三:可追溯性

可追溯性原則要求醫(yī)療 AI 工具的開發(fā)和使用全程可記錄、可監(jiān)控,以增強(qiáng)透明度和問責(zé)制。在 MRI 應(yīng)用中,例如,若 AI 用于檢測(cè)脊髓病變,可追溯性可幫助追蹤模型從訓(xùn)練到臨床決策的全過程,識(shí)別潛在錯(cuò)誤(如數(shù)據(jù)標(biāo)注失誤)。FUTURE-AI 提出了六條最佳實(shí)踐,包括實(shí)施風(fēng)險(xiǎn)管理、提供文檔、持續(xù)質(zhì)量控制、定期審計(jì)與更新、實(shí)現(xiàn) AI 日志記錄和治理機(jī)制。這些措施確保 AI 的生命周期透明,例如記錄訓(xùn)練數(shù)據(jù)集的來源或部署后的性能變化。

主要內(nèi)容四:可用性

可用性原則關(guān)注終端用戶(如臨床醫(yī)生)在現(xiàn)實(shí)環(huán)境中高效、安全地使用 AI 工具的能力。在 MRI 場(chǎng)景中,例如,放射科醫(yī)生需快速解讀 AI 生成的腦部病灶分析結(jié)果,可用性要求界面友好且錯(cuò)誤率低。FUTURE-AI 提出五條最佳實(shí)踐:定義用戶需求、設(shè)計(jì)人機(jī)交互與監(jiān)督機(jī)制、提供培訓(xùn)、評(píng)估臨床可用性和效用。例如,AI 工具應(yīng)融入現(xiàn)有工作流程,提供直觀的交互界面,并通過培訓(xùn)減少操作失誤。

主要內(nèi)容五:穩(wěn)健性

穩(wěn)健性原則要求醫(yī)療 AI 在輸入數(shù)據(jù)發(fā)生預(yù)期或意外變化時(shí)保持性能穩(wěn)定。在 MRI 中,圖像質(zhì)量可能因設(shè)備差異、患者移動(dòng)或噪聲而變化,若 AI 缺乏穩(wěn)健性,可能導(dǎo)致誤診。FUTURE-AI 提出三條最佳實(shí)踐:定義數(shù)據(jù)變異來源、使用代表性數(shù)據(jù)訓(xùn)練、評(píng)估和優(yōu)化穩(wěn)健性。例如,訓(xùn)練數(shù)據(jù)應(yīng)涵蓋不同 MRI 設(shè)備的掃描參數(shù),以確保模型對(duì)現(xiàn)實(shí)世界變化的適應(yīng)性。

主要內(nèi)容六:可解釋性

可解釋性原則要求醫(yī)療 AI 提供關(guān)于決策邏輯的臨床有意義信息。在 MRI 診斷中,例如,醫(yī)生需理解 AI 為何將某區(qū)域標(biāo)記為腫瘤,而非僅接受“黑盒”結(jié)果。FUTURE-AI 提出兩條最佳實(shí)踐:與用戶共同定義解釋需求、評(píng)估解釋的有效性。盡管機(jī)器學(xué)習(xí)模型常因復(fù)雜性而缺乏透明度,可解釋性在醫(yī)學(xué)中至關(guān)重要,以滿足透明度和法律要求。

總結(jié)

FUTURE-AI 框架通過六項(xiàng)指導(dǎo)原則——公平性、通用性、可追溯性、可用性、穩(wěn)健性和可解釋性——為醫(yī)療 AI 的開發(fā)和部署提供了全面指導(dǎo)。研究發(fā)現(xiàn),盡管醫(yī)療 AI 在技術(shù)上取得了重大突破,其臨床應(yīng)用仍面臨信任不足和倫理挑戰(zhàn),如偏見、健康不平等和透明度問題。該框架通過國(guó)際共識(shí)確立的 30 條最佳實(shí)踐,覆蓋 AI 全生命周期,確保其技術(shù)穩(wěn)健、臨床安全和倫理合規(guī)。例如,在磁共振成像領(lǐng)域,公平性原則可減少人群間的診斷差異,穩(wěn)健性原則提升模型對(duì)圖像變異的適應(yīng)性,而可解釋性則增強(qiáng)醫(yī)生對(duì) AI 決策的理解。這些發(fā)現(xiàn)為 AI 開發(fā)者提供了實(shí)用工具,推動(dòng)可信賴 AI 在全球醫(yī)療中的應(yīng)用。

然而,研究領(lǐng)域仍存在若干問題。首先,在資源有限的環(huán)境中實(shí)施這些最佳實(shí)踐可能面臨成本和技術(shù)限制,如發(fā)展中國(guó)家缺乏高質(zhì)量 MRI 數(shù)據(jù)。其次,如何平衡數(shù)據(jù)隱私與 AI 性能是一個(gè)持續(xù)挑戰(zhàn),尤其是在需要廣泛數(shù)據(jù)共享時(shí)。此外,AI 工具的持續(xù)更新和維護(hù)需與監(jiān)管框架協(xié)調(diào),目前的法規(guī)可能限制模型的動(dòng)態(tài)調(diào)整。未來研究應(yīng)聚焦于開發(fā)具體實(shí)施方法,如針對(duì) MRI 等特定領(lǐng)域的定制化指南,探索 AI 在臨床中的長(zhǎng)期影響,并解決全球健康不平等問題,以確??蚣艿钠者m性和時(shí)效性。

點(diǎn)評(píng)

FUTURE-AI 框架的提出是醫(yī)療 AI 領(lǐng)域的重要里程碑。它通過國(guó)際共識(shí)確立了可信賴 AI 的標(biāo)準(zhǔn),為開發(fā)者、臨床醫(yī)生和政策制定者提供了全面而實(shí)用的指導(dǎo)。其優(yōu)點(diǎn)在于全面性和動(dòng)態(tài)性:六項(xiàng)原則涵蓋了技術(shù)、臨床和倫理維度,30 條最佳實(shí)踐貫穿 AI 全生命周期,且框架設(shè)計(jì)為可隨技術(shù)進(jìn)步和反饋而演進(jìn)。在磁共振成像領(lǐng)域,該框架可顯著提升 AI 工具的臨床適用性,如通過穩(wěn)健性減少圖像偽影影響,通過可解釋性增強(qiáng)診斷透明度,從而提高醫(yī)生和患者的信任度。

然而,框架的實(shí)施面臨挑戰(zhàn)。首先,資源限制可能阻礙其在低收入地區(qū)的應(yīng)用,如缺乏高質(zhì)量 MRI 數(shù)據(jù)或計(jì)算能力。其次,數(shù)據(jù)隱私與性能優(yōu)化間的矛盾需進(jìn)一步解決,尤其是在跨國(guó)數(shù)據(jù)共享中。此外,監(jiān)管合規(guī)性可能限制模型的動(dòng)態(tài)更新,與框架的可追溯性和穩(wěn)健性要求產(chǎn)生沖突。盡管如此,F(xiàn)UTURE-AI 的跨學(xué)科協(xié)作模式和對(duì)公平性的強(qiáng)調(diào)為其贏得了高度認(rèn)可??傮w而言,該框架為醫(yī)療 AI 的未來發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ),尤其是在成像技術(shù)領(lǐng)域,其潛力值得期待。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容