回首向來蕭瑟處:ECG AI之路 2019-08-02

作者剛開始接觸ECG AI的時候,第一件事情就是用谷歌學術檢索,看到縱貫近40年的大量文章,F1分值往往逼近1,這不就是個solved problem?可現(xiàn)實中,ECG還必須靠專業(yè)醫(yī)生讀圖,豈非怪哉?后來基于大量實際數(shù)據(jù),實現(xiàn)、測試了幾乎各種有影響的算法和模型,才發(fā)現(xiàn)個中緣由,回首前塵,頗有蕭瑟之感觸。

數(shù)字化心電圖(ECG)記錄,表現(xiàn)為一維時序實信號,多導聯(lián)時,為一組信號。利用計算機對其進行識別,屬于機器學習中的分類問題:將某心電記錄歸入一個或多個類別——對應診斷病種,如“正?!?、“房顫”等。

各種用于心電信號識別的人工智能技術,無不具備“適合處理時序信號”和“以分類為目的”這兩個基本特征。過去四十多年來這方面的實踐,大致可分成兩類:傳統(tǒng)機器學習、和深度學習。

(1)傳統(tǒng)機器學習。從二十世紀八、九十年代到現(xiàn)在,這類系統(tǒng)均可以歸結為一個簡單的公式:系統(tǒng)=特征抽取+分類器。

特征抽取又可以分成信號處理統(tǒng)計兩個步驟。信號處理包括:時域方法(如濾波、模版匹配等)、頻域方法如傅立葉/加窗傅立葉變換、小波變換等,也有采用Hilbert Huang變換的。統(tǒng)計部分包括各種常用指標如均值、方差等,以及如峭度、相對熵等相對冷門一點的,這些指標就作為抽取到的特征,輸入到分類器。

分類器則主要采用SVM或分類回歸樹(CART),及其發(fā)展如Boosting等Ensemble方法??紤]到心電信號的時序特點,也有結合馬爾可夫過程、時序限制網(wǎng)絡等來予以增強的嘗試。另外,在某些特定場景下,也可以直接采用如 if/else 等簡單規(guī)則。

心電圖中,QRS Complex最顯眼,也就是信噪比最高。因此,曾有大量的研究致力于檢測R波,尤以Pan-Tompkins(P-T)、GQRS等算法為代表。很多心電信號處理的算法,都先用P-T等來檢測R波,以此為基礎來抽取特征,例如最常見的R-R間隔等。

傳統(tǒng)機器學習方法用于心電信號識別,最主要的問題是,難于應對不確定性(來源于噪聲和個體差異等),以及較為嚴重的過擬合現(xiàn)象。絕大部分發(fā)表的文章,在如MIT-BIH等小數(shù)據(jù)集上,往往F1都可以達到0.95以上,然而我們基于實際數(shù)據(jù)集的測試發(fā)現(xiàn),F(xiàn)1通常在0.8以下。

(2)深度學習。過去五年的發(fā)展,主要是采用深度深度神經網(wǎng)絡中的CNN、LSTM以及其后續(xù)發(fā)展如Attention機制等,適配于心電信號,大部分以1維CNN為基礎。和傳統(tǒng)機器學習方法相比,深度學習不依賴于人工的特征抽取和分類器選擇,常見的網(wǎng)絡模型,本身就可以直接從原始信號給出最終分類結果。

深度學習飛速發(fā)展,在如ImageNet等上的表現(xiàn)已經超過人類,故人們對基于深度學習的心電信號識別寄予厚望。然而,從基于較大規(guī)模的數(shù)據(jù)集PhysioNet/CinC Challenge 2017, iCBEB/CPSC2018(記錄數(shù)分別為8K+,6K+)的結果來看,這種“厚望”還有待實現(xiàn)。在CinC 2017中,雄踞榜首的方法基于傳統(tǒng)的特征工程-分類器,CPSC2018列名第一的基于深度學習,然而在實際數(shù)據(jù)集測試中,F(xiàn)1下降了10%,只有0.77。實際上,從斯坦福大學文章(因作者來自吳恩達Andrew Ng團隊,該文在國內影響很大),便可知端倪,文中總的F1為0.809,但是除了“正常”等幾種類型的F1較高外,如“房顫”等主要病種的F1,都只是在0.6~0.7,難怪有人認為文中對照組的“Cardiologist”得分太低!該文章并沒有公開它所基于的訓練集(64121條記錄),我們基于實際數(shù)據(jù)集的測試結果,General F1也大致在0.8以下。

關于(1)和(2)的結合,通常是利用Stacking等Ensemble方法,也有讓深度神經網(wǎng)絡不直接處理原始信號,而是以信號處理后的輸出如頻譜圖、或者基于R波檢測后抽取的特征來作為神經網(wǎng)絡的輸入。這種結合,在CinC 2017和CPSC2018中都有例子,某些場景下能提高F1分值0.01~0.03左右。

最后,用這幅圖來總結人工智能處理心電圖的歷程。經驗之談,僅供參考。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容