深度醫(yī)療(1) - 基于深度學習心電圖(ECG)特征識別

深度醫(yī)療是筆者基于深度學習的醫(yī)學項目應用開發(fā)實踐,經(jīng)過整理輸出了文檔和本系列課程,希望通過分享可以和大家共同討論、相互學習,探索更好的解決方案。筆者是一名普通的大數(shù)據(jù)和人工智能領域從業(yè)者,過程中如有錯誤和理解不到位的地方請廣大同仁不吝賜教。筆者一直堅信深度學習和醫(yī)學的有機結合一定能碰撞出性能強大的深度醫(yī)療系統(tǒng),服務大眾。

深度醫(yī)療(1) - 心電圖特征識別

本文主要介紹了通過深度學習進行心電圖特征識別的應用,首先簡單介紹了心電圖醫(yī)學背景和相關知識,接著介紹了目前能獲得的公開的心電圖數(shù)據(jù)集,最后介紹了神經(jīng)網(wǎng)絡的實現(xiàn)方式和處理后的效果以及性能分析。

1.什么是心電圖

心臟在收縮跳動過程,心肌內的電流產(chǎn)生在前,心肌機械性收縮在后,應用心電圖機以圖形形式記錄這些心肌電流的變化就叫做心電圖。大家對心電圖應該都有直觀的印象,我們去醫(yī)院體檢一般都有這項功能的檢測。通過傳感器的連接檢測,會在終端打印出一張如下面所示的圖,這個就是記錄心臟整個生理周期過程的心電圖。

心電圖每一個橫格代表時間為0.04秒,每一個縱格代表電壓為0.1毫伏;1個大格=5個小格=0.04秒x5=0.2秒。所以可以得到下面的對應關系,這樣就可以簡單的通過紙上坐標快速得出心律的跳動次數(shù)。

心電圖傳感器不同的連接方式對應不同的導聯(lián)方式,主要分為下列兩種?

肢體導聯(lián)方式:


標準導聯(lián)Ⅰ:左上肢接正極,右上肢接負極?

標準導聯(lián)Ⅱ:左下肢接正極,右上肢接負極?

標準導聯(lián)Ⅲ:左下肢接正極,左上肢接負極?

aVR導聯(lián):右手接正極,負極接中心電端?

aVL導聯(lián):左手接正極,負極接中心電端?

aVF導聯(lián):左下肢接正極,負極接中心電端?

胸導聯(lián)方式:


V1導聯(lián):正極放在第四肋間胸骨旁右緣

V2導聯(lián):正極放在第四肋間胸骨旁左緣

V3導聯(lián):正極放在V2~V4導聯(lián)連線中點

V4導聯(lián):正極放在第五肋間與鎖骨中線交點上

V5導聯(lián):正極放在腋前線與V4導聯(lián)水平線的交點上

V6導聯(lián):正極放在腋中線與V4導聯(lián)水平線的交點上

2.心電圖產(chǎn)生原理

當心肌細胞一端的細胞膜受到一定程度的刺激時,其對鉀、鈉、氯、鈣等離子的通透性發(fā)生改變,引起細胞膜內、外和正、負離子的流動(主要是鈉離子的內流),使細胞膜內外正、負離子的分布發(fā)生逆轉,受刺激部位的細胞膜出現(xiàn)除極化,使膜外側具負電荷而膜內側具正電荷,產(chǎn)生動作電位使心臟產(chǎn)生收縮運動。

這樣周而復始,一個周期一個周期持續(xù)下去就行成了有規(guī)律的心電圖波形,也稱為P-QRS-T波。

P-QRS-T波的形成?

心電活動始于竇房結,并從此發(fā)出沖動,循此特殊傳導系統(tǒng)的通道下傳,先后興奮心房和心室,使心臟收縮,執(zhí)行泵血功能。這種先后有序的電興奮的傳播,將引起一系列的電位改變,形成心電圖上相應的波形。

3.數(shù)據(jù)集介紹?

我們采用的數(shù)據(jù)集是MIT-BIH Arrhythmia Database(心律失常數(shù)據(jù)庫)它是由Massachusetts Institute of Technology - 麻省理工學院和Beth Israel Hospital – 美國麻薩諸塞州波士頓Beth Israel醫(yī)院一起聯(lián)合創(chuàng)建的。

數(shù)據(jù)集中包含48 條充分標注的2導聯(lián)ECG數(shù)據(jù),每條數(shù)據(jù)時長為30分鐘,其中標注的數(shù)據(jù)是按每個心電圖周期進行標記的,也就是說每個周期的P-QRS-T波形都進行了標準,標注非常的詳細,同時提供了對應的label標簽文件,標注的信息可以從label標簽文件中找到對應的信息。標注的信息可以從label標簽文件中找到對應的信息 可以通過按圖中的選擇進行數(shù)據(jù)集的查看,做得非常的詳細。?

數(shù)據(jù)的下載地址

每條數(shù)據(jù)包含都.atr注釋文件,.dat數(shù)據(jù)文件,.hea頭文件?

頭文件主要包含一些基礎、單位信息

注釋文件記錄了心電專家對相應的心電信號做出診斷信息

數(shù)據(jù)文件包含了心電圖的波形數(shù)據(jù),存儲格式是頭文件中的212格式(針對兩個信號的數(shù)據(jù)記錄,兩個信號交替存儲,每三個字節(jié)存儲兩個數(shù)據(jù))?

官方提供了PhysioBank ATM可視化網(wǎng)站,可進行在線查看,非常方便

4.神經(jīng)網(wǎng)絡?

因為心電圖是周期性的波形數(shù)據(jù),神經(jīng)網(wǎng)絡通過了兩種方式進行處理,包含一個周期波形的數(shù)據(jù)通過single pattern模式進行處理,包含多個周期波形的數(shù)據(jù)通過multiple pattern模式處理。為什么這么做是因為single pattern模式下只包含一個周期的波形,我們簡單的認為在一個周期波形下只包含一種病變信息,也就是說簡單的認為它只包含一個判決結果,而multiple pattern模式中多個波形有可能就會包含多種病變信息,也就是多分類問題了(這里的single pattern也有可能一個波形對應幾個病變信息,為了把問題簡單化同時闡述得更清楚,這里就認為single pattern模式只包含一種判別結果)

基于single pattern模式?

為了能完整的包含一個P-QRS-T波,所以數(shù)據(jù)兩頭多引入了半個波形。模型中用到了三層ResNet和一層全連接層,這個模型并不見得好,在這里只是為了拋磚迎玉,大家在實際開發(fā)中可以進行測試和架構的優(yōu)化來提高性能。

神經(jīng)網(wǎng)絡結構

multiple pattern模式?

輸入數(shù)據(jù)包含幾個周期波形,所以該情況下就會出現(xiàn)某個波形數(shù)據(jù)下包含一個以上特征,意味著softmax輸出不是一種特征輸出,而是會出現(xiàn)幾種可能并列出現(xiàn)的情況,這個時候前面single pattern的神經(jīng)網(wǎng)絡就不能處理這種情況;?

這里也以一個稍微簡單的情況進行講解,假設一個波形最多包含2種特征(最少也有一種,正?;蛘咂渌±恚?,這種情況下我們采用兩個并行的網(wǎng)絡進行處理,一個網(wǎng)絡判別波形的一半label,另一個網(wǎng)絡判別波形的另外一半label,完成鑒別后合并這些特征就能進行多特征判別。

神經(jīng)網(wǎng)絡結構?

誤差收斂曲線

5.存在的問題和優(yōu)化方案

1)實際項目中輸入數(shù)據(jù)不是.dat文件,可能是圖片數(shù)據(jù),這個時候需要通過調整CNN的濾波器維度來進行匹配,例如系統(tǒng)中現(xiàn)在用的是1x3的濾波器,圖片處理時,由于是二維數(shù)據(jù),所以需要變換成3x3的濾波器;

2)通過其他網(wǎng)絡結構進行優(yōu)化,例如可以考慮引入dense net或在multiple pattern下把并行的一個網(wǎng)絡完成dense net;

3)在特定場景下可以考慮RNN網(wǎng)絡的引入;

6.彩蛋

在心電圖識別這個領域有一個每年都舉辦的比賽,大家有興趣可以去參加。

心電圖比賽

下面是2017年比賽的結果

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容