Deep semantic segmentation of natural and medical images: a review

論文:Deep semantic segmentation of natural and medical images: a review | SpringerLink

摘要

1. 簡介

2. 網(wǎng)絡(luò)架構(gòu)改進(jìn)

? ? 2.1 全卷積神經(jīng)網(wǎng)絡(luò)(FCN)用于語義分割

? ? 2.2 編解碼器語義圖像分割網(wǎng)絡(luò)

? ? 2.3 降低圖像分割網(wǎng)絡(luò)的計算復(fù)雜度

? ? ? ? 在降低網(wǎng)絡(luò)復(fù)雜度方面做得探索有:通過張量分解、通道剪枝、網(wǎng)絡(luò)剪枝或者網(wǎng)絡(luò)連接稀疏化等方式簡化網(wǎng)絡(luò)結(jié)構(gòu)以及NAS(network architecture search)

? ? 2.4 基于注意力的圖像語義分割

? ? 2.5 對抗性語義圖像分割

????主要用GAN判別網(wǎng)絡(luò)來判斷輸入圖像是來自于原圖還是分割后的圖像

? ? 2.6 小結(jié)

? ? 目前主流的語義分割模型是基于編解碼結(jié)構(gòu)的U-Net系列,相關(guān)研究又借助空洞卷積、空間金字塔提升U-Net性能

3. 適用于醫(yī)學(xué)圖像的結(jié)構(gòu)改進(jìn)

????Part A 模型壓縮

????Part B 編解碼分割框架

????Part C 注意力機制

????Part D GAN

????Part E 循環(huán)神經(jīng)網(wǎng)絡(luò)

????循環(huán)神經(jīng)網(wǎng)絡(luò)RNN主要用來處理序列模型,比如LSTM長短時記憶網(wǎng)絡(luò)通過將上一時間步的狀態(tài)作為當(dāng)前時間步輸入的一部分,有效保證了梯度的流動。而將RNN用于醫(yī)學(xué)圖像分割主要是考慮到醫(yī)學(xué)圖像具有一定的時間依賴性,比如將RNN的自循環(huán)機制結(jié)合FCN可以保留醫(yī)學(xué)圖像時間和空間上的信息用于分割;還有用RNN與CNN結(jié)合,主要用來處理包含時間意義的3D、4D醫(yī)學(xué)圖像。

4. 基于優(yōu)化函數(shù)的改進(jìn)

? ? 4.1 交叉熵

? ? 4.2 加權(quán)交叉熵

? ? 4.3 Focal Loss

? ? 4.4 基于重疊度量的損失函數(shù)

? ? ? ? 4.4.1 Dice Loss / F1 Score

? ? ? ? 4.4.2 Tversky Loss

? ? ? ? 4.4.3 指數(shù)對數(shù)損失(Exponential Logarithmic Loss Wong)

? ? ? ? 4.4.4 Lovaˊsz-Softmax loss

? ? ? ? 4.4.5 Boundary Loss

? ? ? ? 4.4.6 總結(jié)

5. 醫(yī)學(xué)影像領(lǐng)域針對優(yōu)化函數(shù)的改進(jìn)

? ? 5.1 正則交叉熵

? ? 5.2 輪廓能量最小化

? ? 5.3 Hausdorff距離

6. 基于圖像合成的方法應(yīng)用于醫(yī)學(xué)圖像分割

7. 弱監(jiān)督方法

8. 多任務(wù)模型

9. 在自然圖像上測試的主要模型的總結(jié)

10. 未來改進(jìn)方向

? ? 10.1 網(wǎng)絡(luò)架構(gòu)

? ? ?目前性能最佳的分割網(wǎng)絡(luò)是以編解碼結(jié)構(gòu)輔助長短鏈接的這種網(wǎng)絡(luò)結(jié)構(gòu)。skip connection的存在有助于信息的流動、防止梯度消失,對分割和分類都有提升;編解碼結(jié)構(gòu)可以學(xué)習(xí)到更加豐富的特征表達(dá),但也增加了計算成本,部分辨別力不強的特征也會不斷傳遞下去,未來的優(yōu)化方向之一就是如何優(yōu)化skip connection傳遞的數(shù)據(jù);另一方面則有通過空洞卷積、空間金字塔改善每個cell的性能。是否能設(shè)計出提取到新的特征層也是潛在的一個方向

????10.2序列模型

????主要用于3D醫(yī)學(xué)圖像的分割,可以將其視為具有時間維度的序列模型。將3D信息作為一個整體處理可以捕獲到更多的幾何特征信息,因此未來可以就3D圖像按序列模型還是立體模型來處理也是值得探索的一個方向

? ? 10.3 損失函數(shù)

? ? ?損失函數(shù)的優(yōu)化在前文已敘述過。如果需要進(jìn)行改進(jìn)的話,可以在交叉熵?fù)p失函數(shù)或重疊度損失函數(shù)的基礎(chǔ)上,加入由先驗知識指導(dǎo)的正則化項;另一個可嘗試的方向是仿照NAS進(jìn)行自動損失函數(shù)的設(shè)計。

? ? 10.4 其他潛在方向

? ??(1)結(jié)合先驗知識完成像素級別的場景理解(2)由于醫(yī)學(xué)圖像標(biāo)準(zhǔn)、種類不一、還有獨特的噪聲機制,加之倫理、道德方面的限制和約束,使得缺少一致、規(guī)范的評判與對比(3)制備大規(guī)模開源的2D/3D醫(yī)學(xué)分割圖像數(shù)據(jù)集(4)探索增強學(xué)習(xí)在語義分割方面的應(yīng)用(5)探究導(dǎo)致模型預(yù)測中假陽性等出現(xiàn)的原因(6)探究醫(yī)學(xué)圖像分割的弱監(jiān)督模型以及使用圖像級別標(biāo)注的少樣本學(xué)習(xí)方法



[圖1:本文概述了基于深度學(xué)習(xí)的分割方法


圖2:一個典型的基于深度神經(jīng)網(wǎng)絡(luò)的語義分割管道。管道中的每個組件表示本文中涵蓋相應(yīng)貢獻(xiàn)的部分




論文閱讀——Deep Semantic Segmentation of Natural and Medical Images: A Review_黃小米吖的博客-CSDN博客

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容