楊學(xué)_ICCV_2019_SCRnet

創(chuàng)新點(diǎn)有三個(gè)

  • SF-net:用于特征提取
  • MDA-Net:抑制背景,突出前景目標(biāo)
  • 損失函數(shù):改進(jìn)L1損失,添加IOU常數(shù)因子

SF-net

動(dòng)機(jī):

  • 檢測(cè)小目標(biāo)存在問題:
    1)使用pooling層,小目標(biāo)在更深的層中丟失了特征信息
    2)頂層特征圖大的采樣步長(zhǎng)漏掉了小目標(biāo),導(dǎo)致欠采樣。
    底層特征圖能夠保留小目標(biāo)的位置信息,頂層特征圖能夠包含更多的語義信息。
  • 解決思路:
    1)常用的多尺度特征融合
    2)finer sampling:更合適的采樣方式。
  • 具體解決方案
    使用resnet,僅使用c3和c4進(jìn)行特征融合。其中c4被上采樣到固定尺寸s=6(經(jīng)驗(yàn)參數(shù),本文的6是根據(jù)特定數(shù)據(jù)集選定的參數(shù)),c3同時(shí)被上采樣到該尺寸,然后接了一個(gè)inception模塊,來擴(kuò)大感受野和增強(qiáng)語義信息,最后將兩個(gè)通道的結(jié)果拼接到一起,得到特征圖F3。


    圖片.png

MDA-Net

  • 傳統(tǒng)RPN存在問題
    帶來很多噪聲信息,也就是可能引入虛假目標(biāo),此外,目標(biāo)邊界模糊。所以需要更加突出背景,抑制噪聲。
  • 解決思路
    使用有監(jiān)督的注意力機(jī)制網(wǎng)絡(luò)來突出目標(biāo),抑制背景。
  • 具體解決方案
    1) 首先,上一步提取到的特征圖F3,經(jīng)過inception模塊后得到新的特征圖,利用該特征圖進(jìn)行1x1x2卷積,得到顯著圖每個(gè)像素點(diǎn)的前景分?jǐn)?shù)和背景分?jǐn)?shù)(訓(xùn)練時(shí)采用二值圖和該輸出進(jìn)行交叉熵?fù)p失計(jì)算和參數(shù)回歸)。然后使用softmax將同一個(gè)像素點(diǎn)的目標(biāo)和背景分?jǐn)?shù)歸一化到0-1(兩數(shù)之和是1)。接著使用單通道顯著圖和F3相乘,這樣就得到了經(jīng)過背景抑制和邊界增強(qiáng)的特征圖。
    2)此外,除了像素注意力機(jī)制(不同像素對(duì)應(yīng)不同權(quán)重),還用了通道注意力機(jī)制(不同特征圖對(duì)應(yīng)不同權(quán)重)。通道注意力機(jī)制首先對(duì)每張?zhí)卣鲌D求平均值,得到c個(gè)值后,利用兩個(gè)全連接,第二個(gè)全連接輸出還是c個(gè)值,然后使用sigmoid調(diào)整到0-1之間,就得到了通道注意力的權(quán)重。(這個(gè)權(quán)重是通過反向傳播學(xué)習(xí)參數(shù)得來的),最終F3和這兩個(gè)權(quán)重相乘后得到A3,在A3基礎(chǔ)上,使用rpn來提取候選區(qū)域。注意,這里的候選區(qū)域還是水平矩形框。


    圖片.png

損失函數(shù)

圖片.png

使用opencv定義的旋轉(zhuǎn)框方式存在邊界問題(即邊界情況損失函數(shù)突增)
圖片.png

所以,這里使用IOU來解決loss突增問題。(后續(xù)再詳細(xì)思考)IOU越大,loss越小,避免了loss突增。也就是說,當(dāng)出現(xiàn)上圖這種情況時(shí),loss會(huì)很小,經(jīng)過梯度下降后,loss會(huì)更小。
在非邊界時(shí)(角度不超過-90度),模型正?;貧w,學(xué)到的參數(shù)已經(jīng)很棒了。遇到邊界時(shí),很棒的參數(shù)計(jì)算出來的角度超過了邊界,(盡管預(yù)測(cè)出來的是對(duì)的)但是計(jì)算的loss卻很大,所以模型就要去修改已經(jīng)學(xué)的很好的參數(shù),導(dǎo)致學(xué)習(xí)效果不理想。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容