A Bi-directional Message Passing Model for Salient Object Detection

相關(guān)工作

局部超像素與全局提議的組合來推測顯著性圖;
將低級空間特征嵌入cnn提取的特征,等。
作者由此提出基于各個層次特征圖加權(quán)融合的模型并加入了雙向信息傳遞,從高層語義到底層邊緣信息,以及反向傳遞。

模型結(jié)構(gòu)

該模型建立在一個基于vgg16的fcn結(jié)構(gòu)作為預(yù)訓(xùn)練模型,利用vgg16產(chǎn)生多尺度特征圖,其中刪去了所有全連接層以及最后一個池化層,得到5個層次的特征圖。然后對每個特征圖進(jìn)行上下文語義特征提取(MCFEM),為了整合信息提出了雙向信息傳遞模型(GBMPM)。最后由高層向底層特征融合得出顯著性圖。

多尺度上下文感知特征提取

將vgg16輸出的5層特征圖分別進(jìn)行上下文感知特征提取,采用了4個不同膨脹率空洞卷積層進(jìn)行空洞卷積,詳細(xì)參數(shù)如下

因?yàn)榭斩淳矸e具有更大感受野,基本等效于增大卷積核尺寸卻不增多參數(shù)。

門控雙向信息傳遞

即高層語義特征指導(dǎo)底層邊緣信息,幫助定位顯著性區(qū)域,而底層邊緣信息則幫組高層特征重建目標(biāo)細(xì)節(jié)。之前有人做過特定兩層之間的信息雙向傳遞,而本文作者對每層都做了雙向傳遞??紤]到不同層之間分辨率不同,在信息傳遞時分別做了上、下采樣。從低層向高層傳遞公式

操作包括對上一層傳遞來的hi-1與本層特征hi分別卷積并使用relu激活后下采樣至下一層分辨率尺寸(初始層的上一層h置0)。由高層向底層傳遞公式則相反
從兩個方向傳遞來的信息融合
操作包括將兩個方向傳遞的特征圖先拼接在卷積并進(jìn)行relu操作。

但是不同尺度下的特征圖會有不同,因此在傳遞信息是需要加權(quán)也就是添加門操作(融合時也需要),修正后公式
作者目標(biāo)是通過增加門函數(shù),使得只有有用的信息才被傳遞,而不準(zhǔn)確的信息則被過濾掉(有效性?)。
顯著性推理

有直接把各層顯著性圖上采樣至原圖大小相加的,作者融合特征圖時加多了一個卷積操作

損失函數(shù)
其中l(wèi)是(x,y)處標(biāo)簽,p則是其屬于前景的概率。
實(shí)驗(yàn)結(jié)果

采用DUTS的訓(xùn)練集做訓(xùn)練,前13個卷積層用vgg16的參數(shù)初始化,其他的用truncated正則方法初始化,上、下采樣使用雙線性內(nèi)插。

方法有效性實(shí)驗(yàn)
總結(jié)

思路是多尺度的特征融合,借鑒了一篇目標(biāo)識別文章中中信息雙向傳遞,使每個尺度特征圖具有全局與細(xì)節(jié)信息,特征提取時采用空洞卷積,特征融合時也用到卷積。但感覺雙向傳遞帶來一些冗余信息。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容