PSP-Net


簡述

Pyramid Scene Parsing Network


作者為了引入足夠的上下文信息以及不同感受野下的全局信息來提出global-scene-level的信息,即PSPNet

Links

原文地址

代碼:

效果圖

輸出結(jié)果圖.png

與傳統(tǒng)方法FCN的比較

與FCN結(jié)果的比較與分析.png
  • Mismatched Relationship:上下文關(guān)系匹配對理解復(fù)雜場景很重要,例如在上圖第一行,在水面上的大很可能是“boat”,而不是“car”。雖然“boat和“car”很像。FCN缺乏依據(jù)上下文推斷的能力。
  • Confusion Categories: 許多標(biāo)簽之間存在關(guān)聯(lián),可以通過標(biāo)簽之間的關(guān)系彌補(bǔ)。上圖第二行,把摩天大廈的一部分識別為建筑物,這應(yīng)該只是其中一個,而不是二者。這可以通過類別之間的關(guān)系彌補(bǔ)。
  • Inconspicuous Classes:模型可能會忽略小的東西,而大的東西可能會超過FCN接收范圍,從而導(dǎo)致不連續(xù)的預(yù)測。如上圖第三行,枕頭與被子材質(zhì)一致,被識別成到一起了。為了提高不顯眼東西的分割效果,應(yīng)該注重小面積物體。

融合合適的全局特征,將局部和全局信息融合到一起

2017年之前效果最好的文章


提升結(jié)果的Trick

  • Various data augmentation
  • Dropout to the last convolution
  • Using dilated convolution
  • Learning rate policy
  • Total iteration number
  • Correct way to use batch normalization
  • Larger cropsize and larger receptive field

(這里面使用了許多細(xì)節(jié)的trick使得效果比較好)

Evils in the details

Deeply supervise for better optimization


實(shí)施過程

系統(tǒng)簡略圖.png
詳細(xì)網(wǎng)絡(luò)結(jié)構(gòu)圖.png

評價(jià)

  1. 此方法算是用了一些Trick來獲得比賽的高分, 但是效果也很好
  2. Time consuming so that only useful for competitions

總的方法提升效果如下圖所示:


提升效果匯總.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • https://juejin.im/post/5aa5eaf9518825558001df50
    獨(dú)樂樂閱讀 477評論 0 0
  • 今天下午,師妹在高鐵上微信問我,師姐去參加培訓(xùn)嗎?當(dāng)時我正昏睡著,沒有及時回復(fù),。后來她又打電話給我,師姐我快...
    罌粟的妖嬈閱讀 364評論 0 0
  • 我有孤獨(dú)和烈酒 是否愿意跟我走 是否愿意一醉方休 然后奔向自由
    除了我誰都不準(zhǔn)想你閱讀 217評論 0 0
  • 我難忘的,峨山彝家情! 八四年的夏季,在校園里苦讀了一個學(xué)期,身心疲憊的學(xué)子,終于迎來了署假。 我和志趣相投的一位...
    泥巴一一龍鳳樓主閱讀 883評論 1 11

友情鏈接更多精彩內(nèi)容