池化雜項(xiàng)

1、平均池化mean-pooling。

鄰域點(diǎn)周圍取平均值。能很好的保留背景,但容易使得圖片變模糊。

2、最大池化max-pooling。

鄰域點(diǎn)內(nèi)取最大值。能很好的保留紋理特征。

3、隨機(jī)池化stochastic-pooling。

按特征圖中元素概率值大小隨機(jī)選擇。泛化性強(qiáng)。

4、全局平均池化global-average-pooling。

代替全連接層,整幅特征圖進(jìn)行平均池化。大大減少參數(shù)個數(shù)和過擬合現(xiàn)象。

5、空間金字塔池化spatial-pyramid-pooling。

進(jìn)入SPP層 。我們先看最左邊有16個藍(lán)色小格子的圖,它的意思是將從conv5得到的特征映射分成16份,另外16X256中的256表示的是channel,即SPP對每一層都分成16份(不一定是等比分,原因看后面的內(nèi)容就能理解了)。中間的4個綠色小格子和右邊1個紫色大格子也同理,即將特征映射分別分成4X2561X256

那么將特征映射分成若干等分是做什么用的呢? 我們看SPP的名字就是到了,是做池化操作,一般選擇MAX Pooling,即對每一份進(jìn)行最大池化。

我們看上圖,通過SPP層,特征映射被轉(zhuǎn)化成了16X256+4X256+1X256 = 21X256的矩陣,在送入全連接時可以擴(kuò)展成一維矩陣,即1X10752,所以第一個全連接層的參數(shù)就可以設(shè)置成10752了,這樣也就解決了輸入數(shù)據(jù)大小任意的問題了。

6、空洞空間卷積池化金字塔Atrous Spatial Pyramid Pooling。

設(shè)計(jì)了幾種不同采樣率的空洞卷積來捕捉多尺度信息。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容