1、平均池化mean-pooling。
鄰域點(diǎn)周圍取平均值。能很好的保留背景,但容易使得圖片變模糊。

2、最大池化max-pooling。
鄰域點(diǎn)內(nèi)取最大值。能很好的保留紋理特征。

3、隨機(jī)池化stochastic-pooling。
按特征圖中元素概率值大小隨機(jī)選擇。泛化性強(qiáng)。

4、全局平均池化global-average-pooling。
代替全連接層,整幅特征圖進(jìn)行平均池化。大大減少參數(shù)個數(shù)和過擬合現(xiàn)象。
5、空間金字塔池化spatial-pyramid-pooling。


進(jìn)入SPP層 。我們先看最左邊有16個藍(lán)色小格子的圖,它的意思是將從conv5得到的特征映射分成16份,另外16X256中的256表示的是channel,即SPP對每一層都分成16份(不一定是等比分,原因看后面的內(nèi)容就能理解了)。中間的4個綠色小格子和右邊1個紫色大格子也同理,即將特征映射分別分成4X256和1X256份
那么將特征映射分成若干等分是做什么用的呢? 我們看SPP的名字就是到了,是做池化操作,一般選擇MAX Pooling,即對每一份進(jìn)行最大池化。
我們看上圖,通過SPP層,特征映射被轉(zhuǎn)化成了16X256+4X256+1X256 = 21X256的矩陣,在送入全連接時可以擴(kuò)展成一維矩陣,即1X10752,所以第一個全連接層的參數(shù)就可以設(shè)置成10752了,這樣也就解決了輸入數(shù)據(jù)大小任意的問題了。
6、空洞空間卷積池化金字塔Atrous Spatial Pyramid Pooling。

設(shè)計(jì)了幾種不同采樣率的空洞卷積來捕捉多尺度信息。