卷積神經(jīng)網(wǎng)絡(luò)理解及1*1卷積核的作用

技術(shù)交流QQ群:1027579432,歡迎你的加入!

一. 單通道圖像的卷積計(jì)算過程

    1. 下面各圖中所有數(shù)學(xué)符號(hào)的說明如下:
    • n:圖片的寬度和高度
    • n_c:表示圖片的通道數(shù)
    • f: 過濾器的尺寸大小
    • m: 過濾器的數(shù)量
    • Q: 卷積運(yùn)算后輸出圖像的尺寸大小
    • p:所要填充的像素值,padding=0稱為Valid Convolution;為了得到與原始輸入圖像相同尺寸的輸出圖像而加入的padding,稱為Same Convolution
    • s:卷積步長(zhǎng)stride
    • []:表示卷積運(yùn)算后的結(jié)果是向下取整運(yùn)算,如93.6經(jīng)過[93.6]運(yùn)算后是93
    • Q的計(jì)算公式如下:


      卷積后的尺寸大小.png
    1. 基本計(jì)算原理


      基本計(jì)算原理.png
  • 2.動(dòng)態(tài)過程


    動(dòng)態(tài)過程.gif
    1. 多通道圖像的卷積計(jì)算過程
    • 3.1 單個(gè)卷積核/過濾器(filters)的3D卷積運(yùn)算


      單個(gè)過濾器.png
    • 3.2 多個(gè)卷積核/過濾器(filters)的3D卷積運(yùn)算


      多個(gè)過濾器1.png

      多個(gè)過濾器2.png
    1. 上述卷積過程關(guān)系總結(jié)
    • 輸入圖片的通道數(shù)目n_c等于卷積核/過濾器的通道數(shù)
    • 卷積后得到圖片的通道數(shù)n_c等于卷積過程中使用的卷積核/過濾器個(gè)數(shù)
    • 卷積后的輸出圖片尺寸大小根據(jù)上面的公式計(jì)算出Q

二、1*1卷積核的作用

    1. 單通道圖片上使用1*1的卷積核


      單通道圖片上使用1*1卷積核.png
    • 只會(huì)在原來的輸入圖片的像素上乘以一個(gè)系數(shù),沒有什么直接的效果
    1. 多通道圖片上使用1*1的卷積核


      多通道圖片上使用1*1卷積核.png
  • 輸入是6*6*32的圖片,經(jīng)過1*1*32的卷積核進(jìn)行卷積運(yùn)算后,得到的輸出圖片是6*6*卷積過程中使用的卷積核個(gè)數(shù)。這樣就將輸入圖片的通道數(shù)32改變了,相當(dāng)于給輸入圖片進(jìn)行降維或升維操作。注:輸出圖片的尺寸,還是根據(jù)最開始的公式計(jì)算,即Q值的大小。

三、參考博客

卷積神經(jīng)網(wǎng)絡(luò)基本計(jì)算原理
1*1卷積層的理解

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容