mobilenetV1和V2對(duì)比

假設(shè)卷積核大小為K_h \times K_w,輸入通道數(shù)為C_{in},輸出通道數(shù)為C_{out},輸出特征圖的寬和高分別為W和H,則:

  • conv標(biāo)準(zhǔn)卷積的參數(shù)量為K_h \times K_w \times C_{in} \times C_{out}
  • conv標(biāo)準(zhǔn)卷積的操作個(gè)數(shù)為K_h \times K_w \times C_{in} \times C_{out} \times H \times W

MobileNetV1

  • 深度可分離卷積的使用:depthwise是輸入通道之間的信息融合,pointwise是輸出通道之間的信息融合。
  • Global average pooling的使用
  • 使用步長(zhǎng)為2的卷積代替Maxpool+conv:使得參數(shù)數(shù)量不變,計(jì)算量變?yōu)樵瓉淼?/4。

MobileNetV2

  • 引入殘差結(jié)構(gòu),先升維再降維,增強(qiáng)梯度的傳播,顯著減少推理期間所占的內(nèi)存。
  • 去掉Narrow layer 后面的relu,保留特征的多樣性,增強(qiáng)網(wǎng)絡(luò)的表征能力
  • 整個(gè)網(wǎng)絡(luò)是全卷積的,使得模型可以適應(yīng)于不同尺寸的圖像;使用RELU6作為激活函數(shù),使得模型在低精度計(jì)算下具有更強(qiáng)的魯棒性

MobileNetV2與v1的主要區(qū)別

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容