美利坚毛片,97人妻一区二区,日本欧美精品九九

主要貢獻(xiàn)

提出MobileNets模型，該模型使用depthwise separable卷積構(gòu)建輕量級(jí)網(wǎng)絡(luò)，可用于智能手機(jī)及嵌入式設(shè)備中
引入兩個(gè)超參數(shù)，用于控制模型的性能及效率，在不同的應(yīng)用場景可選取合適的超參數(shù)
在目標(biāo)檢測、圖像細(xì)粒度分類、人臉屬性分類和大尺度地理定位等任務(wù)中驗(yàn)證了該模型的有效性

研究背景及動(dòng)機(jī)

近年來，卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別、檢測等領(lǐng)域取得了驚人的成功。從AlexNet到VGGNet再到ResNet，為了提高準(zhǔn)確率，網(wǎng)絡(luò)總體朝著更深更復(fù)雜的趨勢發(fā)展。然而，在某些計(jì)算資源有限的應(yīng)用場景，如智能手機(jī)、機(jī)器人、自動(dòng)駕駛，處理速度同樣重要。

目前，獲取小型高效的神經(jīng)網(wǎng)絡(luò)的方法可以粗略地分為壓縮現(xiàn)有訓(xùn)練好地網(wǎng)絡(luò)和直接訓(xùn)練小網(wǎng)絡(luò)這兩類。

壓縮類方法有參數(shù)量化、哈希、Huffman編碼、蒸餾等。

直接訓(xùn)練類方法采用卷積分解等手段，使用小卷積的組合取代大卷積，從而設(shè)計(jì)出輕量級(jí)的小網(wǎng)絡(luò)，如：

Flattened networks，將一個(gè)三維卷積分解成了三個(gè)一維的卷積
Factorized networks，減少輸出通道和輸入通道的連接數(shù)量
Xception network，使用depthwise separable卷積
Squeezenet，引入bottleneck，大量使用1x1和3x3的卷積

MobileNet

depthwise separable卷積

這是一種分解卷積的形式，它將標(biāo)準(zhǔn)卷積分解為depthwise卷積和pointwise卷積，即1×1卷積。depthwise卷積對每個(gè)輸入通道應(yīng)用單個(gè)濾波器，pointwise卷積組合輸出的depthwise卷積。標(biāo)準(zhǔn)卷積同時(shí)進(jìn)行濾波和組合，而depthwise separable卷積將其分成兩層，一層用于濾波，一層用于組合。這種分解具有大幅度減少計(jì)算和模型大小的效果。

上圖比較了標(biāo)準(zhǔn)卷積和分離后的兩個(gè)卷積，其中標(biāo)準(zhǔn)卷積的計(jì)算成本為

而depthwise separable卷積的計(jì)算成本為

兩者之比為

可以看出，輸出通道數(shù)N和卷積尺寸D_k越大，計(jì)算成本節(jié)省越大。

網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練

如上表所示，MobileNet共有28層，每個(gè)卷積層后均接著batchnorm和ReLU，使用步長為2的卷積取代maxpool進(jìn)行下采樣，在全連接層之前使用avgpool將特征圖下采樣到1x1大小，而不是像AlexNet一樣直接展開，這大大減少了參數(shù)量。

此外，通過對上述網(wǎng)絡(luò)的進(jìn)一步分析，注意到1x1卷積貢獻(xiàn)了大部分參數(shù)量及加-乘次數(shù)。計(jì)算量不能簡單地使用加-乘次數(shù)來衡量，這是因?yàn)榫矸e運(yùn)算通常由高度優(yōu)化的通用矩陣乘法（GEMM）實(shí)現(xiàn)，這種實(shí)現(xiàn)需要首先需要對輸入在內(nèi)存中進(jìn)行重排，然后再進(jìn)行GEMM，而1×1卷積不需要重排，可以直接使用GEMM來實(shí)現(xiàn)，因此占用大量加-乘次數(shù)的1x1卷積實(shí)際并不會(huì)增加太多計(jì)算量。

MobileNet使用RMSprop的優(yōu)化策略。與訓(xùn)練大型模型不同，MobileNet使用較少的正則化和數(shù)據(jù)增強(qiáng)技術(shù)，這是因?yàn)樾∧Ｐ屯ǔ２粫?huì)被過擬合所困擾。

Width Multiplier

雖然基礎(chǔ)MobileNet架構(gòu)已經(jīng)很小而且計(jì)算很快，但特殊情況下可能要求模型更小更快。為了構(gòu)造更小更快的模型，引入一個(gè)非常簡單的參數(shù)α，稱為Width Multiplier。α的作用是在每層均勻地減薄網(wǎng)絡(luò)。對于給定的層和α，輸入通道數(shù)由M變?yōu)棣罬，輸出通道數(shù)由N變?yōu)棣罭。

具有參數(shù)α的depthwise separable卷積的計(jì)算成本為

其中α∈(0, 1]，典型取值為1, 0.75, 0.5和0.25。Width Multiplier使計(jì)算成本和參數(shù)數(shù)量大致減少α²，其可應(yīng)用于任何模型結(jié)構(gòu)，適當(dāng)?shù)臋?quán)衡精度、模型大小和速度來產(chǎn)生新的較小模型。

Resolution Multiplier

用于降低神經(jīng)網(wǎng)絡(luò)計(jì)算成本的第二個(gè)超參數(shù)是Resolution Multiplier ρ，其將輸入的圖像分辨率變?yōu)樵瓉淼摩驯丁?/p>

加入?yún)?shù)α和參數(shù)ρ的depthwise separable卷積的計(jì)算成本為

其中ρ∈(0, 1]，通常設(shè)置使得網(wǎng)絡(luò)的輸入分辨率為224, 192, 160或128。Resolution Multiplier使計(jì)算成本和參數(shù)數(shù)量減少ρ²。

上表分別展示了depthwise separable卷積、參數(shù)α和參數(shù)ρ對計(jì)算量及參數(shù)量縮減貢獻(xiàn)的一個(gè)例子，可以看出縮減是十分明顯的。

實(shí)驗(yàn)

ImageNet

從上表可以看出，使用depthwise separable卷積與標(biāo)準(zhǔn)卷積相比，ImageNet上的識(shí)別精度僅降低1％，但大大減少了參數(shù)量和計(jì)算量。同時(shí)也可以看出兩個(gè)超參數(shù)對精度、模型大小、計(jì)算量的影響。注意到，縮減層數(shù)產(chǎn)生的Shallow網(wǎng)絡(luò)雖然同樣減少了原網(wǎng)絡(luò)的計(jì)算量和參數(shù)，但不如引入Width Multiplier的Narrow網(wǎng)絡(luò)更有效，后者相比前者在更少的參數(shù)和少量的計(jì)算量增加下帶來了3.1%的精度提升。

從上面兩個(gè)圖中可以粗略看出MobileNets中計(jì)算量、模型參數(shù)量對ImageNet識(shí)別精度的影響。在實(shí)際應(yīng)用中，根據(jù)不同的需求，通過調(diào)節(jié)Width Multiplier和Resolution Multiplier權(quán)衡精度、模型大小和速度，訓(xùn)練最合適的模型。

細(xì)粒度識(shí)別

在Stanford Dogs數(shù)據(jù)集上，MobileNet在大大減少計(jì)算量和參數(shù)量的情況下取得了state of the art的結(jié)果。

大尺度地理定位

PlaNet將確定拍攝照片的地點(diǎn)作為分類問題。該方法將地球劃分為一個(gè)地理單元網(wǎng)格，用作目標(biāo)類別，并使用卷積神經(jīng)網(wǎng)絡(luò)對數(shù)百萬帶有地理標(biāo)記的照片進(jìn)行訓(xùn)練。PlaNet夠成功地定位各種各樣的照片，并且遠(yuǎn)勝解決相同任務(wù)的Im2GPS。

使用MobileNet取代原有Inception V3在相同的數(shù)據(jù)上重新訓(xùn)練PlaNet。如上表所示，相比原版PlaNet，MobileNet版本性能略有下降，但其仍大幅優(yōu)于Im2GPS。

人臉屬性分類

使用蒸餾（在模型壓縮中提到過）技術(shù)訓(xùn)練MobileNet用于人臉屬性分類，結(jié)果很優(yōu)秀。注意到在該任務(wù)中，mAP對大幅度的模型縮減表現(xiàn)得很有彈性，這也表明了合理的選擇上述兩個(gè)超參數(shù)可以在大幅提高效率的同時(shí)保證性能。

目標(biāo)檢測

在MS COCO目標(biāo)檢測數(shù)據(jù)集上，使用MobileNet替換SSD、Faster-RCNN等通用目標(biāo)檢測框架中原有的網(wǎng)絡(luò)。

人臉識(shí)別

FaceNet是一個(gè)state of the art的人臉識(shí)別模型，使用蒸餾技術(shù)在FaceNet模型的指導(dǎo)下訓(xùn)練MobileNet。

總結(jié)

MobileNets是基于depthwise separable卷積設(shè)計(jì)出的一系列卷積神經(jīng)網(wǎng)絡(luò)，其能夠在保證性能的情況下，大幅縮減模型大小和計(jì)算量。文中通過不同任務(wù)下的對比實(shí)驗(yàn)，已表明其有效性和普適性，能夠勝任深度學(xué)習(xí)模型在智能手機(jī)等計(jì)算受限情況下的實(shí)際部署。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

7組-MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

7組-MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

主要貢獻(xiàn)

研究背景及動(dòng)機(jī)