[目標(biāo)檢測(cè)][SSD] 1 摘要

這篇文章主要介紹經(jīng)典的神經(jīng)網(wǎng)絡(luò)SSD的原論文的摘要部分。論文地址:論文地址。



標(biāo)題


標(biāo)題:SSD: Single Shot MultiBox Detector

解讀:這是一個(gè)經(jīng)典的one-stage(單階段)目標(biāo)檢測(cè)網(wǎng)絡(luò),單階段和雙階段的區(qū)別在于:?jiǎn)坞A段無(wú)序額外生成候選框,只需要把網(wǎng)絡(luò)的中間過(guò)程,或者是最后一層的feature map提取出來(lái),在feature map的基礎(chǔ)上生成default box。雙階段需要專門(mén)的網(wǎng)絡(luò)在原圖上生成候選框,比如,R-CNN利用selective search(SS)算法生成候選框,F(xiàn)aster R-CNN利用RPN生成候選框。


摘要


原文:We present a method for detecting objects in images using a single deep neural network. Our approach, named SSD, discretizes the output space of bounding boxes into a set of default boxes over different aspect ratios and scales per feature map location.

翻譯:我們提出了一個(gè)用于目標(biāo)檢測(cè)的單階段深層神經(jīng)網(wǎng)絡(luò)的方法。我們的方法叫做SSD,在每個(gè)特征圖中裁剪不同長(zhǎng)寬比和尺度的default box。

解讀:本文中提出的SSD網(wǎng)絡(luò),可以在特征圖的基礎(chǔ)上,生成不同長(zhǎng)寬比以及不同大小的default box。

原文:At prediction time, the network generates scores for the presence of each object category in each default box and produces adjustments to the box to better match the object shape.

翻譯:在預(yù)測(cè)階段,網(wǎng)絡(luò)會(huì)生成每個(gè)default box在每個(gè)類別下的分?jǐn)?shù),并且對(duì)default box進(jìn)行調(diào)整以更好的匹配目標(biāo)的形狀。

解讀:在預(yù)測(cè)階段,網(wǎng)絡(luò)會(huì)做兩件事,第一是生成每個(gè)default box的置信度,這個(gè)置信度是針對(duì)每個(gè)類別?還會(huì)對(duì)每個(gè)default box進(jìn)行大小和位置的調(diào)整。

原文:Additionally, the network combines predictions from multiple feature maps with different resolutions to naturally handle objects of various sizes. SSD is simple relative to methods that require object proposals because it completely eliminates proposal generation and subsequent pixel or feature resampling stages and encapsulates all computation in a single network.

翻譯:with different resolutions(不同的分辨率),eliminates(消除,排除),subsequent(隨后的,后來(lái)的),resampling(重采樣),encapsulates all computation(封裝所有的計(jì)算)

另外,網(wǎng)絡(luò)結(jié)合了不同分辨率的多個(gè)特征圖產(chǎn)生的預(yù)測(cè)值,進(jìn)而檢測(cè)多種尺度的目標(biāo)。SSD完全消除了建議框的生成,并且在隨后的像素和特征重采樣以及封裝所有的計(jì)算,所有的步驟都集中到了一個(gè)網(wǎng)絡(luò)中,從這個(gè)方面來(lái)說(shuō),SSD是一個(gè)簡(jiǎn)單的網(wǎng)絡(luò)。

解讀:SSD的簡(jiǎn)單性體現(xiàn)在,所有的過(guò)程都集中到了一個(gè)網(wǎng)絡(luò)中,不需要分成多個(gè)網(wǎng)絡(luò),分階段進(jìn)行檢測(cè)。

原文:This makes SSD easy to train and straightforward to integrate into systems that require a detection component. Experimental results on the PASCAL VOC, COCO, and ILSVRC datasets confirm that SSD has competitive accuracy to methods that utilize an additional object proposal step and is much faster, while providing a unified framework for both training and inference.

翻譯:PASCAL VOC(有20個(gè)分類),COCO(微軟出資標(biāo)注的,有80個(gè)類別),ILSVRC(競(jìng)賽?)

SSD比較容易去訓(xùn)練,并且如果一個(gè)系統(tǒng)需要檢測(cè)的組件,SSD也比較容易集成到系統(tǒng)中。SSD在各個(gè)數(shù)據(jù)集上的表現(xiàn)(準(zhǔn)確率和速度)都比較好,同時(shí)為訓(xùn)練和推理提供統(tǒng)一的框架。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容