YOLO9000讀書筆記

??YOLOv2作為YOLO的第二個(gè)版本,在思想上仍然延續(xù)了YOLO的總體思路,還是單階段檢測(cè)。其實(shí),作者主要是結(jié)合了當(dāng)時(shí)其他人一些較好的方法或者techniques來改進(jìn)YOLO。
??1、Batch Normalization
??在每一個(gè)卷積層之后增加一個(gè)BN層。
??2、高分辨率
??增加輸入圖片的分辨率,首先用448 * 448的分辨率在ImageNet上訓(xùn)練10個(gè)epoches。然后把這個(gè)網(wǎng)絡(luò)經(jīng)過fine-tuning用于檢測(cè)。
??3、Convolutional with anchor boxes
??(1)借鑒faster r-cnn關(guān)于RPN的思想,在特征圖的每一個(gè)格子中手動(dòng)生成anchor。關(guān)于定位,預(yù)測(cè)的是坐標(biāo)的偏移量而不是直接預(yù)測(cè)坐標(biāo),這樣有助于網(wǎng)絡(luò)學(xué)習(xí)。
??(2)去除了YOLO中的全連接層,去除了最后一個(gè)池化層。以416 * 416為輸入的分辨率,最終的輸出經(jīng)過了32倍下采樣,因此輸出的結(jié)果是13 * 13。(因?yàn)閅OLO是以格子來預(yù)測(cè)物體,所以奇數(shù)個(gè)格子可以確保物體的中心只落在一個(gè)格子中)
??(3)從格子中解耦關(guān)于物體概率的預(yù)測(cè),而把這個(gè)工作交給bounding box來完成。因此,每一個(gè)bounding box輸出的結(jié)果維度是:25(4個(gè)坐標(biāo)+1個(gè)置信度+20個(gè)分類概率)
??4、Dimension cluster
??作者通過對(duì)gt_box聚類的方法,最終選取了5種不同形狀的bounding box(對(duì)比faster r-cnn是采用了9種不同的anchor),這種方法選取的anchor更具有針對(duì)性。聚類的結(jié)果顯示:這5種anchor的形狀大多是瘦高形狀的,矮胖型的很少。
??5、Direct location prediction
??關(guān)于坐標(biāo)的預(yù)測(cè)問題,作者改變了faster r-cnn中關(guān)于中心點(diǎn)坐標(biāo)偏移量的預(yù)測(cè)方法,而對(duì)寬度和高度的縮放量進(jìn)行預(yù)測(cè)則是和faster r-cnn中一致。
??為什么要這么做呢?作者認(rèn)為產(chǎn)生的bounding box有可能出現(xiàn)在任何位置,這樣會(huì)導(dǎo)致收斂困難。
??( ps:我覺得作者的想法有待商榷,因?yàn)樵趂aster r-cnn中,會(huì)計(jì)算每個(gè)anchor和gt_box的IOU,如果IOU大于閾值0.7,那么對(duì)應(yīng)的anchor才會(huì)被采用,如果0.3<IOU<0.7,那么這種anchor會(huì)被舍棄。也就是說,我們需要回歸的目標(biāo)anchor都被限制在了gt_box周圍的一定范圍之內(nèi)。)
??從作者提供的公式來看(簡(jiǎn)書不支持公式,就不上公式了),處理方式還是延續(xù)了YOLO的思想,計(jì)算bounding box的中心點(diǎn)和所在格子左上角坐標(biāo)的偏移量,來達(dá)到歸一化的目的。這種做法,會(huì)把bounding box的中心點(diǎn)限制在每個(gè)格子距離為1的范圍之內(nèi),確實(shí)可以加快收斂的速度。
??6、Fine-Grained Features
??YOLOv2在最后生成的13 * 13的特征圖上進(jìn)行檢測(cè),對(duì)于大目標(biāo)的物體來說是足夠 的。但是,對(duì)于小物體的檢測(cè)能不能提高效果呢?所以,作者借鑒了SSD中在不同的feature map上進(jìn)行檢測(cè)的方法(在前面的特征圖中檢測(cè)小目標(biāo),在后面的特征圖中檢測(cè)大目標(biāo))。
??但是,實(shí)現(xiàn)的方法和SSD中不同,作何借鑒了ResNet中的思想,增加了一個(gè)passthrough層來實(shí)現(xiàn)。作者把倒數(shù)第2層,即 26 * 26 * 512這個(gè)feature map直接進(jìn)行reshape,變成 13 * 13 * 2048,然后把它和最后一層13 * 13的feature map進(jìn)行concat。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 前言:離上一次在公眾號(hào)上上新又有一段時(shí)間了。期間,陸續(xù)零碎地記錄了一些文字,終不能成文。公眾號(hào)自從拿到原創(chuàng)標(biāo)后也確...
    田螺姑娘FZ閱讀 325評(píng)論 0 0
  • 工作上,很不順,昨天。包括今天也是,有報(bào)名可是很可能不會(huì)被選上,因?yàn)橹挥?0個(gè)名額,且原則上25周歲、已婚已育者優(yōu)...
    耕吧閱讀 349評(píng)論 0 0
  • ——作者絳妖精 很多時(shí)候,當(dāng)一個(gè)女人拼盡全力為一個(gè)男人付出一切的時(shí)候,等待她的并不一定是繁花...
    賀氏育發(fā)堂閱讀 384評(píng)論 0 0
  • “思想改變行動(dòng), 行動(dòng)改變習(xí)慣, 習(xí)慣改變性格 ,性格改變命運(yùn)?!钡矣X得一個(gè)好習(xí)慣是最重要的,一個(gè)一個(gè)好習(xí)慣的養(yǎng)...
    小丸子ariel閱讀 4,336評(píng)論 0 15
  • 開張新的
    一臨江仙閱讀 197評(píng)論 0 5

友情鏈接更多精彩內(nèi)容