20.深度學(xué)習(xí)之計(jì)算機(jī)視覺-4

20.1 多尺度目標(biāo)檢測(cè)

  • 在錨框中,在以輸入圖像的每個(gè)像素為中心生成多個(gè)錨框。
  • 這些錨框是對(duì)輸入圖像不同區(qū)域的采樣。然而,如果以圖像每個(gè)像素為中心都生成錨框,很容易生成過多錨框而造成計(jì)算量過大
  • 減少錨框個(gè)數(shù)
    • 在輸入圖像中均勻采樣一小部分像素,并以采樣的像素為中心生成錨框
    • 在不同尺度下,可以生成不同數(shù)量和不同大小的錨框
    • 較小目標(biāo)比較大目標(biāo)在圖像上出現(xiàn)位置的可能性更多
  • 既然已在多個(gè)尺度上生成了不同大小的錨框,相應(yīng)地,需要在不同尺度下檢測(cè)不同大小的目標(biāo)
  • 基于卷積神經(jīng)網(wǎng)絡(luò)的方法
    • 在某個(gè)尺度下,假設(shè)依據(jù)Ci張形狀為h×w的特征圖生成h×w組不同中心的錨框,且每組的錨框個(gè)數(shù)為a ? 例如,在第一個(gè)尺度下,依據(jù)10(通道數(shù))張形狀為4×4的特征圖生成了16組不同中心的錨框,且每組含3個(gè)錨框
    • 接下來,依據(jù)真實(shí)邊界框的類別和位置,每個(gè)錨框?qū)⒈粯?biāo)注類別和偏移量
    • 在當(dāng)前的尺度下,目標(biāo)檢測(cè)模型需要根據(jù)輸入圖像預(yù)測(cè)h×w組不同中心的錨框的類別和偏移量
  • 假設(shè)這里的Ci張?zhí)卣鲌D為卷積神經(jīng)網(wǎng)絡(luò)根據(jù)輸入圖像做前向計(jì)算所得的中間輸出。
  • 既然每張?zhí)卣鲌D上都有h×w個(gè)不同的空間位置,那么相同空間位置可以看作含有Ci個(gè)單元。
  • 將特征圖在相同空間位置的ci個(gè)單元變換為以該位置為中心生成的a個(gè)錨框的類別和偏移量。
  • 本質(zhì)上,用輸入圖像在某個(gè)感受野區(qū)域內(nèi)的信息來預(yù)測(cè)輸入圖像上與該區(qū)域位置相近的錨框的類別和偏移量。
  • 當(dāng)不同層的特征圖在輸入圖像上分別擁有不同大小的感受野時(shí),它們將分別用來檢測(cè)不同大小的目標(biāo)。
    • 例如,可以通過設(shè)計(jì)網(wǎng)絡(luò),令較接近輸出層的特征圖中每個(gè)單元擁有更廣闊的感受野,從而檢測(cè)輸入圖像中更大尺寸的目標(biāo)。

20.2 目標(biāo)檢測(cè)算法分類

  • 基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法主要分為兩類:
    • Two stage目標(biāo)檢測(cè)算法
      • 任務(wù):特征提取—>生成RP—>分類/定位回歸
      • 常見的two stage目標(biāo)檢測(cè)算法有:R-CNN、Fast R-CNN、Faster R-CNN和R-FCN等
    • One stage目標(biāo)檢測(cè)算法
      • 任務(wù):特征提取—>分類/定位回歸
      • 常見的one stage目標(biāo)檢測(cè)算法有:OverFeat、YOLOv1、YOLOv2、YOLOv3和SSD等

20.2.1 SSD( Single Shot multibox Detection )

  • SSD屬于one-stage方法。
    • SSD使用 VGG16 網(wǎng)絡(luò)作為特征提取器,將后面的全連接層替換成卷積層,并在之后添加自定義卷積層,并在最后直接采用卷積進(jìn)行檢測(cè)。
    • 在多個(gè)特征圖上設(shè)置不同縮放比例和不同寬高比的先驗(yàn)框以融合多尺度特征圖進(jìn)行檢測(cè),靠前的大尺度特征圖可以捕捉到小物體的信息,而靠后的小尺度特征圖能捕捉到大物體的信息,從而提高檢測(cè)的準(zhǔn)確性和定位的準(zhǔn)確性。
  • 如下圖是SSD的網(wǎng)絡(luò)結(jié)構(gòu)圖


  • 怎樣創(chuàng)建錨框?
    • SSD在多個(gè)特征層上取錨框,可以得到不同尺度的錨框。
    • 在特征圖的每個(gè)單元上取不同寬高比的錨框,一般寬高比在{1,2,3,1/2,1/3}中選取
    • 如圖所示,在8x8的feature map和4x4的feature map上的每個(gè)單元取4個(gè)不同的錨框。


大數(shù)據(jù)視頻推薦:
騰訊課堂
CSDN
大數(shù)據(jù)語音推薦:
企業(yè)級(jí)大數(shù)據(jù)技術(shù)應(yīng)用
大數(shù)據(jù)機(jī)器學(xué)習(xí)案例之推薦系統(tǒng)
自然語言處理
大數(shù)據(jù)基礎(chǔ)
人工智能:深度學(xué)習(xí)入門到精通

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容