19.深度學(xué)習(xí)之計(jì)算機(jī)視覺(jué)-3

19.1 交并比

  • 如果該目標(biāo)的真實(shí)邊界框已知,這里的“較好”該如何量化呢?
    • 一種直觀的方法是衡量錨框和真實(shí)邊界框之間的相似度。
    • Jaccard系數(shù)(Jaccard index)可以衡量?jī)蓚€(gè)集合的相似度。
    • 給定集合A和B,它們的Jaccard系數(shù)即二者交集大小除以二者并集大?。?/p>


  • 實(shí)際上,可以把邊界框內(nèi)的像素區(qū)域看成是像素的集合。
  • 如此一來(lái),可以用兩個(gè)邊界框的像素集合的Jaccard系數(shù)衡量這兩個(gè)邊界框的相似度。
  • 當(dāng)衡量?jī)蓚€(gè)邊界框的相似度時(shí),通常將Jaccard系數(shù)稱為交并比(Intersection over Union,IoU),即兩個(gè)邊界框相交面積與相并面積之比,如圖所示。
    • 交并比的取值范圍在0和1之間:0表示兩個(gè)邊界框無(wú)重合像素,1表示兩個(gè)邊界框相等。


    • 交并比是兩個(gè)邊界框相交面積與相并面積之比

19.2 標(biāo)注訓(xùn)練集的錨框

  • 在訓(xùn)練集中,將每個(gè)錨框視為一個(gè)訓(xùn)練樣本
  • 為了訓(xùn)練目標(biāo)檢測(cè)模型,需要為每個(gè)錨框標(biāo)注兩類標(biāo)簽:
    • 一是錨框所含目標(biāo)的類別,簡(jiǎn)稱類別
    • 二是真實(shí)邊界框相對(duì)錨框的偏移量,簡(jiǎn)稱偏移量(offset)
  • 在目標(biāo)檢測(cè)時(shí),首先生成多個(gè)錨框,然后為每個(gè)錨框預(yù)測(cè)類別以及偏移量,接著根據(jù)預(yù)測(cè)的偏移量調(diào)整錨框位置從而得到預(yù)測(cè)邊界框,最后篩選需要輸出的預(yù)測(cè)邊界框
  • 在目標(biāo)檢測(cè)的訓(xùn)練集中,每個(gè)圖像已標(biāo)注了真實(shí)邊界框的位置以及所含目標(biāo)的類別
  • 在生成錨框之后,主要依據(jù)與錨框相似的真實(shí)邊界框的位置和類別信息為錨框標(biāo)注




  • 標(biāo)注錨框的類別和偏移量
    • 設(shè)錨框A及其被分配的真實(shí)邊界框B的中心坐標(biāo)分別為


    • A和B的寬分別為


    • 高分別為


    • 一個(gè)常用的技巧是將A的偏移量標(biāo)注為:


    • 其中常數(shù)的默認(rèn)值為


    • 如果一個(gè)錨框沒(méi)有被分配真實(shí)邊界框,只需將該錨框的類別設(shè)為背景。

    • 類別為背景的錨框通常被稱為負(fù)類錨框,其余則被稱為正類錨框。

19.3 輸出預(yù)測(cè)邊界框

  • 移除相似的預(yù)測(cè)邊界框:非極大值抑制(non-maximum suppression,NMS)。


  • 非極大值抑制的工作原理:
    • 對(duì)于一個(gè)預(yù)測(cè)邊界框B,模型會(huì)計(jì)算各個(gè)類別的預(yù)測(cè)概率。
    • 設(shè)其中最大的預(yù)測(cè)概率為p,該概率所對(duì)應(yīng)的類別即B的預(yù)測(cè)類別。
      • 將p稱為預(yù)測(cè)邊界框B的置信度
    • 在同一圖像上,將預(yù)測(cè)類別非背景的預(yù)測(cè)邊界框按置信度從高到低排序,得到列表L。
      • 從L中選取置信度最高的預(yù)測(cè)邊界框B1作為基準(zhǔn),將所有與B1的交并比大于某閾值的非基準(zhǔn)預(yù)測(cè)邊界框從L中移除。這里的閾值是預(yù)先設(shè)定的超參數(shù)。
      • 此時(shí),L保留了置信度最高的預(yù)測(cè)邊界框并移除了與其相似的其他預(yù)測(cè)邊界框。
  • 接下來(lái),從L中選取置信度第二高的預(yù)測(cè)邊界框B2作為基準(zhǔn),將所有與B2的交并比大于某閾值的非基準(zhǔn)預(yù)測(cè)邊界框從L中移除。
  • 重復(fù)這一過(guò)程,直到L中所有的預(yù)測(cè)邊界框都曾作為基準(zhǔn)。
  • 此時(shí)L中任意一對(duì)預(yù)測(cè)邊界框的交并比都小于閾值。
  • 最終,輸出列表L中的所有預(yù)測(cè)邊界框。


大數(shù)據(jù)視頻推薦:
騰訊課堂
CSDN
大數(shù)據(jù)語(yǔ)音推薦:
企業(yè)級(jí)大數(shù)據(jù)技術(shù)應(yīng)用
大數(shù)據(jù)機(jī)器學(xué)習(xí)案例之推薦系統(tǒng)
自然語(yǔ)言處理
大數(shù)據(jù)基礎(chǔ)
人工智能:深度學(xué)習(xí)入門到精通

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 今天感恩節(jié)哎,感謝一直在我身邊的親朋好友。感恩相遇!感恩不離不棄。 中午開(kāi)了第一次的黨會(huì),身份的轉(zhuǎn)變要...
    余生動(dòng)聽(tīng)閱讀 10,835評(píng)論 0 11
  • 彩排完,天已黑
    劉凱書(shū)法閱讀 4,470評(píng)論 1 3
  • 表情是什么,我認(rèn)為表情就是表現(xiàn)出來(lái)的情緒。表情可以傳達(dá)很多信息。高興了當(dāng)然就笑了,難過(guò)就哭了。兩者是相互影響密不可...
    Persistenc_6aea閱讀 129,613評(píng)論 2 7

友情鏈接更多精彩內(nèi)容