需求
做比賽時(shí)發(fā)現(xiàn)7個(gè)數(shù)目少的類別,map都是40,總體map是76,這幾個(gè)如果能做到80,那就有7*40 / 44 = 6個(gè)點(diǎn)的map增益,非??捎^,那就要好好看看為什么這些類map不行了,順便實(shí)驗(yàn)看看是漏檢影響大還是錯(cuò)減影響大
實(shí)現(xiàn)
先單獨(dú)訓(xùn)練,看看在干擾小的情況下現(xiàn)有標(biāo)注是否夠達(dá)到一個(gè)好的map,train: 150 val: 16 ap: 60





這6個(gè)gt是明顯出現(xiàn)漏檢的,總共23個(gè)gt, 看看auc曲線

想這種val中g(shù)t少的,如果能多幾個(gè)score不算低的的det,那整體auc曲線會(huì)右移不少,因?yàn)槎鄮讉€(gè)只要score不是很低,那么precision曲線趨勢(shì)會(huì)差不多,但recall會(huì)增多,腦補(bǔ)的話如圖所示

感覺可以增加不少,就算多幾個(gè)score都只有0.1,那也能把a(bǔ)uc的尾巴往右移有點(diǎn),如圖應(yīng)該也能曾一點(diǎn)

現(xiàn)在是漏檢6個(gè),相當(dāng)于score是0,對(duì)應(yīng)原圖的

相信看到這里對(duì)于小數(shù)據(jù)集漏檢的影響之大非常明顯,再探討一下為什么錯(cuò)減影響小,通常frcc結(jié)果正檢只有幾百,錯(cuò)檢有幾千,但mAP仍然還行,以及比賽trick中經(jīng)常會(huì)把score降到1e-5
思考兩秒
因?yàn)橐话阏龣z的score會(huì)比錯(cuò)檢高,auc的左半部分基本都是由高分的正檢在引導(dǎo),錯(cuò)減基本在右邊的末尾部分,在測(cè)試時(shí)降低score閾值,雖然引入了很多錯(cuò)檢,但只要模型問題不大,這些錯(cuò)檢的score都很低,同時(shí)但只要有個(gè)是檢測(cè)正確的,那么recall(TP / len(gt))會(huì)增加,那么曲線總會(huì)多一點(diǎn)點(diǎn)面積,比如

結(jié)論
對(duì)于小數(shù)據(jù),通過對(duì)難例進(jìn)行手動(dòng)標(biāo)注擴(kuò)增數(shù)據(jù)爭(zhēng)取把這些漏檢的找回來比什么都重要