目標(biāo)檢測(cè)特征不對(duì)齊問(wèn)題的碎碎念

為什么在煉丹術(shù)里拼精度的時(shí)候大家不看好one stage?

以yolov1為例,全卷積結(jié)構(gòu),我們知道最后的感受野就是個(gè)正方形,但是對(duì)應(yīng)的預(yù)測(cè)目標(biāo)一般都不是正方形,這就是所謂的特征不對(duì)齊。但是fastercnn里面巧妙的引入候選框,利用候選框來(lái)取特征,如果候選框夠準(zhǔn)的話,特征就對(duì)齊了(當(dāng)然候選框不可能準(zhǔn))

另外fastercnn里面head負(fù)責(zé)了最后的cls和bbox,這個(gè)我感覺(jué)有點(diǎn)難哦,一個(gè)特征負(fù)責(zé)兩個(gè)任務(wù),fc的擔(dān)子太重了,可不可以緩解

Double-Head RCNN 和 tsd都是從cls和bbox解耦的角度,前者是head解耦



后者是rpn之前的特征提取部分就開(kāi)始解耦


image
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容