為什么在煉丹術(shù)里拼精度的時(shí)候大家不看好one stage?
以yolov1為例,全卷積結(jié)構(gòu),我們知道最后的感受野就是個(gè)正方形,但是對(duì)應(yīng)的預(yù)測(cè)目標(biāo)一般都不是正方形,這就是所謂的特征不對(duì)齊。但是fastercnn里面巧妙的引入候選框,利用候選框來(lái)取特征,如果候選框夠準(zhǔn)的話,特征就對(duì)齊了(當(dāng)然候選框不可能準(zhǔn))
另外fastercnn里面head負(fù)責(zé)了最后的cls和bbox,這個(gè)我感覺(jué)有點(diǎn)難哦,一個(gè)特征負(fù)責(zé)兩個(gè)任務(wù),fc的擔(dān)子太重了,可不可以緩解
Double-Head RCNN 和 tsd都是從cls和bbox解耦的角度,前者是head解耦

后者是rpn之前的特征提取部分就開(kāi)始解耦

image