@Congc_fdd6 謝謝,4倍下采樣后,特征圖的HW也有128*128,物體在特征圖的大小假設(shè)是h=50,w=20,我還是覺得能feanture map能直接輸出這么大的數(shù)字很不可思議
CenterNet:Objects as Points整體信息: 這篇文章題目言簡意賅,就非常吸引人眼球。不同于CornerNet預(yù)測一對角點(diǎn)得到bbox,以及基于CornerNet改進(jìn)的CenterNet預(yù)測三個點(diǎn)得到bbo...
@Congc_fdd6 謝謝,4倍下采樣后,特征圖的HW也有128*128,物體在特征圖的大小假設(shè)是h=50,w=20,我還是覺得能feanture map能直接輸出這么大的數(shù)字很不可思議
CenterNet:Objects as Points整體信息: 這篇文章題目言簡意賅,就非常吸引人眼球。不同于CornerNet預(yù)測一對角點(diǎn)得到bbox,以及基于CornerNet改進(jìn)的CenterNet預(yù)測三個點(diǎn)得到bbo...
“而目標(biāo)的長和寬是經(jīng)過對應(yīng)當(dāng)前中心點(diǎn)的w和h回歸得到的。”
你的意思是預(yù)測順序是 原圖->熱力點(diǎn)->中心點(diǎn)->w,h? 但是最后output通道里同時包含heatmap和w,h的呀,通道size也一致,說明heatmap中任何一個坐標(biāo)都有其對應(yīng)的w,h值,并不是回歸中心點(diǎn)得到的,中心點(diǎn)的坐標(biāo)并沒有先驗性地參與w,h的計算,它們是同時得到的。 還有,w,h真的可以直接在輸出特征圖里顯示地表達(dá)嗎?w,h一般是幾十幾百大數(shù)字,而神經(jīng)網(wǎng)絡(luò)的輸出一般是小數(shù)字,跟我意識里的神經(jīng)網(wǎng)絡(luò)相差很大。在VOC數(shù)據(jù)集中有沒有分別統(tǒng)計大中小目標(biāo)的準(zhǔn)確率呢?
CenterNet:Objects as Points整體信息: 這篇文章題目言簡意賅,就非常吸引人眼球。不同于CornerNet預(yù)測一對角點(diǎn)得到bbox,以及基于CornerNet改進(jìn)的CenterNet預(yù)測三個點(diǎn)得到bbo...
網(wǎng)絡(luò)的實際輸出是熱力圖上的每個類別的峰值,這與PoseNet以及其他所有的姿態(tài)檢測網(wǎng)絡(luò)類似,但當(dāng)我們知道了這些峰值之后,如何回歸出需要的box呢?
做法是將熱力圖上的所有響應(yīng)點(diǎn)與其連接的8個臨近點(diǎn)進(jìn)行比較,如果該點(diǎn)響應(yīng)值大于或等于其八個臨近點(diǎn)值則保留,最后我們保留所有滿足之前要求的前100個峰值點(diǎn)。
(這里還是沒說清楚怎么從100個峰值點(diǎn)回歸出寬高的?。?
CenterNet網(wǎng)絡(luò)精讀與分析近期CVPR2019的最新論文CenterNet在一篇文章中就提出了一個能夠解決目標(biāo)檢測、姿態(tài)檢測、3D單目檢測的掉炸天網(wǎng)絡(luò),一時間激起來了千層波浪。這幾乎是未來目標(biāo)檢測一個...