Alignment
由于每個 anchor 都是由 feature map 上的一個點表示,那么這個 anchor 最好是以這個點為中心,否則位置偏了的話,這個點的 feature 和這個 anchor 就不是非常好地對應(yīng)起來,用該 feature 來預(yù)測 anchor 的分類和回歸會有問題。我們設(shè)計了類似 cascade/iterative RPN 的實驗來證明這一點,對 anchor 進(jìn)行兩次回歸,第一次回歸采用常規(guī)做法,即中心點和長寬都進(jìn)行回歸,這樣第一次回歸之后,anchor 中心點和 feature map 每一個像素的中心就不再完全對齊。我們發(fā)現(xiàn)這樣的兩次 regress 提升十分有限。所以我們在形狀預(yù)測分支只對 w 和 h 做預(yù)測,而不回歸中心點位置。
Consistency
這條準(zhǔn)則是我們設(shè)計 feature adaption 的初衷,由于每個位置 anchor 形狀不同而破壞了特征的一致性,我們需要通過 feature adaption 來進(jìn)行修正。這條準(zhǔn)則本質(zhì)上是對于如何準(zhǔn)確提取 anchor 特征的討論。對于兩階段檢測器的第二階段,我們可以通過 RoI Pooling 或者 RoI Align 來精確地提取 RoI 的特征。但是對于 RPN 或者單階段檢測器的 anchor 來說,由于數(shù)量巨大,我們不可能通過這種 heavy 的方法來實現(xiàn)特征和框的精確 match,還是只能用特征圖上一個點,也就是 512x1x1 的向量來表示。那么 Feature Adaption 起到了一個讓特征和 anchor 對應(yīng)更加精確的作用,這種設(shè)計在其他地方也有可以借鑒之處。