《FCOS: Fully Convolutional One-Stage Object Detection》發(fā)表于ICCV2019
代碼地址:https://github.com/tianzhi0549/FCOS/
這篇文章主要是覺得現(xiàn)有的基于anchor的目標檢測器存在一些缺點:
- 檢測結(jié)果對于anchor的大小,尺度比例,數(shù)量比較敏感
- 即使認真的調(diào)好的上述參數(shù),檢測器對于GT變化較大,特別是小物體效果較差
- 為了獲得較高的召回率,基于anchor的檢測器需要大量的anchor
- anchor會涉及一些復雜的計算,比如計算anchor與GT的IoU
一、網(wǎng)絡結(jié)構(gòu)
該文章的網(wǎng)絡結(jié)構(gòu)如下圖所示

可以看出,網(wǎng)絡結(jié)構(gòu)還是backbone+fpn的結(jié)構(gòu)。文中backbone采用的是resnet50。FPN結(jié)構(gòu)中,中
分別是
分別接一個
的卷積接上上一層的結(jié)果(這里的連接要看具體實現(xiàn),可能是concate也可能是加),
分別是
通過一個stride為2的卷積得到。這樣得到的
對應原圖縮小的尺度分別是8,16,32,64,128。
網(wǎng)絡的輸入下面詳解介紹GT的產(chǎn)生。網(wǎng)絡的輸出的head部分有三個分支,其中classification和regression分支與其它檢測器是一樣的,另外網(wǎng)絡還加了一個叫Center-ness的分支,要了解這個分支要先知道網(wǎng)絡的GT是什么,下面先介紹網(wǎng)絡的標簽生成。
二、網(wǎng)絡的標簽生成
2.1 樣本的標簽生成
不同于基于anchor的方法(通過回歸anchor的坐標點來獲得預測框),本文的做法是通過直接回歸對應點到GT的四條邊的距離來獲得預測框。
上述FPN輸出的feature map這里用表示,在
上坐標為(x,y)的點,對應到原圖的坐標為
,如果該點在標注框內(nèi),我們將它定義為正樣本,否則為負樣本。
對于一個標注框{B_i}來說,這里,其中
表示標注框的左上角,
表示標注框的右下角,
表示標注框的所屬類別。對于一個圖像中(注意這里是圖像中,不是上述的featuremap中),一個在標注框內(nèi)坐標為(x,y)的正樣本,GT用下述公式表示:
類別標簽對于正樣本來說就是,對于負樣本來說為0。
回歸目標如下圖所示

2.2 正負樣本在不同F(xiàn)PN層的分配
因為采用了FPN的結(jié)構(gòu),在基于anchor的算法中,通過anchor的大小,將anchor分配給不同的FPN輸出層。對于本文算法來說將正樣本分配給不同F(xiàn)PN層的規(guī)則如下:
如果或
,那么
上滿足條件的為負樣本。換句話說就是在
上滿足
條件的點位正樣本。文章規(guī)定
大小為0, 64, 128, 256, 512,
。
2.3 模棱兩可的正樣本分配問題
在實際情況中,框可能存在重疊問題,那么就會有重疊區(qū)域的像素可以對應于兩個或者多個標注框,文章將這種模棱兩可的正樣本分配給面積小的框,即這類的點用來回歸小框。
三、網(wǎng)絡的loss函數(shù)
與其他的目標檢測類似,網(wǎng)絡的loss函數(shù)可以用下式表示:
其中使用的是focal loss,
使用的是IOU loss,
表示的是正樣本的個數(shù),這里
取1,
表示當
時值取1否則取0。
這里只使用了兩個分支,通過上述結(jié)構(gòu)和loss實驗發(fā)現(xiàn)FCOS的結(jié)果與基于anchor的方法的結(jié)果還是存在一些差距。觀察發(fā)現(xiàn),造成這種現(xiàn)象的原因是一些遠離標注框中心的點預測出來的框質(zhì)量較低,為了改善這一現(xiàn)象,文中提出了centerness的概念。
centerness就是在原網(wǎng)絡分類分支上加了一個sibling分支,這個分支的作用是來描述正樣本點對于待預測的標注框中心點的歸一化距離的大小。對于這個分支待預測的目標,也就是該分支的GT為
這個目標值的范圍為0-1,所以這個分支的loss采用交叉熵loss計算。
對于測試階段,預測框的分數(shù)為分類分支的結(jié)果乘以centerness分支預測的結(jié)果,這樣對于離標注框中心較遠的點預測的分數(shù)有一定的權(quán)重衰減,從而提高最終網(wǎng)絡的輸出質(zhì)量。centerness的預測目標如下圖所示,圖中紅色表示1藍色表示0,其它顏色在0-1之間。

到這里FCOS算法就介紹完了,詳細的實驗結(jié)果可以查看原文了解。