1. 基于區(qū)域建議的目標檢測與識別算法
- R-CNN(Selective Search + CNN + SVM)
- SPP-net(ROI Pooling)
- Fast R-CNN(Selective Search + CNN + ROI)
-
Faster R-CNN(RPN + CNN + ROI)
具體可參見這里
2. 基于回歸的目標檢測與識別算法
-
YOLO
- 基本思想
使用了回歸的思想,利用整張圖作為網(wǎng)絡的輸入,直接在圖像的多個位置上回歸出這個位置的目標邊框,以及目標所屬的類別。
- 一般步驟
(1) 給定一個輸入圖像,首先將圖像劃分成7*7的網(wǎng)格。
(2) 對于每個網(wǎng)格,我們都預測2個邊框(包括每個邊框是目標的置信度以及每個邊框區(qū)域在多個類別上的概率)。
(3) 根據(jù)上一步可以預測出7*7*2個目標窗口,然后根據(jù)閾值去除可能性比較低的目標窗口,最后NMS去除冗余窗口即可。(NMS --- 非極大值抑制) - SSD
SSD結合YOLO的回歸思想以及Faster R-CNN的anchor機制使得精確度更高,速度更快。