畢業(yè)設(shè)計的外文翻譯Pedestrian detection at 100 frames per second,并結(jié)合部分自己的理解進行整理。
特征提取
基于“積分通道特征”的思想,是簡單的矩形特征在給定的圖像區(qū)域上對濾波響應(yīng)進行求和。對于行人檢測,它顯示使用6個量化方向,1個梯度幅值和3個LUV顏色通道來獲得最新的結(jié)果。
論文貢獻
- 1.目標檢測沒有使用圖像尺寸改變。
- 2.使用stixels的目標檢測。
實現(xiàn)方法
傳統(tǒng)方法
一個明確的類對象檢測器產(chǎn)生正確數(shù)量的對象實例,包括它們的位置和尺寸。最常用的對象檢測器為滑動窗口類型。
我們訓(xùn)練尺度N分類器,數(shù)量通常是大約50個,但訓(xùn)練50個模型似乎是一項艱巨的任務(wù)。傳統(tǒng)的多尺度物體檢測方法以規(guī)范模型尺寸訓(xùn)練單個模型,然后重新調(diào)節(jié)圖像N次。

在規(guī)模調(diào)整的圖像上使用規(guī)范模型尺度的檢測等同于不同尺度上的檢測。這種傳統(tǒng)的方法已被證明是有效的,但是它帶來了兩個問題:
- 1.訓(xùn)練規(guī)范的規(guī)模是微妙的,因為人們需要找到最佳的規(guī)模,并學(xué)習(xí)一個將在豐富的高分辨率尺度和模糊的低分辨率尺度之間進行權(quán)衡的模型。
- 2.在運行時,需要調(diào)整輸入圖像50次,重新計算圖像特征50次。
FPDW
FPDW方法核心的內(nèi)容在于相鄰尺度的特征響應(yīng)可以足夠精確近似。
每次調(diào)整圖像計算圖像特征,然后這些圖像特征在保持的N-N/K的尺度上輪流被用作接近特征響應(yīng)。通過減小圖像調(diào)整的數(shù)量和通過特征值K(大約為10)的特征計算,總的檢測次數(shù)顯著減少。
近似描述如下:

新的方法
核心觀點是把調(diào)整圖片尺寸時間從測試時間移到訓(xùn)練時間。
強分類器由一組決策樹建立而成,每個決策樹都包括三個樹樁分類器。每個樹樁分類器由信道索引,在這樣的信道上的矩形和決策閾值τ定義。當用一個相對比例因子s來重新縮放一個樹樁時,我們保持信道指數(shù)不變,通過s來縮放矩形,并更新閾值。
在測試時間上,我們使用所描述的近似方法將我們的N / K分類器轉(zhuǎn)換成N分類器(每個規(guī)模一個),我們計算原始輸入圖像上的積分信道特征,然后使用N分類器計算每個尺度的響應(yīng)。

利用幾何先驗知識
基于處理密集立體深度圖的常見方法是不行的,因為生成100Hz的深度圖本身就是一個挑戰(zhàn)。相反,我們遵循Benenson等人的方法。其中地面以上的物體使用所謂的“stixel世界模型”(stixel≈伸出在圖像的地面以上)建模。對于圖像中的每一列,底部像素,頂部像素和估計距離(未分類)的物體。這種方法的關(guān)鍵特征是,可以直接從立體圖像中估計stixel世界模型,而無需計算完整的深度圖。
