滑動(dòng)窗口檢測器

自從 AlexNet 獲得 ILSVRC 2012 挑戰(zhàn)賽冠軍后,用 CNN 進(jìn)行分類成為主流。一種用于目標(biāo)檢測的暴力方法是從左到右、從上到下滑動(dòng)窗口,利用分類識(shí)別目標(biāo)。為了在不同觀察距離處檢測不同的目標(biāo)類型,需要使用不同大小和寬高比的窗口。

滑動(dòng)窗口(從左到右,從上到下)

我們根據(jù)滑動(dòng)窗口從圖像中剪切圖像塊。由于很多分類器只取固定大小的圖像,因此這些圖像塊是經(jīng)過變形轉(zhuǎn)換的。但是,這不影響分類準(zhǔn)確率,因?yàn)榉诸惼骺梢蕴幚碜冃魏蟮膱D像。

將圖像變形轉(zhuǎn)換成固定大小的圖像

變形圖像塊被輸入 CNN 分類器中,提取出 4096 個(gè)特征。之后,我們使用 SVM 分類器識(shí)別類別和該邊界框的另一個(gè)線性回歸器。


滑動(dòng)窗口檢測器的系統(tǒng)工作流程圖
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容