目標(biāo)檢測|實(shí)戰(zhàn)總結(jié)

1.實(shí)現(xiàn)ssd-keras實(shí)時(shí)目標(biāo)檢測算法,并制作十張圖片的測試集。效果一般。ssd算法是繼faster-rcnn與yolo之后的又一力作。來自UNC團(tuán)隊(duì)2016年發(fā)表在ECCV上。SSD最大的特點(diǎn)就是在較高的準(zhǔn)確率下實(shí)現(xiàn)較好的檢測準(zhǔn)確度。并非為兩種模型:SSD300(300*300輸入圖片),SSD500(512*512輸入圖片)。當(dāng)然輸入圖片的尺寸越大,往往會(huì)得到更好的檢測準(zhǔn)確率,但同時(shí)也帶來顯存開銷過大與設(shè)備性能要求較高等問題。在實(shí)際的上手操作中,測試效果一般。因?yàn)槭侵苯釉趃ithub上clone -recursive下來,并按照說明進(jìn)行配置運(yùn)行。而且還沒有整理好自己的數(shù)據(jù)集,故也就不需要訓(xùn)練,驗(yàn)證并fine-tine超參數(shù)等一系列操作。。同時(shí)也沒有什么好的想法去在SSD基礎(chǔ)卷積網(wǎng)絡(luò)結(jié)構(gòu)上做改進(jìn)優(yōu)化的小點(diǎn)子-_-||。。所以也沒什么好說的。。。因?yàn)橛?xùn)練比較麻煩故用的是在voc07+12 SSD300訓(xùn)練好的模型。并用了下voc2007測試集測試集簡單跑了下。簡單修改了下路徑函數(shù)實(shí)現(xiàn)了幾張本地圖片的檢測。。另外中間有一個(gè)小插曲,因?yàn)轭}主用的顯卡是GTX1060,只有6G顯存,當(dāng)時(shí)訓(xùn)練報(bào)錯(cuò)out of memory也是很郁悶。。嘗試簡單改小batch_size再次嘗試訓(xùn)練還是out of memory于是就放棄了訓(xùn)練。。對了,另外用ssd500測試的時(shí)候也出樣同種情況。。當(dāng)然git主不只提供了基于VOC的訓(xùn)練模型,同時(shí)也提供COCO與ILSVRC的預(yù) 訓(xùn)練模型。。這主要根據(jù)自己的真實(shí)需求選擇不同的訓(xùn)練模型,類別數(shù)依次遞增。當(dāng)然也用到些基本技能:jupyter notebook遠(yuǎn)程連接服務(wù)器:172.xx.xx.xx:端口號很方便。還有兩大神器:xshell(雖然不知道筆記本為啥不能免費(fèi)試用從而轉(zhuǎn)戰(zhàn)了putty),winscp(好用的文件傳輸誰用誰知道)。

2.接下來就準(zhǔn)備簡單搞一下yolo了 ,目前檢測方面速度最快的算法之一。直接使用的官方y(tǒng)olo-darknet。配置比較簡單,直接實(shí)現(xiàn)也沒什么好說的。。只是實(shí)時(shí)測試中yolo達(dá)到19fps,tiny-yolo達(dá)到75fps左右。yolo明顯比tiny-yolo識別精度要高一些。另外又簡單搞了下yolov3,確實(shí)有所提升yolov3達(dá)到27fps。

3.另外又搞了下faster-rcnn基于tensflow的。這個(gè)就跟沒什么好說的了。。選用resnet101預(yù)訓(xùn)練于VOC07+12的模型。在自制十張小數(shù)據(jù)集上小測一番,表現(xiàn)略高于前兩者,因?yàn)閿?shù)據(jù)集特殊故可以肉眼看出。

最后吐槽一下,目標(biāo)檢測近幾年真是發(fā)展迅猛,從yolo系列的高速單步檢測到faster-rcnn系列基于候選區(qū)域的較高精度檢測。再到SSD的改進(jìn)(提高了精度與達(dá)到了不錯(cuò)的速度)。再有后者的基于FPN與Focal loss的Retinanet(特征金字塔,焦點(diǎn)損失)。再有網(wǎng)絡(luò)結(jié)構(gòu)的改進(jìn)之Resnext,號稱真正改良了Resnet殘差網(wǎng)絡(luò),通過增加path的方式減少了參數(shù)量提升了表現(xiàn),優(yōu)于對寬度或深度做改變。再有就是Frcn,同樣號稱是檢測界的一項(xiàng)重大突破,同樣是減少參數(shù)量,使得再次增加網(wǎng)絡(luò)深度成為可能,并在檢測中有著不俗的表現(xiàn)。一入檢測深似海,學(xué)習(xí)永遠(yuǎn)在路上。

最拋幾個(gè)常用關(guān)鍵字吧:

batch size ;batch normalization;filter size;SGD;BGD;dropout;rule;softmax;卷積與全連接;thresholdre等。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容