前面文章用Caltech數(shù)據(jù)制作成VOC形式,但在實(shí)際訓(xùn)練的時(shí)候仍然有挺多問題,所需文件如下。

主要是Annotations的問題,有如下幾點(diǎn)需要注意:
-
1 Annotations中要包含所有圖片的信息,即使對應(yīng)圖片中沒有行人數(shù)據(jù),但仍需要xml文件,即有多少張圖片就有多少xml。
- 2 注意box的邊界大小,Xmin,Xmax,Ymin,Ymax都需要注意,不要越界,否則會(huì)報(bào)錯(cuò)(可以在生成xml代碼中就對這幾個(gè)參數(shù)進(jìn)行限幅),否則
assert (boxes[:, 2] >= boxes[:, 0]).all()會(huì)報(bào)錯(cuò)。
數(shù)據(jù)集整理完畢,接下來便是修改參數(shù): - 1.lib/networks/中VGGnet_test.py和VGGnet_train.py中
n_classes = 2 - 2.lib/datasets/pascal_voc.py
self._classes = ('__background__', 'person')
和tools/demo.py中CLASSES = ('__background__','person') - 3.pascal_voc.py中
self._image_ext = '.png'的修改。
搞了快一個(gè)星期,終于完工。
