工具來源:https://github.com/whlook/VOCMaker.git
1. VOC數(shù)據(jù)集包含內(nèi)容
VOC數(shù)據(jù)集,包含以下幾個(gè)文件夾:
- Annotations (存放每個(gè)對(duì)象xml格式的標(biāo)簽)
- ImagesSets(包括action layout main segmentation四個(gè)部分的內(nèi)容,是數(shù)據(jù)集中每一種類型圖片的信息。main下存放的是圖像物體識(shí)別的數(shù)據(jù),總共分為20類。)
- JPEGImages(所有jpg圖片,包括訓(xùn)練圖片和測(cè)試圖片。)
- SegmentationClass(標(biāo)注出每一個(gè)像素的類別)
- SegmentationObject(標(biāo)注出每一個(gè)像素屬于哪一個(gè)物體)
2. 如何制作自己的VOC數(shù)據(jù)集
2.1 準(zhǔn)備照片素材
比如,我有4類素材:可口可樂、味全、統(tǒng)一方便面、青島純生
總共97張圖片。
2.2 標(biāo)注每張圖片
依賴:
- Windows10系統(tǒng)
- python 2.7.14
- opencv3.0
- vs2015
- python numpy庫
- VOCMaker源碼
2.2.1 安裝python 2.7.14
- 官網(wǎng)下載安裝python 2.7.14 ,比如我安裝到C:\Python27目錄
- 添加python 環(huán)境變量,打開系統(tǒng)環(huán)境變量,Path變量添加:C:\Python27;C:\Python27\Scripts;
2.2.2 安裝numpy庫
打開cmd,執(zhí)行:
pip install numpy
2.2.3 安裝opencv3.0
安裝、編譯參考
安裝、編譯完成后,要把opencv-3.0\opencv\mybuild\install\x86\vc14\bin目錄下所有的動(dòng)態(tài)庫,拷貝到VOCMaker-master\VOCMaker\Debug目錄下;
把opencv-3.0\opencv\build\python\2.7\x64\cv2.pyd拷貝到VOCMaker程序運(yùn)行目錄。
2.2.4 VOCMaker
下載地址:https://github.com/whlook/VOCMaker
打開工程,注意配置工程的openCV依賴庫和頭文件路徑。
2.2.5 重命名圖片
將原始圖片都放到:VOCMaker-master\VOCMaker\VOCMaker\imgs目錄下,如圖所示:
在master\VOCMaker\VOCMaker\目錄下,執(zhí)行:
python rename.py
會(huì)在當(dāng)前目錄下生成JPEGImages文件夾,并把原始圖片統(tǒng)一重命名為以下:
運(yùn)行程序,框住要識(shí)別的物體,填寫標(biāo)簽:
按空格鍵,切換到下一張照片。
當(dāng)操作完最后一張圖片時(shí),按o鍵,生成xml標(biāo)簽信息。
所有標(biāo)簽信息錄入完畢后,執(zhí)行:
python txt.py
3. 其他工具介紹
https://github.com/puzzledqs/BBox-Label-Tool
4. 程序下載
程序我打包了有需要可以Q我。qq號(hào):479066524



