【Tensorflow】Object Detection API-如何制作VOC格式數(shù)據(jù)集

工具來源:https://github.com/whlook/VOCMaker.git

1. VOC數(shù)據(jù)集包含內(nèi)容

VOC數(shù)據(jù)集,包含以下幾個(gè)文件夾:

  • Annotations (存放每個(gè)對(duì)象xml格式的標(biāo)簽)
  • ImagesSets(包括action layout main segmentation四個(gè)部分的內(nèi)容,是數(shù)據(jù)集中每一種類型圖片的信息。main下存放的是圖像物體識(shí)別的數(shù)據(jù),總共分為20類。)
  • JPEGImages(所有jpg圖片,包括訓(xùn)練圖片和測(cè)試圖片。)
  • SegmentationClass(標(biāo)注出每一個(gè)像素的類別)
  • SegmentationObject(標(biāo)注出每一個(gè)像素屬于哪一個(gè)物體)

2. 如何制作自己的VOC數(shù)據(jù)集

2.1 準(zhǔn)備照片素材

比如,我有4類素材:可口可樂、味全、統(tǒng)一方便面、青島純生
總共97張圖片。

2.2 標(biāo)注每張圖片

依賴:

  • Windows10系統(tǒng)
  • python 2.7.14
  • opencv3.0
  • vs2015
  • python numpy庫
  • VOCMaker源碼

2.2.1 安裝python 2.7.14

  • 官網(wǎng)下載安裝python 2.7.14 ,比如我安裝到C:\Python27目錄
  • 添加python 環(huán)境變量,打開系統(tǒng)環(huán)境變量,Path變量添加:C:\Python27;C:\Python27\Scripts;

2.2.2 安裝numpy庫

打開cmd,執(zhí)行:

pip install numpy


2.2.3 安裝opencv3.0

安裝、編譯參考
安裝、編譯完成后,要把opencv-3.0\opencv\mybuild\install\x86\vc14\bin目錄下所有的動(dòng)態(tài)庫,拷貝到VOCMaker-master\VOCMaker\Debug目錄下;
把opencv-3.0\opencv\build\python\2.7\x64\cv2.pyd拷貝到VOCMaker程序運(yùn)行目錄。

2.2.4 VOCMaker

下載地址:https://github.com/whlook/VOCMaker
打開工程,注意配置工程的openCV依賴庫和頭文件路徑。

2.2.5 重命名圖片

將原始圖片都放到:VOCMaker-master\VOCMaker\VOCMaker\imgs目錄下,如圖所示:

在master\VOCMaker\VOCMaker\目錄下,執(zhí)行:

python rename.py

會(huì)在當(dāng)前目錄下生成JPEGImages文件夾,并把原始圖片統(tǒng)一重命名為以下:

運(yùn)行程序,框住要識(shí)別的物體,填寫標(biāo)簽:

按空格鍵,切換到下一張照片。

當(dāng)操作完最后一張圖片時(shí),按o鍵,生成xml標(biāo)簽信息。

所有標(biāo)簽信息錄入完畢后,執(zhí)行:

python txt.py

3. 其他工具介紹

https://github.com/puzzledqs/BBox-Label-Tool

4. 程序下載

程序我打包了有需要可以Q我。qq號(hào):479066524

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容