谷歌目標檢測與識別API在macOS下快速實現(xiàn)

導讀:深度學習做圖像識別有很多不同的途徑。谷歌最發(fā)布Tensorflow的物體識別API(Object Detection API),讓計算機視覺在各方面都更進了一步,我們可以利用這API來訓練自己的數(shù)據(jù)集實現(xiàn)特殊的目標檢測。但對于深度學習的初學者,在學習理論知識知識已經(jīng)夠枯燥乏味了,更不用說動手去實現(xiàn)實際效果并解決其中配置的問題。本教程是在macOS系統(tǒng)下實現(xiàn)的,后期由于研究需要,會在Windows系統(tǒng)下配置,到時候會出Windows系統(tǒng)下的教程,請大家及時關注。

????????小編目前是準研究生,研究方向是基于深度學習的計算機視覺,對于大家在配置的過程中出現(xiàn)的問題,請及時在評論區(qū)留言,我會及時與大家交流。小編本著謙虛學習和對學術上嚴謹?shù)膽B(tài)度在這里和大家交流,若有不足之處,請大家及時指出。



■ 安裝環(huán)境:?



一、安裝Python 、TensorFlow和其他依賴項


pip install tensorflow

pip install pillow

pip install lxml

pip install jupyter

pip install matplotlib




二、安裝 Protoc, 進入Protoc下載頁,下載對應的編譯好的zip包。

????????下載后bin目錄下會有一個protoc二進制文件,覆蓋到對應目錄:


cp Documents/深度學習/Tensorflow/protoc-3.5.1-osx-x86_64/bin/protoc/usr/local/bin/protoc


注意:cp的文件是自己存放下載Protoc目錄下的bin/protoc,根據(jù)自己存放下載文件的目錄修改即可,并且拷貝到/usr/local/bin(可以讀寫)



三、從github上下載目標檢測API的源代碼

選擇目錄下源代碼(筆者選擇的目錄:Documents/深度學習/Tensorflow),下載文件較大(幾百兆),請耐心等待


cd Documents/深度學習/Tensorflow

git clonehttps://github.com/tensorflow/models.git




四、編譯Protobuf,進入目錄models/research,運行命令進行編譯:


cd models/research

protoc object_detection/protos/*.proto --python_out=.




五、在當前目錄下,添加slim環(huán)境變量


export PYTHONPATH=$PYTHONPATH:`pwd`:`pwd`/slim




六、測試目標檢測API是否安裝成功


python object_detection/builders/model_builder_test.py


在終端出現(xiàn)類似如下結果即安裝成功?:



七、測試模型

1.啟動:

此處需要說明:如果你沒有安裝jupyter開發(fā)環(huán)境請按照如下步驟安裝(1)(2),若已經(jīng)安裝直接跳到步驟(3)。

(1)Homebrew 安裝,復制命令到終端,開始自動下載并安裝,過程中需要輸入密碼,其他無需任何操作:


/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"



(2)在終端輸入命令


brew install jupyter? ?



(3)進入目錄models/research/objection_detection(具體路徑和自己前面下載保存的路徑一致


cd /Users/nikolatesla/Documents/深度學習/Tensorflow/models/research/object_detection

jupyter notebook



(4)點擊:object_detection_tutorial進入

(5)點擊:Cell 下的 Run All, 耐心等待幾分鐘?

測試結果:?



八、修改文件路徑,即可以測試自己的圖片

訓練的照片在models/research/object_detection/test_images下

(1)將需要訓練的照片放在該目錄下,并按照“imageN.jpg”命名,從1開始編號,直到第N張。

(2)在 jupyter 里面修改代碼,只需將劃線部分換成N+1?



九、修改輸出圖像的大?。ㄒ杂⒋鐬閱挝唬?


有問題及時在評論區(qū)留言

也歡迎大家加我微信和微博相互交流和學習

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容