python-OCR圖片識別庫--pytesseract

安裝

通過安裝pytesseract之后,,編寫代碼

import pytesseract
val = pytesseract.image_to_string(Image.open(imagePath))
print(val)

提示:
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path

原因: pytesseract 安裝之前需要安裝tesseract包,

查找解決方案: python3光學字符識別模塊tesserocr與pytesseract

tesserocr安裝參考鏈接:https://github.com/sirfz/tesserocr

pytesseract安裝參考鏈接:https://github.com/madmaze/pytesseract

tesseract安裝參考鏈接:https://github.com/tesseract-ocr/tesseract/wiki

問題

  1. 使用tesseract進行識別圖片時,出現(xiàn)問題
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.

首先要確保:
1、安裝Pillow,命令pip install Pillow,安裝完畢會在Python文件夾下Lib\site-packages\pytesseract這個文件夾,里面有pytesseract.py文件
2、確保安裝了 Tesseract-OCR 這個好像沒有64、32的區(qū)別
本人Python用的32位,安裝這個OCR時候,看到用的是32位版本的最后沒問題,安裝后,自動生成環(huán)境變量,查看自己環(huán)境變量里是否有tesseract的路徑
3、檢查環(huán)境變量path 與TESSDATA_PREFIX , path 中含有tesseract的安裝目錄, TESSDATA_PREFIX 是tesseract的安裝目錄的tessdata, 然后查看其信息
然后找一個圖片測試,cmd中輸入tesseract,會出現(xiàn)提示
命令tesseract d:/pic.gif result 查看result的內(nèi)容

  1. 使用pytesseract 進行圖片識別
    出現(xiàn)以下問題, 找到tesseract這個環(huán)境變量設置地
    解決方法:
    找到pytesseract.py文件,將其中的“tesseract_cmd”字段指定為tesseract.exe的完整路徑即可, 比如tesseract_cmd=r'c:\Tesseract-OCR\tesseract.exe'

PS: 若你覺得可以、還行、過得去、甚至不太差的話,可以“關注或點贊”一下,就此謝過!

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容