安裝
通過安裝pytesseract之后,,編寫代碼
import pytesseract
val = pytesseract.image_to_string(Image.open(imagePath))
print(val)
提示:
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path
原因: pytesseract 安裝之前需要安裝tesseract包,
查找解決方案: python3光學字符識別模塊tesserocr與pytesseract
tesserocr安裝參考鏈接:https://github.com/sirfz/tesserocr
pytesseract安裝參考鏈接:https://github.com/madmaze/pytesseract
tesseract安裝參考鏈接:https://github.com/tesseract-ocr/tesseract/wiki
問題
- 使用tesseract進行識別圖片時,出現(xiàn)問題
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
首先要確保:
1、安裝Pillow,命令pip install Pillow,安裝完畢會在Python文件夾下Lib\site-packages\pytesseract這個文件夾,里面有pytesseract.py文件
2、確保安裝了 Tesseract-OCR 這個好像沒有64、32的區(qū)別
本人Python用的32位,安裝這個OCR時候,看到用的是32位版本的最后沒問題,安裝后,自動生成環(huán)境變量,查看自己環(huán)境變量里是否有tesseract的路徑
3、檢查環(huán)境變量path 與TESSDATA_PREFIX , path 中含有tesseract的安裝目錄, TESSDATA_PREFIX 是tesseract的安裝目錄的tessdata, 然后查看其信息
然后找一個圖片測試,cmd中輸入tesseract,會出現(xiàn)提示
命令tesseract d:/pic.gif result 查看result的內(nèi)容
- 使用pytesseract 進行圖片識別
出現(xiàn)以下問題, 找到tesseract這個環(huán)境變量設置地
解決方法:
找到pytesseract.py文件,將其中的“tesseract_cmd”字段指定為tesseract.exe的完整路徑即可, 比如tesseract_cmd=r'c:\Tesseract-OCR\tesseract.exe'
PS: 若你覺得可以、還行、過得去、甚至不太差的話,可以“關注或點贊”一下,就此謝過!