27、數(shù)字驗(yàn)證碼識(shí)別

1、opencv外加上PIL和 pytesseract 兩個(gè)包
2、安轉(zhuǎn)tesserac還需要安轉(zhuǎn)OCR引擎
sudo apt-get install tesseract-ocr

需要額外用的pil和tesseract
import cv2 as cv
from PIL import Image
import pytesseract as tess


def recongnize_text(image):
    blur = cv.GaussianBlur(image,(55,55),0)
    gray = cv.cvtColor(blur, cv.COLOR_BGR2GRAY)
    ret, binary= cv.threshold(gray, 0, 255, cv.THRESH_BINARY_INV | cv.THRESH_OTSU)

    kernel = cv.getStructuringElement(cv.MORPH_RECT, (8, 8))
    bin = cv.morphologyEx(binary, cv.MORPH_OPEN, kernel)
    cv.imshow("binary_image", bin)

    cv.bitwise_not(bin, bin) #變成白色背景
    cv.imshow("binary_image2", bin)
    textImage = Image.fromarray(bin)
    text = tess.image_to_string(textImage)
    print("識(shí)別結(jié)果:%s" % text)

image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 1. 工具準(zhǔn)備 Tesseract-OCR引擎該引擎由惠普公司開發(fā),2005年開源,之后由Google開發(fā)維護(hù)???..
    lossfunc閱讀 1,519評(píng)論 1 4
  • 前言 相信大家利用 Python 寫的爬蟲應(yīng)該遇到過要輸入驗(yàn)證碼的尷尬局面,又或者寫了個(gè)自動(dòng)填充表單的小程序,結(jié)果...
    迦度藍(lán)洛閱讀 16,705評(píng)論 2 35
  • 圖形驗(yàn)證碼識(shí)別技術(shù): 阻礙我們爬蟲的。有時(shí)候正是在登錄或者請求一些數(shù)據(jù)時(shí)候的圖形驗(yàn)證碼。因此這里我們講解一種能將圖...
    久壑閱讀 1,169評(píng)論 0 4
  • 我自己的理解 有可能繞過認(rèn)證碼盡量選擇繞過去,請多嘗試,繞過去爬取效率高不少; 先不考慮那些一天一套認(rèn)證碼的網(wǎng)站,...
    __混沌閱讀 3,210評(píng)論 1 1
  • 本教程翻譯自PyImageSearch英文原文 上周的博客內(nèi)容,我們學(xué)習(xí)了如何安裝Tesseract去做OCR識(shí)別...
    TimBao閱讀 34,306評(píng)論 0 14

友情鏈接更多精彩內(nèi)容