python驗(yàn)證碼識(shí)別模塊

模塊鏈接:https://pypi.org/project/muggle-ocr/

(白嫖)這是一個(gè)為麻瓜設(shè)計(jì)的本地OCR模塊

只需要簡(jiǎn)單幾步操作即可擁有兩大通用識(shí)別模塊,讓你在工作中暢通無(wú)阻。

測(cè)試圖片 test1.png

測(cè)試圖片 test2.jpg

SDK類(lèi)參數(shù)

參數(shù)名 必選 類(lèi)型 說(shuō)明
model_type No ModelType 指定預(yù)置模型類(lèi)型
conf_path No str 指定自定義模型yaml配置文件(絕對(duì)路徑)

以上參數(shù)兩者選其一即可,默認(rèn) model_type 為 ModelType.OCR, 若指定 conf_path 參數(shù)則優(yōu)先使用自定義模型。

核心API

  1. SDK.predict(image_bytes: bytes)

使用指北

注意: 因模塊過(guò)新,阿里/清華等第三方源可能尚未更新鏡像,因此手動(dòng)指定使用境外源,為了提高依賴(lài)的安裝速度,可預(yù)先自行安裝依賴(lài):tensorflow/numpy/opencv-python/pillow/pyyaml

  1. pip install muggle-ocr

  2. 調(diào)用示例:

# 1\. 導(dǎo)入包
import muggle_ocr

"""
使用預(yù)置模型,預(yù)置模型包含了[ModelType.OCR, ModelType.Captcha] 兩種
其中 ModelType.OCR 用于識(shí)別普通印刷文本, ModelType.Captcha 用于識(shí)別4-6位簡(jiǎn)單英數(shù)驗(yàn)證碼

"""

# 打開(kāi)印刷文本圖片
with open(r"test1.png", "rb") as f:
    ocr_bytes = f.read()

# 打開(kāi)驗(yàn)證碼圖片
with open(r"test2.jpg", "rb") as f:
    captcha_bytes = f.read()

# 2\. 初始化;model_type 可選: [ModelType.OCR, ModelType.Captcha]
sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.OCR)

# ModelType.Captcha 可識(shí)別光學(xué)印刷文本
for i in range(5):
    st = time.time()
    # 3\. 調(diào)用預(yù)測(cè)函數(shù)
    text = sdk.predict(image_bytes=ocr_bytes)
    print(text, time.time() - st)

# ModelType.Captcha 可識(shí)別4-6位驗(yàn)證碼
sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.Captcha)
for i in range(5):
    st = time.time()
    # 3\. 調(diào)用預(yù)測(cè)函數(shù)
    text = sdk.predict(image_bytes=captcha_bytes)
    print(text, time.time() - st)

"""
使用自定義模型
支持基于 https://github.com/kerlomz/captcha_trainer 框架訓(xùn)練的模型
訓(xùn)練完成后,進(jìn)入導(dǎo)出編譯模型的[out]路徑下, 把[graph]路徑下的pb模型和[model]下的yaml配置文件放到同一路徑下。
將 conf_path 參數(shù)指定為 yaml配置文件 的絕對(duì)或項(xiàng)目相對(duì)路徑即可,其他步驟一致,如下示例:
"""
with open(r"test3.jpg", "rb") as f:
    b = f.read()
sdk = muggle_ocr.SDK(conf_path="./ocr.yaml")
text = sdk.predict(image_bytes=b)
</pre>

輸出結(jié)果:


曹文軒教授作序推薦 0.010004520416259766
曹文軒教授作序推薦 0.009941339492797852
曹文軒教授作序推薦 0.0109710693359375
曹文軒教授作序推薦 0.00901031494140625
曹文軒教授作序推薦 0.010967493057250977

MuggleOCR Session [captcha] Loaded.
ceey 0.010970592498779297
ceey 0.009973287582397461
ceey 0.010970592498779297
ceey 0.009973526000976562
ceey 0.009973287582397461

OCR和驗(yàn)證碼識(shí)別的速度基本都在10ms左右,低配CPU可能需要15-20ms。本模塊僅支持單行識(shí)別,如有多行識(shí)別需求請(qǐng)自行采用目標(biāo)檢測(cè)預(yù)裁圖片。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容