色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

<blockquote id="koc44"></blockquote>

<bdo id="koc44"><tfoot id="koc44"></tfoot></bdo>

登錄注冊寫文章

Tesseract-OCR 4.00簡介

Tesseract-OCR 4.00簡介

首先我們在GitHub上找到了一些文檔，在這里記錄點學習內(nèi)容。

文檔來源：https://github.com/tesseract-ocr/docs

1、History

1） Timeline

Tesseract從1984年開始至今，中間1995年至2005年基本處于停滯狀態(tài)（The dark ages），自從2005年HP開源，2006年被Google接手之后，又進入了新的發(fā)展階段，也不知道這么有意思的OCR庫經(jīng)過了怎樣的40年~~

上圖中有幾個比較重要的點：

Internationalized to 100+ languages

Layout analysis?

Table Detection

Equation detection?

Training Tools?

PDF output?

?LSTM

具體實現(xiàn)還需要分塊研究，以后再寫。

Tesseract Coordinate System

左下角（bottom-left）為坐標原點（0,0）

Tesseract-OCR System

圖1 Tesseract System Architecture

上圖中展示了整個Tesseract 識別架構(gòu)，包括自適應(yīng)二值化，版面分析（我的理解是把整個頁面中的表格、圖片、文字等分類，提取出文字部分進行識別），文字識別等，其中的LSTM Line Recognizer 具體做了什么工作還有待研究，之后的X-Height Fix ,Fuzzy Space Fix, Word Bigram Fix等應(yīng)該是根據(jù)識別結(jié)果不斷調(diào)整參數(shù)，以適應(yīng)不同文檔的情況。

圖2 Tesseract Word Recognizer

上圖2顯示了圖1中 recognizer word pass1 中工作情況。這部分的工作重點是字符分割。

圖3 文件結(jié)構(gòu) -功能結(jié)構(gòu)

圖3 說明了整個Tesseract文件結(jié)構(gòu)以及功能說明。

圖4 重要的數(shù)據(jù)結(jié)構(gòu)

圖5?

誰來告訴我這是什么意思？

圖6 Recognize識別過程中的函數(shù)調(diào)用流程

圖6 很清晰地展示了識別操作的函數(shù)調(diào)用流程，這部分是整個OCR的核心，也是以后研究工作的重點。

圖7 實例（一）

圖7 實例（二）

圖7 實例（三）

以上內(nèi)容介紹整體Tesseract架構(gòu)和實例，官方文檔圖片較多，先保存下來，以后學習深入了再來補充整理。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

Mac下Tesseract-OCR文字識別新手使用入門
引最近要倒騰一下文字識別，直接上手iOS的識別遇到了一些困難，于是決定先在Mac上做一做，會比較簡單。有一個經(jīng)...
Cloudox_閱讀 5,423評論 1贊 3
使用Tesseract訓(xùn)練lang文件并OCR識別集裝箱號
在某產(chǎn)品的規(guī)劃中，想要通過監(jiān)控視頻進行 “集裝箱計數(shù)” 與 “集裝箱號” 識別，以便與艙單數(shù)據(jù)進行自動化的對比，發(fā)...
lonelygo閱讀 27,796評論 20贊 19

Detecting Text in Natural Image with Connection...
文章作者：Tyan博客：noahsnail.com | CSDN | 簡書聲明：作者翻譯論文僅為學習，如有侵權(quán)請...
SnailTyan閱讀 2,106評論 0贊 2
Tess4.0 windows編譯與使用
tesseract-OCR4.00 dev VS2015 安裝編譯編譯教程參考：https://github.c...
RobertY閱讀 2,241評論 0贊 1
Tesseract-OCR學習系列（一）簡介
Tesseract Introduction 做了一段時間的OCR。在PC的Visual Studio上和在TI/...
行之與亦安閱讀 9,451評論 4贊 20

友情鏈接更多精彩內(nèi)容

1贊2贊

贊賞

手機看全文

长丰县| 合肥市| 拉孜县| 太仆寺旗| 彰化市| 百色市| 通江县| 丰都县| 林西县| 南阳市| 上林县| 会泽县| 昌乐县| 白城市| 高碑店市| 武安市| 阳新县| 连城县| 宁波市| 涡阳县| 苏州市| 吉隆县| 吉水县| 巩留县| 陆川县| 民乐县| 余江县| 景宁| 铅山县| 靖远县| 繁昌县| 阳新县| 新化县| 绵阳市| 寻乌县| 泰州市| 财经| 响水县| 滨海县| 邮箱| 双流县|