日本免费一区二,久久国产视频手机免费,日韩在线小视频

背景

最近iOS15系統(tǒng)出了一個(gè)LiveText功能，功能非常好用，想在自己的APP里也實(shí)現(xiàn)該功能?？上У氖悄壳癮pple官方還沒提供相應(yīng)的接口供開發(fā)者使用。LiveText本質(zhì)上是OCR技術(shù)，所以想預(yù)研下，這類功能是如何實(shí)現(xiàn)。網(wǎng)上搜集相關(guān)資料，免費(fèi)的支持本地OCR功能，并且支持多個(gè)平臺(tái)的也就谷歌提供的Tesseract了，而且支持pod，所以先從這個(gè)下手。

Tesseract簡介

將圖片翻譯成文字一般被稱為光學(xué)文字識(shí)別（Optical Character Recognition，OCR）?？梢詫?shí)現(xiàn)OCR 的底層庫并不多，目前很多庫都是使用共同的幾個(gè)底層OCR 庫，或者是在上面進(jìn)行定制。
Tesseract 是一個(gè)OCR 庫，目前由Google 贊助（Google 也是一家以O(shè)CR 和機(jī)器學(xué)習(xí)技術(shù)聞名于世的公司）。Tesseract 是目前公認(rèn)最優(yōu)秀、最精確的開源OCR 系統(tǒng)。
除了極高的精確度，Tesseract 也具有很高的靈活性。它可以通過訓(xùn)練識(shí)別出任何字體（只要這些字體的風(fēng)格保持不變就可以），也可以識(shí)別出任何Unicode 字符。

簡單來說，Tesseract采用機(jī)械學(xué)習(xí)的模式，先提取特征訓(xùn)練字符庫，然后根據(jù)字符庫來識(shí)別圖片中的文字。目前支持多個(gè)平臺(tái)。

開始安裝

Tesseract應(yīng)該是C++編寫，目前iOS的主要分支應(yīng)該是gali8分支。

github：https://github.com/gali8/Tesseract-OCR-iOS

cocoapods.png

截止目前為止最新版本是5.0.1并且支持swift，很不錯(cuò)。下面就是簡單pod一下就好了。

我這里使用的是清華源，可以提升速度，也推薦給大家

source 'https://mirrors.tuna.tsinghua.edu.cn/git/CocoaPods/Specs.git'

podFile.png

開始測(cè)試

首先看來看看Tesseract對(duì)項(xiàng)目結(jié)構(gòu)的要求。使用Tesseract,我們需要將訓(xùn)練好的庫放到項(xiàng)目中去，必須是一個(gè)文件夾，并且以tessdata命名，注意這里要選folder references，tessdata里面就是訓(xùn)練好的模型。

選擇文件.png

然后再來看看代碼,發(fā)現(xiàn)意外的簡單。

首先生成一個(gè)G8Tesseract對(duì)象，使用多種語言文字用+號(hào)連接，然后再配置引擎以及識(shí)別參數(shù)，最后就能將圖片的文字識(shí)別到recognizedText。

下面找一張圖片試試看：

識(shí)別測(cè)試.png

這中文識(shí)別還行，但這英文嘛。。。。會(huì)不會(huì)是顏色干擾了識(shí)別？據(jù)我所知，圖像識(shí)別一般都要黑白化，這樣可以減少干擾因素。所以下面我們用GPUImage對(duì)圖像進(jìn)行處理試下（GPUImage剛才pod里面有）。改進(jìn)代碼：

改進(jìn)代碼.png

改進(jìn)結(jié)果.png

問題更嚴(yán)重了。會(huì)不會(huì)是我用的字符庫沒經(jīng)過訓(xùn)練，或者訓(xùn)練較差呢？然后我就去Tesseract官網(wǎng)看看有沒有新的字符庫。地址：
https://github.com/tesseract-ocr/tessdata 下載新的字符庫發(fā)現(xiàn)跑不起來，原來TesseractOCRiOS 5.0.1 只適配到3.0.3的Tesseract，官方早就更新到4.0.0以上了。如果想要使用新的訓(xùn)練庫，就得升級(jí)Tesseract。TesseractOCRiOS多年沒維護(hù)，issues上也有類似的問題沒有解決。所以只能找找看有沒有支持4.0.0以上的野分支了。經(jīng)過一番搜索，還真找到了一個(gè)分支，作者xwal。https://github.com/xwal/Tesseract-OCR-iOS

下面修改podFile重新拉代碼：

重新拉分支.png

經(jīng)過測(cè)試，效果提升并不明顯。而且英文與英文如果黏連很近，還是很容易出錯(cuò)。

總結(jié)

目前來看Tesseract方案和系統(tǒng)iOS自帶的文字識(shí)別還是有一定差距的，而且要攜帶訓(xùn)練好的字符特征包，會(huì)增大APP的體積。所以目前想在照片使用OCR，用webView去顯示圖片，然后用系統(tǒng)自帶功能可能更加合適一點(diǎn)。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

TesseractOCR-iOS 預(yù)研

TesseractOCR-iOS 預(yù)研

背景

Tesseract簡介

開始安裝

開始測(cè)試

總結(jié)

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

TesseractOCR-iOS 預(yù)研

背景

Tesseract簡介

開始安裝

開始測(cè)試

總結(jié)

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av