Linux平臺的OCR軟件:gImageReader

簡介:gImageReader是一個GUI軟件,實現(xiàn)利用tesseract OCR引擎(Tesseract本身是命令行工具)從Linux中的圖像和PDF文檔中識別文本。


概述

Tesseract最初是由惠普開發(fā)的,然后在2006年開源。你可以用OCR(光學字符識別)引擎掃描圖片或文件(PDF)中的文本。默認情況下,它可以檢測多種語言,并且還支持通過Unicode字符進行掃描。

GitHub項目網(wǎng)址:

https://github.com/manisandro/gImageReader


gImageReader特性

1.從磁盤,掃描設備,剪貼板和屏幕截圖添加PDF文檔和圖像

2.支持多頁的 PDF 文檔

3.自動分頁檢測

4.通用圖像控件可調(diào)節(jié)亮度,對比度和分辨率

5.能夠一次處理多個圖像或文件

6.支持用戶手動定義和調(diào)整識別區(qū)域(也可以自動識別文字區(qū)域)

7.識別純文本或hOCR文檔

8.可以提取的文本進行對拼寫檢查

9.可以從hOCR文檔轉(zhuǎn)換/導出為PDF文檔

10.將提取的文本導出為.txt文件

11.可以識別不同的語言

12.跨平臺


軟件安裝

1.由于不知道gImageReader在軟件倉庫中的確切名字,終端輸入以下命令進行查詢,發(fā)現(xiàn)有多個版本,我安裝的Qt版本。

sudo pacman -Ss gImageReader

2.終端輸入以下命令進行安裝

sudo pacman -S gImageReader-qt

3.安裝完成出現(xiàn)如下圖標表示安裝成功。

4.安裝OCR引擎,執(zhí)行以下命令

sudo pacman -S tesseract-data-eng tesseract-data-chi_sim#安裝的tesseract-data-eng用于識別英文#安裝的tesseract-data-chi_sim用于識別簡體中文

5.如果想手動編譯源代碼,可以參考下方鏈接(gImageReader官方Wiki)

https://github.com/manisandro/gImageReader/wiki/Compiling-gImageReader


簡單使用

一、打開軟件出現(xiàn)如下界面

上圖中:

1處用來加載待識別的圖片

2處用來選擇圖片中的識別區(qū)域

3處用來切換識別文字的語種,可以識別漢語、英語、英漢混合

4處用來顯示識別結(jié)果


二、下圖為識別效果圖,更多功能自行探索。




長按復制:ManjaroLinux
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容