簡介:gImageReader是一個GUI軟件,實現(xiàn)利用tesseract OCR引擎(Tesseract本身是命令行工具)從Linux中的圖像和PDF文檔中識別文本。

概述
Tesseract最初是由惠普開發(fā)的,然后在2006年開源。你可以用OCR(光學字符識別)引擎掃描圖片或文件(PDF)中的文本。默認情況下,它可以檢測多種語言,并且還支持通過Unicode字符進行掃描。
GitHub項目網(wǎng)址:
https://github.com/manisandro/gImageReader
gImageReader特性
1.從磁盤,掃描設備,剪貼板和屏幕截圖添加PDF文檔和圖像
2.支持多頁的 PDF 文檔
3.自動分頁檢測
4.通用圖像控件可調(diào)節(jié)亮度,對比度和分辨率
5.能夠一次處理多個圖像或文件
6.支持用戶手動定義和調(diào)整識別區(qū)域(也可以自動識別文字區(qū)域)
7.識別純文本或hOCR文檔
8.可以提取的文本進行對拼寫檢查
9.可以從hOCR文檔轉(zhuǎn)換/導出為PDF文檔
10.將提取的文本導出為.txt文件
11.可以識別不同的語言
12.跨平臺
軟件安裝
1.由于不知道gImageReader在軟件倉庫中的確切名字,終端輸入以下命令進行查詢,發(fā)現(xiàn)有多個版本,我安裝的Qt版本。
sudo pacman -Ss gImageReader
2.終端輸入以下命令進行安裝
sudo pacman -S gImageReader-qt3.安裝完成出現(xiàn)如下圖標表示安裝成功。

4.安裝OCR引擎,執(zhí)行以下命令
sudo pacman -S tesseract-data-eng tesseract-data-chi_sim#安裝的tesseract-data-eng用于識別英文#安裝的tesseract-data-chi_sim用于識別簡體中文
5.如果想手動編譯源代碼,可以參考下方鏈接(gImageReader官方Wiki)
https://github.com/manisandro/gImageReader/wiki/Compiling-gImageReader
簡單使用
一、打開軟件出現(xiàn)如下界面

上圖中:
1處用來加載待識別的圖片
2處用來選擇圖片中的識別區(qū)域
3處用來切換識別文字的語種,可以識別漢語、英語、英漢混合
4處用來顯示識別結(jié)果
二、下圖為識別效果圖,更多功能自行探索。


長按復制:ManjaroLinux