用VIM把掃描的文件轉化成PDF

昨天晚上把一個掃描的文件,經(jīng)過文字識別,用vim轉化成了PDF。這個過程用到了很多編程時養(yǎng)成的習慣,非常有趣,特此記錄。

  1. 把文本文件掃描成PDF

  2. 在PDF中進行文字識別(Text Recognition)

  3. 把識別出的文字輸出到一個markdown文件:demo.md
    a) 輸出下劃線的時候,為了防止轉義,可以當做代碼來輸入:____ 文字 ____

  4. 用vim編輯markdown文件
    a) 修改識別錯的文字,快捷鍵是fa, cnw, ctb, n是一個數(shù)字,a和b代表一個字母
    b) 連接不應該分行的句子??,快捷鍵是shift+j

  5. 把markdown文件生成html文件:demo.html
    pandoc --ascii -f markdown -t html -o demo.html demo.md
    問題:html文件的默認表格格式不能讓我滿意。

  6. 手工修改html文件中的表格設置:demo.html
    a)設置表格總的寬度width:<table style="width:100%;">
    b)設置每列的寬度width:<col width="15%" />
    c)設置單元格的垂直對齊方式valign:
    <td align="left" valign="top">Contents</td>
    經(jīng)驗:應用Google Chrome的Developer Tools和學習CSS

  7. 把html文件生成pdf文件:demo.pdf
    wkhtmltopdf demo.html demo.pdf

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • Swift版本點擊這里歡迎加入QQ群交流: 594119878最新更新日期:18-09-17 About A cu...
    ylgwhyh閱讀 26,025評論 7 249
  • WebSocket-Swift Starscream的使用 WebSocket 是 HTML5 一種新的協(xié)議。它實...
    香橙柚子閱讀 24,735評論 8 183
  • 田先生死了,被油紙包著死在了他租了沒2個月的房子外邊,是清潔工發(fā)現(xiàn)報的案。真是奇怪,田先生今年60整剛剛退休,本來...
    甜食小怪獸閱讀 304評論 0 2
  • 身為一名大二的文科生,我終于在前幾天的晚上真正意義上看完了這部《肖申克的救贖》。當我抱著電腦在早已熄燈安靜...
    Cyra_l閱讀 342評論 0 0
  • 初冬之橫山,青翠翠,涼爽爽,安靜靜。街巷無人頭攢動,廣場無嘈雜人聲。屋前柿子微黃,院后佛瓜輕綠;兩只狗兒汪汪...
    加貝麗閱讀 400評論 0 0

友情鏈接更多精彩內容