【怕了怕了】上次關(guān)于PDF的文章被鎖了兩次,咱也不知道是觸碰了啥禁忌,續(xù)集還是另開文吧,不然又被鎖就解不了了????
【滴滴】本文簡單記錄上一篇文提到的方法3【使用 FreePic2Pdf 掛書簽】中的第③步【通過OCR(文字識別)得到書簽TXT】中關(guān)于【調(diào)整格式】的部分~~
【滴滴】這次使用到的軟件是絕大部分電腦都有的Word和Excel~ 操作簡單~ 使用起來也很愉快hhh??
【前排】時間有限無法詳細介紹,就是給朋友們一個參考~ 很簡單的~ 有什么問題可以留言??
Word:編輯格式
Excel:更改目錄頁碼
使用順序:Word → Excel → Word → TXT
Word 部分
嘗試了多個應(yīng)用來編輯,到頭來發(fā)現(xiàn)Word就很合適很方便!查找替換功能配合上Word支持的通配符,簡直是神器????
- 可用通配符:
- 【
^?】任意單個字符(只用于查找框) - 【
^p】段落標(biāo)記,及常見的“回車標(biāo)記”(可用于查找框/替換欄) - 【
^t】制表符,即Tab(可用于查找框/替換欄) - 【
^&】查找的內(nèi)容(用于替換欄) - eg. 〖查找內(nèi)容:第^?節(jié)〗→〖替換為:^t^&〗→【效果:在“第x節(jié)”前加一個Tab距離】
- 【
- ?:若無法正常使用,可在“更多”檢查是否勾選“使用通配符”(不勾選)
Excel 部分
在上一篇文中有一個點忘了提,那就是目錄的頁碼問題:很多時候書籍PDF中目錄的頁碼和PDF本身的頁碼是不一樣的,因為起始計數(shù)的頁面不同,這就和我們在寫論文時的處理一樣??
因此我們要注意在編輯書簽TXT時對照PDF文件修改頁碼,一般來說是所有數(shù)字統(tǒng)一加上另一個數(shù)就OK??所以方法也很簡單,分享兩種:
- 直接做加法:在目錄不多時,一個一個加就行啦,畢竟只是簡單加法,相信大家信手拈來??
- 使用Excel輔助計算:在目錄較多或者懶得計算時,使用Excel是很方便滴,操作如下:
- 將“編輯一半的目錄”(參考后文使用順序)復(fù)制到Excel中
- 新建列[1]計算【“頁碼列”+插差】,并將其復(fù)制后,以純文本的形式粘貼到另外一個新列[2]
- 刪去[原頁碼列]和新列[1],保留[標(biāo)題列]和新列[2]
- 再將剩下的兩列復(fù)制后以純文本的形式粘貼回Word文檔中就好~
使用順序
小結(jié)一下使用順序:
- 使用OCR進行文字識別,將文字整體復(fù)制到Word中
- 在Word中使用“替換”功能,配合通配符編輯格式:去除特殊符號(如斜杠、省略號、破折號等)、去除多余空格、去除錯誤換行等【請參考Word部分中的“通配符”使用】
- 在轉(zhuǎn)移至Excel前,需要達成以下條件:①每行有標(biāo)題文字和頁碼數(shù)字;②標(biāo)題文字和頁碼數(shù)字之間有一個
Tab的距離;③每行的標(biāo)題文字前不可有Tab - 第3步完成后,將整個目錄復(fù)制到Excel中(在第一個空格直接右鍵粘貼即可)
- 在Excel進行編輯,最后得到一個[標(biāo)題列]和一個[新頁碼列]【請參考Excel中的操作步驟】
- 將兩列選中復(fù)制,并回到Word中以純文本形式粘貼,再通過使用通配符,給除一級標(biāo)題以外的標(biāo)題添加標(biāo)題文字前的
Tab(標(biāo)題多一級,則標(biāo)題前多一個Tab) - 編輯完成后復(fù)制到書簽TXT中即可~???
寫在最后
就寫到這里啦~ 感謝閱讀~ 如果有幫到您的話麻煩點個贊啦??感恩~??