上篇文章我們談到閱讀活動一定要以自我為中心,只有自己心中好奇的問題驅(qū)動,閱讀才會變得好玩、有意義。這篇文章我將討論如何利用軟件輔助閱讀,盡力讓技術(shù)型閱讀變成一件令人愉悅的事。

一,什么是技術(shù)型閱讀
概述之,一頁頁翻書就是傳統(tǒng)閱讀,利用軟件選擇自己需要的部分觀看,就是技術(shù)型閱讀。傳統(tǒng)閱讀就好像蹩腳偵探“地毯式”的逐級排查,而技術(shù)型閱讀則是福爾摩斯對信息的快速偵測??梢詴诚?,假如未來計算機能夠直接為你定位到需要閱讀的板塊,那么尋找答案是不是更加簡單呢?其實我們已經(jīng)能夠初步做到這一點,只是很多人還在堅守傳統(tǒng)閱讀的習慣罷了。信息爆炸時代閱讀本身便稀缺,如果再一味死讀書,終究會落后于時代。因此我想普及有關(guān)“半機械化”閱讀的經(jīng)驗,讓大家也了解到利用軟件進行閱讀的好處。其實,用軟件里的“關(guān)鍵詞”在書中檢索“答案”,比“方讀此,勿慕彼”的笨辦法好太多。技術(shù)擴展了人類的能力邊界,使我們能夠比以前讀到更多書籍、學到更多知識。
二,OCR 光學字符識別
紙質(zhì)書雖有更好的閱讀體驗,但尋找答案時卻相當麻煩。于技術(shù)型閱讀而言,電子書自然是唯一選擇。很多小伙伴好奇哪種電子書格式最好,個人覺得沒有定論。EPUB、MOBI、AZW3、PDF,各有優(yōu)缺點,根據(jù)自己需要選擇適合自己的就好。這里我主要想討論掃描版PDF電子書,理由是:掃描版PDF雖然不支持檢索,但格式排版和紙質(zhì)書一樣,十分方便引用,也可以找到同版紙書。只要彌補掃描版PDF不能檢索的缺陷,閱讀效率就會大大提高。事實上,OCR 即解決掃描PDF書籍檢索問題的最佳方案。
維基詞條對OCR的解釋如下:
光學字符識別(英語:Optical Character Recognition,OCR)是指對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息的過程。
簡單講,平常我們看到的、可以復(fù)制粘貼的知網(wǎng)文獻都是OCR技術(shù)處理后的雙層PDF文件;而那些不能復(fù)制、粘貼的掃描版電子書則是沒有經(jīng)過OCR處理、十分孤單的單層PDF文件。換言之,單層PDF在計算機眼中就是一張張圖片,只有它變成雙層PDF,計算機才能識別沉在圖片下層的文字信息。所以,要想實現(xiàn)掃描版PDF的檢索功能,就必須用OCR為這個孤單的單層PDF找個對象,讓它變成含有文字、排版信息的雙層PDF。
OCR軟件推薦:PDFelement
選擇這款軟件的原因是它可以全平臺使用,且價格喜人。老牌國際大廠的OCR軟件動不動就上千,PDFelement只賣三百簡直是個小清新(大家最好支持正版哦)。唯一缺點是它OCR的速度較慢,耐心等等就好。下面兩張圖片我標出了OCR功能在Mac平臺和 Windows平臺的界面布局,方便萌新初次上手。


溫馨提示:OCR處理后的電子書一定要固定放在某個文件夾中,最好找個云同步盤。不然處理完隨手一丟,之后的閱讀活動會變得異常艱難。大家肯定也想省心省力對吧?所以平常要養(yǎng)成良好的習慣,定期整理,以后查找資料時會便捷很多。
三,簡單檢索
大家不難發(fā)現(xiàn),OCR之后,書籍的維度就被打開了。只要我們拿著關(guān)鍵詞去詢問書籍,書籍就能給出比之前無目的閱讀精確很多的答案。好比我們翻看《單向度的人》,卻只好奇馬爾庫塞(德:Marcuse)關(guān)于“傳播”的論述,那么無需把整個書本折騰一遍也能快速找到相關(guān)段落。

如上圖所示,在查找框鍵入“傳播”,即可定位書中所有“傳播”的位置,這時我們進行閱讀就好。不過千萬記得:務(wù)必聯(lián)系上下文,否則看一些艱深書籍很容易斷章取義。畢竟,我們的方法只是為了提高效率,而不是投機取巧。實打?qū)嵉拈喿x才能為自己帶來收益。
四,全盤檢索
如果你是經(jīng)常閱讀的熟手,很快會察覺到“簡單檢索”的局限。從知識維度看,“簡單檢索”雖然有效,但是只聚焦于一本書籍,無法實現(xiàn)書籍網(wǎng)絡(luò)之間的聯(lián)動。因此我們需要一款像X光一樣透視全部書籍文本的工具,只有這種工具才能滿足進階用戶的要求。我費了一番功夫,總算在Mac平臺和Windows平臺分別找到的兩款還算好用的全盤檢索軟件,推薦給你:
PDF Search
這是Mac平臺的PDF全盤檢索軟件,非常適合進階讀者中要求不高的群體。它的操作邏輯十分簡單,只要先把所有藏書輸入其中、做個索引,再用關(guān)鍵詞檢索即可。它會將全部書籍中所有包含關(guān)鍵詞的信息加以標注,并在打開文件時生成動畫引導(dǎo)讀者注意。
下面我用“先鋒小說”做個示范:

可以看到,全部書籍里的“先鋒小說”都被檢索出來了,甚至按照級別排了序。雖然我并不是很懂這個排序邏輯,但使用時也沒產(chǎn)生太大困擾。假如你的書籍特別多,這個軟件還可以給書籍標簽。如此一來,軟件檢索時會排除掉你不需要的書籍類目,十分方便。但是,任何事物都不可能完美,它也有不少缺點,尤其對中文支持較差,大致只能做到不影響使用的程度。顏值黨可以考慮購買。
FileLocator Pro
Windows平臺的神器,比上面那個好用多了,缺點是長得比較丑。它可以快速檢索本地的PDF文件,并為用戶提供文內(nèi)信息的預(yù)覽。其基礎(chǔ)檢索功能如下:

和PDF Search的基礎(chǔ)檢索別無二致,唯一區(qū)別就在于索引方式不同。不過,你要深度使用這款軟件才能體會它的強大之處,僅一個布爾表達式就已經(jīng)可以將它稱為神器。下面我用具體場景給大家展示一下布爾表達式的使用。
四,專家檢索

AND 語法
“A主題和B主題我都要”,軟件會檢索同時出現(xiàn)AND兩邊詞語的內(nèi)容。這是最基礎(chǔ)的語法,能夠有效縮小檢索范圍。在實際使用中,全文檢索的效果一般,主要適用于書籍標題的檢索。好比想找索緒爾(法:Saussure)關(guān)于語言學的書籍,但忘了具體書名,那么可以用AND語法來查找:

NOT 語法
“我不要A主題”?;竟δ苁桥懦阎恍枰闹黝},縮小檢索范圍。在書籍少的時候不推薦使用,只有當書籍數(shù)量龐大,難以篩選之時,NOT語法才能幫上忙。例如需要了解“敘事”相關(guān)主題,但又不想涉及到電影敘事,可以在NOT之后接“影視”、“電影”加以排除:

OR 語法
“A主題和B主題都給我看看”?;竟δ苁菙U大檢索范圍,適合不明確主題具體用詞或多個主題的情況。如“實驗小說”和“先鋒小說”內(nèi)涵相近,但不知道書中到底用這兩個關(guān)鍵詞中的哪個。此時可以用OR語法連接類似的關(guān)鍵詞,避免遺漏:

NEAR 語法
“A主題下的B話題我有興趣”?;竟δ苁强s小全文查找范圍,適用于查找某個主題下的具體話題。例如想找“馬原”寫的“先鋒小說”??梢杂肗EAR語法表達:

需要注意,NEAR之前的關(guān)鍵詞才是搜索的重心。換言之,“馬原”只是輔助定位“先鋒小說”的一個路標。
LIKE 語法
“比較像A主題的都幫我查查”?;竟δ苁悄:阉鳎m用于某個主題術(shù)語有變形的情況。好比鍵入“先鋒小說”,也能檢索到“先鋒派小說”:

五,小結(jié)
總之,無論是完全不需要學習的簡單檢索,還是擁有較復(fù)雜邏輯的專家檢索,都能給我們讀者帶來切實的效率提升。我認為在未來通過軟件理解書籍將是現(xiàn)代人的必須掌握的技能。書籍本質(zhì)是知識,而知識本質(zhì)是網(wǎng)絡(luò)。技術(shù)型閱讀可以從宏觀角度把握知識網(wǎng)絡(luò)的組建,同時,也能夠提高讀者的主動性,拒絕被動讀書的不良習慣。事實上,越從技術(shù)角度解構(gòu)書籍,越是會動用到大腦中的復(fù)雜策略,大家可以想一想游戲是不是因為玩家可以運用復(fù)雜策略才有了可玩性?書籍其實是一樣的道理:接受沉悶的閱讀,結(jié)果就是頭腦閉塞;檢索、思考、玩著去閱讀,會越來越精于此道。