文 / zChen85

0x00 寫在最前
在一些大型的閱讀平臺和創(chuàng)作社區(qū)中,我們總能看到很多優(yōu)質(zhì)原創(chuàng)的讀后感、書評、甚至是文學評論,有些書評的精彩程度甚至不亞于原著本身。當我們以一個讀者的身份讀完一本書想要寫點什么的時候,是否也曾迷茫過不知如何下筆?
所謂工欲善其事必先利其器,我們要讀好書,同時也要讀好書評。這里的“好”可以從兩個層面解讀:一是質(zhì)量上的好,一本好的書足以讓你在讀完后有想寫一篇好的書評的沖動;另一層指的則是效率上的好,只有把一本好書真的讀透讀究竟了,方能寫出真正高質(zhì)量的書評。一篇好的書評也絕不是我們遵照什么框架模式甚至是所謂的范文能寫出來的。它不僅要求我們積累足夠大的書籍閱讀量,同時在書評本身的閱讀量上對我們也有一定的要求,后者則是那些暢銷的《如何閱讀一本……書》和教科書式的寫作指南或方法論所無法帶給我們的。那么問題來了,那么多那么優(yōu)秀的書評,我們應該——
1)去哪里讀?
即如何進行優(yōu)質(zhì)書評的大規(guī)模閱讀。最直觀的就是去看主流媒體上發(fā)表的書評期刊,比較有代表性的有新京報的書評周刊和晶報的深港書評。這些網(wǎng)站會定期刊登一些資深評論人的書評,含金量很高??墒?,你是否也曾疲于每次都要花上一番功夫后才能找到某一期的書評?在這個快節(jié)奏的時代,這種最為原始的方法似乎并不可取。
于是,便有了聚合類導航網(wǎng)站,這些網(wǎng)站通常會搜集一些優(yōu)質(zhì)的書評期刊,然后對這些期刊的書評信息進行聚合和分類,其中讀寫人就是一個比較典型的代表。這類網(wǎng)站雖然提供的信息相對集中,但是由于其本質(zhì)還是一個中轉(zhuǎn),讀者還是需要點開每一個鏈接,而這些鏈接又會重新指回剛才所說的書評期刊。除此以外,第三種可能也是目前大眾普及度更高的一種,那就是去一些主流的讀書和創(chuàng)作社區(qū)讀好的書評,但是信息量上的過剩和內(nèi)容上的良莠不齊要求讀者對信息有很強的甄別和過濾能力,另一方面,其豐富的社交性也會在一定程度上影響讀者的專注度。
現(xiàn)在設(shè)想一下,如果你已經(jīng)不需要再去一篇一篇找書評了,也不需要手動點開每篇書評的鏈接,更不需要再為那些無聊而令人反感的廣告感到頭疼,我們已經(jīng)直接把這些優(yōu)質(zhì)的書評全部歸檔整理在一起直接放在你的面前,你是不是會有更沖動想要去閱讀呢?
2)怎么讀?
隨之而來的第二個問題就是怎么讀?我們或多或少都會糾結(jié)于以一種怎樣的方式去進行閱讀。從工具媒介上來分,無非就是電腦手機平板之類的電子終端,或者是打印出來的紙質(zhì)版。即便是在這個所謂的智能時代,同一網(wǎng)頁,同一個文檔在電腦上、手機平板上、以及專用的閱讀設(shè)備上所得到的閱讀體驗也是完全不同的,有的甚至可以用“不堪入目”來形容。而如果你想要追求更好一點的閱讀體驗效果,往往需要你按裝這個那個的應用,接踵而來的又是付費買這個充那個的,等真的折騰完這些以后,你還記得你當是的初衷是什么嗎?
再者,從方法論來講,有的人選擇“閱后即焚”,看過算過;高效人士會用一些網(wǎng)絡筆記工具,將一些有用的信息保存下來,當然也有讀(tǔ)者(háo)會選擇直接打印出來看。不管是哪種方式,我們的目的都是要進行有意義的閱讀,能把所接收到的內(nèi)容在將來為我們所用,但這些方式都存在一些共通的問題:我們已經(jīng)在信息的收集和整理上耗費了很多時間和精力,而這還只是個開始,等真的開始閱讀的時候,又將面臨大量冗余和碎片化的信息,進一步降低了閱讀的專注度和效率。所以,最終極的問題就是:如何高效地閱讀這些優(yōu)質(zhì)的書評?
3)怎么高效地讀?
身處這個信息爆炸的時代,我們畢竟很難徹底避免和剔除所有無用的信息而僅僅專注于我們想要和需要關(guān)注的東西。雖然很難,但并不是完全沒有好的解決方案。我們現(xiàn)在正在努力做的,正是幫你簡化和解決前面提出的兩個問題,然后把所有的重點都放在這第三個問題上。
我們編寫了一個自動化工具,將這些優(yōu)質(zhì)的書評文章(目前主要是針對一些主流期刊)全部整合成排版精良的適合閱讀的 PDF 文檔。首先,這大大減少了讀者自己去查找、整理書評的時間(節(jié)約了時間成本),我們能保證你看到的每一篇文章都是(廣義上)優(yōu)質(zhì)的書評(畢竟一千個讀者眼中就有一千個哈姆雷特)。其次,PDF 文檔作為一種平臺無關(guān)的文件格式,讀者不管用什么媒介在什么終端上打開閱讀,都能獲得良好一致的閱讀體驗,當然如果有條件能打印出來看那效果更是極佳了(改進了閱讀體驗)。再者,我們在內(nèi)容上也進行了加工,剔除了無用和冗余的信息,保證了讀者在整個閱讀過程中不會被這些信息所干擾(確保了專注程度)。最后,整合歸檔的意義當然在于信息的去碎片化,最大程度上的集中化,從此媽媽再也不用擔心我們“書到用時方恨少”了,而整合后的內(nèi)容不僅便于檢索,也便于后期讀者自己的二次處理(提升了管理效率)。當然,還有最為重要的一點是——
我們鄭重承諾:所有整合后的資源文檔都將永久性地無償公開分享。
嘮叨了那么多,下面進入正題。我們會列出目前已經(jīng)整合了的資源,介紹我們整個的開發(fā)和整合流程,并展示整合后的最終效果圖。
0x01 資源統(tǒng)計
| 資料來源 | 新京報 書評周刊 |
澎湃新聞 上海書評1 |
晶報 深港書評 |
南方都市報 閱讀周刊 |
|---|---|---|---|---|
| 更新頻率 | 每周 | 每天 | 每周 | 每周 |
| 更新狀態(tài) | 更新中 | 更新中 | 已停更 | 已停更 |
| 原始文檔 | 網(wǎng)頁 | 網(wǎng)頁 | ||
| 起始日期2 | 13 年 9 月 | 17 年 1月 | 16 年 1 月 | 15 年 10 月 |
| 更新日期 | 18 年 1 月 | 18年 1 月 | 17 年 6 月 | 17 年 8 月 |
| 整合進度3 | 17 年 12 月 | 17 年 12 月 | 17 年 6 月 | 17 年 8 月 |
| 文檔個數(shù)4 | 211 | 36 | 64 | 81 |
| 總計頁數(shù) | 2656 | 4638 | 503 | 1999 |
| 推薦指數(shù) | ★★★★★ | ★★★★ | ★★★ | ★★★ |
- 自17年起上海書評均發(fā)布于澎湃網(wǎng),此前發(fā)布在東方早報網(wǎng)上的內(nèi)容均已失效;
- 從有效起始日期開始計算,即發(fā)布日期早于該日期的書評內(nèi)容可能已經(jīng)失效;
- 統(tǒng)計表格每月 1 號更新,因此暫不整合當前月份發(fā)布的內(nèi)容;
- 周更新的書評按周整合為一個文檔;日更新的按月分為上中下旬三個文檔;
2017年1月17日備注:計劃整合經(jīng)濟觀察網(wǎng)·書評、鳳凰網(wǎng)讀書·書評上的書評
0x02 整合流程
書評網(wǎng)站(包括 PC 端和 手機客戶端)通常會以如下一種或幾種形式來顯示書評:1)基于網(wǎng)頁的文字版(含文字和圖片等);2)圖片文檔(通常分辨率較低,不適合閱讀);3)PDF 文檔(排版質(zhì)量最佳)。通常我們主要關(guān)注第 1 和第 3 種情況。
針對第 3 種情況,即存在可供下載的 PDF 文檔,那么我們設(shè)計的自動化工具直接批量獲取和下載文檔即可,然后按周或者按月對它們進行合并,具體的合并策略由其更新的數(shù)量和頻次決定。如果只有網(wǎng)頁文字版的(即第 1 種情況),那么自動化工具就需先要從網(wǎng)頁中抓取必要的書評信息和內(nèi)容,然后遵循 Markdown 語法的形式寫入文件,最后再將其導出為 PDF 格式進行合并。
說明:為什么不直接將網(wǎng)頁保存為 PDF?原始網(wǎng)頁必然包含有太多我們不需要的信息,而我們們只需關(guān)心和獲取其中一些必要的信息即可,如:書評標題、作者、日期、書評內(nèi)容等。為什么選擇 Markdown 而不是其他諸如 DOC 之類的文檔格式?前者輕量級、語法簡單、平臺通用性好(既指操作系統(tǒng)層的平臺,也指網(wǎng)絡寫作平臺),開發(fā)成本遠低于后者。
下面兩張圖分別是我們對新京報的書評周刊(圖 1)和晶報的深港書評(圖 2)按周整合后的文檔資源圖。有需求的朋友完全可以再自行對它們按月或按年進行整合。


此外,針對上述羅列的每一種資料來源,自動化工具還會按年生成一個基于 Markdown 語法的日志文件,其中的信息會再按月進行劃分,這些信息主要包括:發(fā)布日期、文章標題(含鏈接)、文章狀態(tài)等,最后將其導出為一個 PDF 文檔。圖 3 是對新京報·書評周刊 2015 年書評信息歸檔后的效果圖。

2017年1月10日備注:將 Markdown 文件導出為 PDF 時,如果表格行數(shù)過多會導致排版上的不美觀,遂判斷每個表格的行數(shù),每超過 20 行后即強制分頁,且重新帶上表頭。
0x03 開發(fā)環(huán)境
溫馨提示:不關(guān)心的技術(shù)的讀者朋友們,可以直接跳過本節(jié)內(nèi)容。
簡單羅列一下自動化整合工具的開發(fā)環(huán)境:1)操作系統(tǒng):macOS High Sierra;2)代碼編輯器:Atom;3)編程語言:Python;4)Markdown 編輯器:MacDown;5)輔助工具:按鍵精靈
其中工具 4 和 5 并不是必需的。事實上,按照上面的整合流程,其實根本不需要用到 Markdown 編輯器。我們之所以用到了它們,是因為在 macOS 平臺上暫時沒有更好的解決方案將 Markdown 文件優(yōu)雅地導出成 PDF 文件。由于 MacDown 不支持命令行導出,因此現(xiàn)階段的整合流程方案為:先批量打開多個文件(不宜太多,視電腦性能而定),然后配合按鍵精靈(有能力的也可以自己寫 Automator),設(shè)置好組合鍵和循環(huán)次數(shù),最后將它們一一導出保存。
個人認為用 MacDown 導出的 PDF 文檔在整體的排版樣式上已經(jīng)十分適合閱讀了。有自定義樣式需求的話,也可以簡單地通過修改樣式表文件來進行額外的樣式控制,比如我們會仿照簡書風格,將圖片居中、統(tǒng)一控制圖片的尺寸以適應 PDF 文件排版、表格寬度自適應窗口而不是內(nèi)容,等等。但是,MacDown 沒有命令行支持,始終是一大缺憾,而且利用按鍵精靈畢竟會阻塞其他正常的鍵鼠操作。
除此之外,macOS 上已知的幾個可行方案還有:1)pandoc,支持命令行(見下方),但需額外安裝超重量級的 MacTex(當然,也可以用迷你版的 BasicTeX),對中文支持不是很友好,且樣式配置成本較高(適合喜歡倒騰的讀者朋友們);2)Mou 編輯器:因為不支持 High Sierra,所以沒有親測導出效果。Windows 平臺可能有更好的解決方案,有興趣的讀者可以自行研究。
pandoc -N -s --toc --smart --latex-engine=xelatex -V CJKmainfont='PingFang SC' -V mainfont='Monaco' -V geometry:margin=1in test.md -o out.pdf
2017年1月12日備注:按鍵精靈配合 MacDown 時,設(shè)置組合鍵似乎有點小問題,遂將應用程序的菜單“導出為 PDF”的默認快捷鍵 ?+?+P 修改為了 ?+1。
2017年1月11日備注:最理想的方案是能通過命令行進行轉(zhuǎn)換,但能否正常加載 Markdown 文件中的網(wǎng)絡圖片?如果不能或者較為麻煩,則可以考慮在寫入 Markdown 文件時利用自動化工具將網(wǎng)絡圖片下載到本地,然后將圖片的網(wǎng)絡地址替換本地圖片路徑。
0x04 整合實例
針對上文羅列的所有資料來源,本章節(jié)會對它們的整合過程一一進行說明,并展示最終的整合效果。
1. 新京報·書評周刊
文檔整合過程中,首先我們發(fā)現(xiàn)新京報的書評周刊其實有提供 PDF 文檔的,在手機客戶端也支持完整版下載,而且是高質(zhì)量精編的原始文檔。但一個主要的問題是:雖然針對每一版都有提供一個文檔,但文檔的編號有時并不是連續(xù)的,比如:B9 和 B9 可能在同一版面,這樣的話只有 B9 和 B10 兩個文檔是有效,因此需要剔除無效的版面。隨之而來的問題是,如何批量高效地確定哪些文檔是有效的,而哪些又是無效的。事實上,這兩個問題并不像直觀上所見那樣容易解決,最后還是花了一些時間和精力才找到了一個較為完美的解決方案(由于此解決方案涉及逆向工程,這里便不贅述)。
下面兩張圖是新京報·書評周刊 2015 年 10 月 24 日一期的整合效果。對于有打印需求的讀者來說,需要注意的是,在第一張圖里(圖 4)因為開啟了雙頁閱讀模式,所以看上去是一頁,其實是兩頁獨立的豎版;但是第二張圖里(圖 5),兩個版面本身就在一頁上,因此就是一頁橫版的。


如果按照上面這種模式打印的話(見圖 6 的打印預覽),通常橫版的那一頁也會被橫向打印,讀的時候自然也需要把紙橫過來。雖然影響也不算太大,但更極致一點的做法是,把豎版的兩頁也合并成一頁橫版,這樣打印出來的就全是橫版了。

2. 澎湃新聞·上海書評
除了最原始和直接的基于網(wǎng)頁的文字版,暫時還沒有發(fā)現(xiàn)澎湃新聞的上海書評有提供其他可供閱讀的文檔類型。由于網(wǎng)頁本身的排版也還不錯(字體樣式上區(qū)分正文、引語、書名等等),利用 Markdown 支持 HTML 語法的特性,大大降低了自動化工具在樣式排版上的開發(fā)成本,總體的整合復雜度也相對低了很多。
圖 7 左側(cè)是澎湃新聞·上海書評 2017 年 12 月 6 日一期的原始網(wǎng)頁,右側(cè)則是整合導出為 PDF 后的效果。

另外,除了一些基本的書評信息之外,澎湃新聞的上海書評還會在每篇書評的末尾加入“關(guān)鍵詞”信息和“相關(guān)推薦”列表。以澎湃新聞·上海書評 2017 年 12 月 13 日一期為例,如圖 8 所示,我們在整合過程中也將這些有用的信息加入了文檔之中。

3. 晶報·深港書評
晶報直接在網(wǎng)站上提供有深港書評的 PDF 下載鏈接,而且排版質(zhì)量也很高,因此大大簡化了整合工作。另外,同新京報·書評周刊類似的是,深港書評每一期的 PDF 文檔中往往也包含有橫版的頁面,有打印需求的朋友們請額外注意。晶報·深港書評在 2017 年 8 月以后已經(jīng)???,甚是可惜。
圖 9 和圖 10 分別來自晶報·深港書評 2016 年 12 月 10 日一期和 2017 年 5 月 21 日一期的整合效果圖。


4. 南方都市報·閱讀周刊
在亞馬遜網(wǎng)站上,南方都市報發(fā)布過幾期適配 Kindle 的電子版閱讀周刊,但只有極少幾期,因此還是需要訪問網(wǎng)頁端才能瀏覽每一期的內(nèi)容。除了普通的文字版,目前發(fā)現(xiàn)針對每一個版面是有原始圖片提供的,但分辨率過低(500x750),無法正常閱讀,而且原始版面的文字排版又相對比較簡陋,因此需要利用自動化工具,對網(wǎng)頁的書評內(nèi)容進行了抓取和整合。
在排版上,這里主要針對段落處理、圖片位置、圖片說明等,我們盡可能地仿照簡書的風格來處理。圖 11 給出了原始網(wǎng)頁(左側(cè))和自動化處理后 PDF 文件雙頁閱讀的效果(右側(cè))。哪一種閱讀的體驗效果更好不言而喻。

0x05 寫在最后
對于已經(jīng)列出的相關(guān)資源,我們會于每月 1 號進行統(tǒng)計、更新和發(fā)布。如果你有更多更好的優(yōu)秀書評資源,都可以給我們留言,我們會及時地加入進來。我們不會說自己做的東西有多牛,也不會吹噓我們要打造一個多厲害的平臺之類的,因為我們只有一個小小心愿——讓閱讀回歸本真。
合集打包
| 資源名稱 | 網(wǎng)盤地址 | 提取碼 |
|---|---|---|
| 新京報·書評周刊 | 1c4cvtNa | i4qa |
| 澎湃新聞·上海書評 | 1o9BC8rS | w87p |
| 晶報·深港書評 | 1gherfiF | 42rs |
| 南方都市報·閱讀周刊 | 1htbWWhI | 7mag |
版本歷史
- 2012年1月19日(v0.1.4):整合并發(fā)布了新京報·書評周刊、澎湃新聞·上海書評、晶報·深港書評、南方都市報·閱讀周刊