這兩天利用業(yè)余時間終于是把自己手頭所有的文章(QQ空間)做了一個大致的備份。
過程曲折復(fù)雜,想了許多招數(shù)終于有了一個初步的結(jié)果。 事情剛剛完成,完成之后只有感慨,真是不容易那。
簡單敘述一下整個過程,免得以后要做第二次備份,又忘記了怎么做。
首先打開自己的空間頁面,切換到日志一頁,就遇到了第一個難題。如圖,我現(xiàn)在的總數(shù)是175頁,而每頁顯示15篇日志,也就是說總?cè)罩緮?shù)可以計算得到是2625篇,和實際值2616篇相差不多。這2616篇如果采用手動復(fù)制...,實在是一個太過恐怖的過程。即使你一個小時能夠完成30篇,2616篇/30篇=87.2小時,光是復(fù)制下來的工作量就是整整四天,這還不帶休息的,也不能避免出錯。那么也就是說必須想出來一個辦法,能夠非常好的解決復(fù)制問題。怎么辦呢?

好在右鍵點擊每篇文章的標(biāo)題后,會右鍵出現(xiàn)一個“復(fù)制鏈接地址”的選項,點擊復(fù)制最終會復(fù)制下來這么一串鏈接“http://user.qzone.qq.com/xxxxxxxx/blog/1547974001”,其中blog前邊的那串號碼xxxxxx就是本人的qq號,而blog后邊的這串?dāng)?shù)字則是為這篇文章分配的一個id號,如果你右鍵使用Chrome瀏覽器的“審查元素”功能,就會發(fā)現(xiàn)這串號碼實際上叫做bolgid,很明顯就是日志的id號了。但是你去點擊相鄰的兩個標(biāo)題,發(fā)現(xiàn)它們的號碼實際上并不連著,也就是說1547004001前并非是1547004000的號碼,這個是怎么回事呢?我們留到后邊再說。
有了這個思路,應(yīng)該怎么做呢?手動復(fù)制所有的日志id號?
不,2600多個id號也夠你受的,只能想別的方法了,首先想到的是使用迅雷的“下載所有鏈接功能”,然而下載迅雷后網(wǎng)頁上點擊并非此選項。最后只能用自己平常玩兒游戲作弊用的一個工具——按鍵精靈來實現(xiàn)半自動化操作了。具體方法就是首先錄制一個自己操作復(fù)制的過程,然后設(shè)置熱鍵,讓其不斷重復(fù),直至把所有的id都保存到一個文本文件中。但這其中也有些小的問題,比如在鼠標(biāo)點擊的時候鼠標(biāo)的位置不能太靠標(biāo)題左邊也不能太靠標(biāo)題右邊。這是因為當(dāng)初寫日志的時候,有的文章名字長,有的文章名字短。因此得掌握位置。如果當(dāng)時寫文章時,統(tǒng)一用的是非常規(guī)范的標(biāo)題,比如”隨筆(111)——xxx“,這樣在后續(xù)操作的時候會方便非常多,因此以后也得記住這個竅門,不胡亂給文章取名了。這一步可能用三四個小時就能夠完成,最終得到的就是如下的一個文本文件:
“http://user.qzone.qq.com/xxxxxxxx/blog/1547974361
“http://user.qzone.qq.com/xxxxxxxx/blog/1547974361
“http://user.qzone.qq.com/xxxxxxxx/blog/1547974361
“http://user.qzone.qq.com/xxxxxxxx/blog/1547974361”
這個文件的行數(shù)理論上應(yīng)該等于你的文章總數(shù)量,但是由于操作的時候難免有失誤,因此有可能出現(xiàn)數(shù)量不一致的情況,比如我這次復(fù)制完畢了,使用excel進(jìn)行了一次去重,最終驚訝的發(fā)現(xiàn)總數(shù)應(yīng)該是2600多,但實際上我復(fù)制完畢的文本文件只有2400多篇,這是使用這種半自動化工具的一個弊端,或者說是我們不太熟悉這些工具所以發(fā)生的情況,如果有更加快捷的方法直接讀取什么接口之類,大約會迅速的多,而且不會有失誤。
總之,獲取完畢文本文件后就可以進(jìn)行下一步操作了。這步需要使用到bat批處理文件。里邊的命令如下:
@echo off
pause
pause
pause
start chrome.exehttp://user.qzone.qq.com/xxxxxxx/blog/1328000004
start chrome.exehttp://user.qzone.qq.com/xxxxxxx/blog/1370000001”
“
一眼就能夠看出,這個的主要目的是讓Chrome瀏覽器一次打開多個標(biāo)簽頁,我測試發(fā)現(xiàn),一次打開100個是可以的。打開之后就又要使用到按鍵精靈了,更準(zhǔn)確來說,是使用按鍵精靈來操作Chrome的另存為pdf功能。
使用按鍵精靈依次操作”復(fù)制blogid“、”保存“、”將blogid“粘貼在對話框中作為文件名等操作。這樣就完成了一次保存操作,而后再關(guān)閉當(dāng)前標(biāo)簽頁,繼續(xù)操作下一個標(biāo)簽頁,以此類推。

最終就會存儲完畢所有的單篇pdf文件。如下圖所示:

繼續(xù)下一步,單篇算是存下來了,但如果你要在kindle上閱讀,這樣放進(jìn)去,就會出現(xiàn)2600篇單獨的文章,沒法弄,得繼續(xù)操作。使用”福昕PDF編輯器
“中的文件合并功能,將若干個文件合成一個pdf。我一般是150篇合為一篇,這樣下來,就是下邊的這個樣子:

然后把每個合集文件命名,2600篇就成了總共17個文件。再把日期信息加入到標(biāo)題中,方便以后進(jìn)行一些編輯操作。這個已經(jīng)就可以當(dāng)作存檔備份保存了,主要目的是防丟失。要哪天遇到個特殊情況,騰訊關(guān)閉了qq空間,里邊的東西全部丟失,這個情景,我真是想都不敢想。這簡直就像大唐在風(fēng)雨飄搖中不斷丟失各處領(lǐng)土一般,多恐怖痛心哪?
再下一步,要是要閱讀自己的大作,用電腦肯定是不方便。所以得轉(zhuǎn)換格式,把東西放到Kindle里邊,這就要用到一個叫做calibre的軟件,如下所示:
使用這個軟件操作后,上邊顯示的16個合集文件就轉(zhuǎn)換成為mobi格式,可以在Kindle當(dāng)中閱讀了。當(dāng)然,顯示效果相比網(wǎng)絡(luò)上那些好的電子書還是需要進(jìn)一步提升的。kindle閱讀效果如下所示:


以上就是全部將QQ空間日志轉(zhuǎn)移到Kindle當(dāng)中閱讀的方法。以后還需要進(jìn)一步改進(jìn)。