如何快速統(tǒng)計簡書數(shù)據(jù)——八爪魚采集器(一)

簡書是一個很好的寫作平臺,當(dāng)我們寫了一段時間之后,偶爾會想知道自己在一段時間里究竟寫了幾篇文章,每篇文章的閱讀數(shù)量、評論數(shù)量、喜歡數(shù)量、贊賞數(shù)量,這些指標(biāo)分別是多少,通常我們可以在簡書【我的主頁】里看到自己所有的關(guān)鍵信息、全部文章標(biāo)題和以上各個指標(biāo)的數(shù)量顯示。


簡書-我的主頁.png

文章數(shù)量少的,可以把標(biāo)題和各項指標(biāo)逐個手動記錄下來,再進行比較。根據(jù)比較,看出自己哪些文章受歡迎,哪些文章還可以再提高。文章數(shù)量多的,用手動的方法難度就比較大。很多人的文章已經(jīng)有幾百篇,字?jǐn)?shù)幾十萬,各項指標(biāo)也很多,手動記錄數(shù)據(jù)費時費力也容易出錯。這時,我們就可以使用【八爪魚采集器】來完成這項統(tǒng)計工作,快速并且不費力。

八爪魚采集器是一款免費網(wǎng)絡(luò)爬蟲軟件??梢栽诤芏痰臅r間內(nèi),輕松從各種不同的網(wǎng)站或者網(wǎng)頁獲取大量的規(guī)范化數(shù)據(jù),幫助任何需要從網(wǎng)頁獲取信息的客戶實現(xiàn)數(shù)據(jù)自動化采集,編輯,規(guī)范化,擺脫對人工搜索及收集數(shù)據(jù)的依賴,從而降低獲取信息的成本,提高效率。(來自百度百科)

使用八爪魚采集器統(tǒng)計個人簡書文章的標(biāo)題、閱讀數(shù)量、喜歡數(shù)量、評論數(shù)量。

一、八爪魚官網(wǎng)注冊和積分的作用

登錄官網(wǎng)注冊。注冊后,官網(wǎng)贈送積分。每天在官網(wǎng)簽到,可以免費領(lǐng)取30積分。積分的用途是:采集數(shù)據(jù)導(dǎo)出到Excel表時,需要支付積分才能完成。免費版八爪魚每10條數(shù)據(jù)支付1積分。


八爪魚官網(wǎng)注冊.png

二、免費下周八爪魚客戶端

在官網(wǎng)下載免費的客戶端,將客戶端安裝在電腦上(建議安裝在C盤以外的其他盤)。在電腦上打開客戶端才可以進行數(shù)據(jù)采集。


八爪魚采集器客戶端.png

三、用八爪魚采集簡書文章的各項指標(biāo)

1、打開八爪魚客戶端
輸入賬號密碼,打開客戶端.png
2、打開客戶端后,看到兩種采集方式,選擇【自定義采集】,點擊【立即使用】。
兩種采集方式.png
3、建立采集任務(wù)。

將需要采集的網(wǎng)站錄入,即將簡書【我的主頁】網(wǎng)址鏈接粘貼在紅框中。采集任務(wù)建立,點擊左下角【保存網(wǎng)址】。


建立采集任務(wù),粘貼簡書網(wǎng)址,保存網(wǎng)址.png
4、進入采集頁面,呈現(xiàn)出與鏈接相同的的簡書網(wǎng)站內(nèi)容,及【我的主頁】全部內(nèi)容。

網(wǎng)站中(紅框內(nèi))呈現(xiàn)出來的文字,數(shù)字,鏈接,都可以采集。我們只采集文章標(biāo)題,閱讀數(shù)量,評論數(shù)量,喜歡數(shù)量,這四個指標(biāo)。


采集任務(wù)中顯示簡書【我的主頁】所有內(nèi)容.png
5、選擇標(biāo)題字段,準(zhǔn)備采集。
(1)鼠標(biāo)左鍵點擊文章標(biāo)題【簡書寫作第七周總結(jié)】,右側(cè)彈出橙色對話框,點擊【選中全部】。

可以看到第二篇文章【實習(xí)生怎么帶才好用?(二)】也被虛框選中。簡書【我的主頁】整個頁面的所有文章標(biāo)題都被選中。


采集標(biāo)題.png
(2)點擊選中全部,彈出橙色對話框,點擊【采集以下鏈接文本】。

因為我們要采集標(biāo)題文字,所以選采集文本。如果想采集每個標(biāo)題的鏈接網(wǎng)址,也可以選擇采集鏈接地址。


采集標(biāo)題文本.png
(3)點擊【采集以下鏈接文本】,橙色對話框顯示出本頁面的所有標(biāo)題文字。

然后回到左側(cè)文章標(biāo)題下方,選中閱讀數(shù)量(眼睛代表閱讀,數(shù)字2是本篇文章的閱讀量)。


采集閱讀數(shù)量.png
(4)點擊橙色對話框中的【選中全部】,則本頁面下每篇文章的閱讀數(shù)量都被選中。同樣,因為我們要的是數(shù)字,所以只采集閱讀量的文本。
采集閱讀量文本.png

橙色對話框中呈現(xiàn)出每篇文章閱讀量的數(shù)字。


閱讀量文本呈現(xiàn).png
(5)以此類推,依次采集評論數(shù)量和喜歡數(shù)量。

當(dāng)所有要采集的字段全部收集齊,被收集的部分都呈現(xiàn)粉紅色。


image.png
(6)完成所有字段的收集之后,點擊右側(cè)橙色對話框中的【保存并開始采集】。出現(xiàn)采集對話框,點擊【啟動本地采集】。
啟動本地采集.png
(7)啟動本地采集后,只需等采集任務(wù)自行完成,無需再做其他操作。

用時6秒,采集9條。平均每分鐘81條。采集速度與網(wǎng)站打開速度,網(wǎng)速,都有關(guān)系。僅供參考。


采集完成.png
(8)導(dǎo)出數(shù)據(jù),支付積分。

點擊【導(dǎo)出數(shù)據(jù)】,系統(tǒng)要求支付積分,每10條數(shù)據(jù)支付1積分,同時會顯示賬戶還剩余多少積分(網(wǎng)站簽到可免費領(lǐng)積分)。


導(dǎo)出數(shù)據(jù).png
支付積分.png
(9)選擇導(dǎo)出方式,選擇存放地址。

支付積分后,系統(tǒng)彈出導(dǎo)出方式,根據(jù)個人情況選擇適合自己的。我們選擇Excel表格為導(dǎo)出方式,選擇自己適用的文件夾,進行保存。


選擇導(dǎo)出方式.png
(10)在Excel表格中進行微調(diào),修改字段名稱和格式。
Excel表導(dǎo)出完成,核對信息.png
數(shù)據(jù)采集完成.png

經(jīng)過以上步驟,我們把簡書每篇文章的標(biāo)題,閱讀數(shù)量,評論數(shù)量,喜歡數(shù)量,四個指標(biāo)都采集到Excel表格里了。這樣做自我檢查和比較,是不是更加方便快速?如果你有什么問題,歡迎留言。

細(xì)心的觀眾有沒有注意到一個問題?如果有發(fā)現(xiàn),也歡迎留言。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容