功能、效果說明
之前就有考慮過做一個小紅書單個筆記的數(shù)據(jù)采集的功能。
筆記頁面有圖片、標題、描述信息、評論。
如若存在其他信息:地點、話題、艾特用戶等。后續(xù)也會將此類信息歸納整理。
這個功能完整版包含了
- 采集下載所有圖片到指定目錄。
- 筆記描述保存成文本數(shù)據(jù)文件。
- 評論單獨保存為一個文本數(shù)據(jù)文件。
效果演示
請求筆記詳情頁的接口可以獲得以下數(shù)據(jù)。

寫入到csv文件的數(shù)據(jù)結構大概如下圖所示。

實現(xiàn)思路
先前有做過小紅書關鍵詞采集功能。
在那個功能中,我可以獲得筆記基礎信息。
在采集結果文件中有筆記的id。
我們只需要把id加上url前綴,就可以拿到指定筆記頁面主要的數(shù)據(jù)。
再借助程序,采集該頁面的數(shù)據(jù)即可。
實現(xiàn)代碼
以下是獲取筆記數(shù)據(jù)并寫入csv文件的相關代碼。

實現(xiàn)原理
用request模擬get請求小紅書微信端的筆記詳情接口。
就可以拿到所有的筆記詳情頁的基礎數(shù)據(jù)。
用csv簡單處理數(shù)據(jù),將所有數(shù)據(jù)寫入到csv文件中。
這個保存了筆記詳情頁數(shù)據(jù)的文件可以用于后續(xù)完整功能的編寫。
總結與拓展
采集單個小紅書筆記有助于我們對高贊高質量筆記進行內容分析。
對于內容運營者的我們,可以學習他們優(yōu)秀的地方。
只有知己知彼方能百戰(zhàn)不殆。
希望這個點子能幫助你我創(chuàng)作出更優(yōu)質的小紅書筆記。