數(shù)據(jù)分析流程:
1、確定流程
2、數(shù)據(jù)收集
3、數(shù)據(jù)清理
4、數(shù)據(jù)分析
5、數(shù)據(jù)報告
6、執(zhí)行與反饋
想要做好對數(shù)據(jù)的一系列分析,數(shù)據(jù)的采集也至關重要。最近正在接觸八爪魚數(shù)據(jù)采集器這款數(shù)據(jù)爬蟲軟件,不需要使用代碼,采集的步驟對于文科生還沒咋會用代碼的我來說相對簡單。最近恰好遇上八爪魚開的培訓課程。特整理一些筆記,因為感覺手寫筆記整的太慢了....
進入正題~~
八爪魚采集原理:模擬人瀏覽網(wǎng)頁的行為自動化采集數(shù)據(jù)
內(nèi)置火狐內(nèi)核瀏覽器、模擬人瀏覽網(wǎng)頁、復制數(shù)據(jù)的行為,通過設計工作流程,自動化采集數(shù)據(jù)。
主要步驟:
1、復制輸入的網(wǎng)址“保存網(wǎng)頁”以打開該網(wǎng)頁
2、模擬操作--“循環(huán)下一頁”/循環(huán)點擊單個元素(選擇八爪魚需要為你完成的下面的步驟,如翻頁等)
3、右上角打開流程看自己設計的流程,對比完善。
4、數(shù)據(jù)采集與導出
單網(wǎng)頁數(shù)據(jù)采集:
- 單網(wǎng)頁
- 單網(wǎng)頁列表
- 單網(wǎng)頁列表詳情
分頁數(shù)據(jù)采集: - 分頁列表
- 分頁列表詳情