當我們談?wù)摂?shù)據(jù)分析時,我們在談?wù)撌裁矗?br> 我們其實在談?wù)摂?shù)據(jù)分析的三個部分。
1. 數(shù)據(jù)采集 數(shù)據(jù)采集是我們的「原材料」,主要通過爬蟲以及一些自動化工具采集得來。
2. 數(shù)據(jù)挖掘 數(shù)據(jù)挖掘是數(shù)據(jù)分析中最有價值的部分,主要是要幫助我們找到數(shù)據(jù)的規(guī)律,幫助我們做出決策,完成業(yè)務(wù)訴求。
3. 數(shù)據(jù)可視化 數(shù)據(jù)可視化可以幫助我們更直白地看到做出的結(jié)果,幫助我們理解或者向他人演示。
數(shù)據(jù)挖掘是數(shù)據(jù)分析的重中之重,大家的差異和價值也體現(xiàn)在其中。
下面我列出數(shù)據(jù)挖掘的知識清單,供大家學習參考。

數(shù)據(jù)挖掘
每一個算法都可能花你很多時間去搞懂,我希望大家可以先去了解下每個算法的基本含義以及作用,這樣你才會有更深刻的印象。
留一個思考題,你要開始學習數(shù)據(jù)挖掘了,你有什么心得體會呢?如果一個淘寶店家要查看店鋪商品之間的關(guān)聯(lián)關(guān)系,他應(yīng)該用那個算法呢?為什么?
歡迎大家留言討論,后續(xù)我會持續(xù)更新,記得關(guān)注我哦!