經(jīng)過數(shù)周的學(xué)習(xí),目前了解到了多個數(shù)據(jù)分析的步驟流程,具體如下:
CIRSP-DM
商業(yè)理解
數(shù)據(jù)理解
數(shù)據(jù)準備
建立模型
模型評估
結(jié)果部署
知乎-數(shù)據(jù)分析的流程邏輯
1)提出假設(shè)
2)驗證假設(shè)(統(tǒng)計方法)
3)取數(shù)(SQL / Hive / Spark)
4)清洗和整理數(shù)據(jù)(R / Python Pandas / PySpark)
5)可視化(Excel / R ggplot2 / Python matplotlib)
6)展示給非技術(shù)人員(PowerPoint / Tableau / iPython Notebook / R Markdown)
SAS SEMMA
業(yè)務(wù)問題(假設(shè))
數(shù)據(jù)采樣與特征探索
調(diào)整數(shù)據(jù)
模型研發(fā)與知識發(fā)現(xiàn)
模型與知識評價
部署
《誰說菜鳥不會數(shù)據(jù)分析》
明確目的
確定思路
數(shù)據(jù)搜集
收據(jù)處理
數(shù)據(jù)分析
數(shù)據(jù)展現(xiàn)
撰寫報告
《數(shù)據(jù)分析師的工作職責(zé)是什么》
業(yè)務(wù)問題定義
數(shù)據(jù)采集
數(shù)據(jù)同步清洗
數(shù)據(jù)存儲
分析思路構(gòu)建
數(shù)據(jù)加工展現(xiàn)
分析結(jié)論輸出
分析結(jié)果跟蹤
《數(shù)據(jù)分析項目四階段》
需求確認
數(shù)據(jù)開發(fā)
結(jié)果驗收
投產(chǎn)觀察
結(jié)合以上步驟流程,整理出了個人化的數(shù)據(jù)分析流程,如下圖

個人化數(shù)據(jù)分析流程V1.0.jpg