Data Scientist、Data Analyst、Data Engineer
Data Enginner 所做的一切都為了Data Management,具體內(nèi)容包括數(shù)據(jù)模型、數(shù)據(jù)架構(gòu)、數(shù)據(jù)標準、元數(shù)據(jù)、主數(shù)據(jù)、數(shù)據(jù)治理、數(shù)據(jù)管控等等,Data Enginner的目標是把數(shù)據(jù)整好,存儲成本低,查詢效率高,至于怎么使用這些數(shù)據(jù)不是他們關(guān)心的范疇。
Data Analyst所做的一切都是為了回答問題。這些問題可能來自業(yè)務部門,也可能來自各級管理人員,有些問題就是想知道某些具體數(shù)字,也有些問題是開放式的探索問題,例如為什么這個月銷量下降等等。Data Analyst在Data Enginner提供的數(shù)據(jù)基礎之上進行探索分析,如統(tǒng)計分析或機器學習等,目的是找到問題的正確答案。
Data Scientist是一個自Hi型的忽悠理念。什么是Scientist?按維基百科的定義,Scientist廣義上指使用系統(tǒng)化的活動來發(fā)現(xiàn)新知識的人,狹義的定義指使用科學方法做研究的人?,F(xiàn)在業(yè)界所謂的Data Scientist是數(shù)據(jù)應用領(lǐng)域的混合體,他無所不能,他要擁有相關(guān)領(lǐng)域的各種技能,哪有需要就往那里搬,能獨立承擔從數(shù)據(jù)處理、分析探索到實踐應用直至最終產(chǎn)生業(yè)務價值全流程服務的全能超人,聽起來很高大上,不過和科學不太搭邊,叫科學家有點勉強了。