Data Scientist、Data Analyst、Data Engineer
Data Enginner 所做的一切都為了Data Management,具體內(nèi)容包括數(shù)據(jù)模型、數(shù)據(jù)架構(gòu)、數(shù)據(jù)標(biāo)準(zhǔn)、元數(shù)據(jù)、主數(shù)據(jù)、數(shù)據(jù)治理、數(shù)據(jù)管控等等,Data Enginner的目標(biāo)是把數(shù)據(jù)整好,存儲成本低,查詢效率高,至于怎么使用這些數(shù)據(jù)不是他們關(guān)心的范疇。
Data Analyst所做的一切都是為了回答問題。這些問題可能來自業(yè)務(wù)部門,也可能來自各級管理人員,有些問題就是想知道某些具體數(shù)字,也有些問題是開放式的探索問題,例如為什么這個月銷量下降等等。Data Analyst在Data Enginner提供的數(shù)據(jù)基礎(chǔ)之上進(jìn)行探索分析,如統(tǒng)計分析或機器學(xué)習(xí)等,目的是找到問題的正確答案。
Data Scientist是一個自Hi型的忽悠理念。什么是Scientist?按維基百科的定義,Scientist廣義上指使用系統(tǒng)化的活動來發(fā)現(xiàn)新知識的人,狹義的定義指使用科學(xué)方法做研究的人?,F(xiàn)在業(yè)界所謂的Data Scientist是數(shù)據(jù)應(yīng)用領(lǐng)域的混合體,他無所不能,他要擁有相關(guān)領(lǐng)域的各種技能,哪有需要就往那里搬,能獨立承擔(dān)從數(shù)據(jù)處理、分析探索到實踐應(yīng)用直至最終產(chǎn)生業(yè)務(wù)價值全流程服務(wù)的全能超人,聽起來很高大上,不過和科學(xué)不太搭邊,叫科學(xué)家有點勉強了。