前有“互聯(lián)網(wǎng)+”戰(zhàn)略的驅(qū)動,后有數(shù)據(jù)科學(xué)家被譽為“21世紀(jì)最性感的職業(yè)”之一,一時間,表哥表妹們,哦不,數(shù)據(jù)分析工作者變得腳踏祥云兩眼放光,覺得自己生正逢時,響應(yīng)了時代的召喚,become the chose one。動動鼠標(biāo),打開拉勾獵聘周伯通,發(fā)現(xiàn)招聘網(wǎng)站上關(guān)于數(shù)據(jù)分析的職位種類繁多,有數(shù)據(jù)分析師,商業(yè)分析師,BI分析師,數(shù)據(jù)挖掘工程師,要求更是五花八門,SAS、R、SQL、EXCEL......面對這種魚龍混雜的崗位設(shè)置,表哥表妹們很迷茫:數(shù)據(jù)分析崗位多的像天上的星星,我到底是其中哪顆可愛的小星吶?
首先看<Analyzing the Analyzers>中的一句話
We think that terms like “data scientist,” “analytics,” and “big data” are
the result of what one might call a “buzzword meat grinder.”
The people doing this work used to come from more traditional and estab‐
lished fields: statistics, machine learning, databases, operations re‐
search, business intelligence, social or physical sciences, and more. All
of those professions have clear expectations about what a practitioner
is able to do (and not do), substantial communities, and well-defined
educational and career paths, including specializations based on the
intersection of available skill sets and market needs.
這些領(lǐng)域本來是有明確的劃分,但由于一些崗位的設(shè)置,擾亂了原本涇渭分明的技能和職業(yè)區(qū)隔。接下來作者反其道而行之,使用調(diào)查的方式,以數(shù)據(jù)科學(xué)家為職業(yè)路徑目標(biāo),列舉了數(shù)據(jù)分析需要的五中技能,以及四類崗位。


Data Businesspeople
商業(yè)分析師專注于如何將數(shù)據(jù)中的價值轉(zhuǎn)化成實際的利潤。這些人將自己定位為領(lǐng)導(dǎo)者或企業(yè)家,手下常常有至少一位雇員。他們還會從事咨詢相關(guān)的工作。學(xué)歷上看,60%左右的商業(yè)分析師有碩士學(xué)位,其中25%是MBA。但確實有商業(yè)分析師出身于工科專業(yè),他們與真實的數(shù)據(jù)打交道,經(jīng)手的90%報告都與GB級的數(shù)據(jù)打交道,這就要求了僅僅掌握excel一類的電子表格是遠(yuǎn)遠(yuǎn)不夠的。從人口統(tǒng)計學(xué)上看,商業(yè)分析師的年齡較其他職位偏大。其中大約有四分之一是女性,比其他數(shù)據(jù)相關(guān)職位要高。
Data Creatives
作為數(shù)據(jù)科學(xué)家,要能一個人駕輕就熟的完成以下的整個數(shù)據(jù)處理流程:數(shù)據(jù)提取,數(shù)據(jù)整合及分層切片,進行高級的統(tǒng)計分析,制作引人入勝的可視化和交互界面,構(gòu)建使分析過程流程化、易操作的工具。這里的Data Creatives可以看做是數(shù)據(jù)科學(xué)家的入門級,他們會運用許多工具和技術(shù)去解決問題,在駭客馬拉松比賽中編寫創(chuàng)新性的模型,在各個領(lǐng)域都有所涉獵。相比其他職位,Data Creatives更像一個藝術(shù)家。
類似于Data Researchers,他們有扎實的學(xué)術(shù)基礎(chǔ),四分之三的人有授課和發(fā)表論文的經(jīng)歷。他們中的許多人在經(jīng)濟學(xué)或統(tǒng)計學(xué)專業(yè)的本科學(xué)歷,但與Data Researchers不同的是,他們很少去攻讀PhD。他們擁有開源經(jīng)驗,其中一半人都為開源項目貢獻過力量。這類人更年輕,男性的比例相較其他職位最高。
Data Developer
數(shù)據(jù)研發(fā)人員專注于解決數(shù)據(jù)管理中的實際問題:如何獲取,如何存儲,如何從中學(xué)習(xí)。這類人更傾向于將自己標(biāo)記為數(shù)據(jù)科學(xué)家(當(dāng)然最愿意標(biāo)記的是Data Researchers)這是有道理的,因為這些人最接近機器學(xué)習(xí)和相關(guān)的學(xué)術(shù)型內(nèi)容。不過,數(shù)據(jù)研發(fā)人員的日常工作是編寫簡潔高效的代碼。其中一般人有工科學(xué)位,一半人有開源項目經(jīng)驗。相比其他職位,研發(fā)人員更傾向于研究機器學(xué)習(xí)、大數(shù)據(jù)技術(shù),同時他們也最少去做咨詢、管理、組織類工作。
Data Researchers
從物理、社會科學(xué)或統(tǒng)計學(xué)的學(xué)術(shù)研究員成長為數(shù)據(jù)科學(xué)家是一件有趣的事。許多機構(gòu)已經(jīng)意識到運用學(xué)術(shù)方法去理解數(shù)據(jù)處理的復(fù)雜過程是有價值的,即便這些商業(yè)領(lǐng)域往往與傳統(tǒng)的學(xué)術(shù)領(lǐng)域相差甚遠(yuǎn)。數(shù)據(jù)研究員大部分來自于統(tǒng)計學(xué)專業(yè)背景,其中75%的研究員發(fā)表過經(jīng)過同行評審的文章,50%以上擁有PhD學(xué)位。另一方面,數(shù)據(jù)研究也離商業(yè)和管理類的工作最遠(yuǎn)。
看完這個劃分,我們也可以根據(jù)我們自身的工作事情和技能點,到 survey.datacommunitydc.org網(wǎng)站去加入調(diào)查,看看自己的技能點是上面四個中的哪種類型,調(diào)整自己的職業(yè)目標(biāo)和方向。
當(dāng)然,上面提到的四種都是高級職位,對于剛?cè)胄械谋砀绫砻脗兾幢卦囉?。目前國?nèi)互聯(lián)網(wǎng)行業(yè)的如火如荼發(fā)展,對數(shù)據(jù)的缺口很大,門檻也變得不那么高。但我們在入門的同時要對整個行業(yè)和職業(yè)發(fā)展有一個全局觀,及時反思自己現(xiàn)在做的事情是處在數(shù)據(jù)分析的哪一個環(huán)節(jié),距離自己的職業(yè)目標(biāo)的距離有多大,然后不斷學(xué)習(xí)新事物做到自我提升。數(shù)據(jù)科學(xué)深似海,發(fā)展日新月異,時代掀起了巨浪,我們作為浪花也要努力撲騰兩下。
希望,表哥表妹們在未來某一天,都是數(shù)據(jù)科學(xué)家。