如何組建數(shù)據(jù)科學(xué)團(tuán)隊(duì)

今天近乎所有的互聯(lián)網(wǎng)公司都希望組建(大)數(shù)據(jù)分析團(tuán)隊(duì),但由于大數(shù)據(jù)技術(shù)應(yīng)用是一個(gè)高速發(fā)展的全新領(lǐng)域,與建設(shè)常規(guī)的軟件開發(fā)團(tuán)隊(duì)相比,企業(yè)在數(shù)據(jù)科學(xué)團(tuán)隊(duì)的招聘、建設(shè)和成長(zhǎng)方面面臨各種全新的挑戰(zhàn)。

對(duì)于人力資源經(jīng)理來說,大數(shù)據(jù)分析人才的招聘說明中有太多的生詞,包括各種大數(shù)據(jù)新鮮名詞、算法和技能,而且整個(gè)技術(shù)人才市場(chǎng)對(duì)大數(shù)據(jù)經(jīng)驗(yàn)、最佳實(shí)踐的定義和標(biāo)準(zhǔn)尚無定論。

企業(yè)組建大數(shù)據(jù)分析團(tuán)隊(duì)首先需要搞清楚以下三個(gè)問題:數(shù)據(jù)分析團(tuán)隊(duì)在企業(yè)組織架構(gòu)中的智能定位、所需資源以及數(shù)據(jù)分析團(tuán)隊(duì)的架構(gòu)。

職能定位

企業(yè)上下需要在一開始就明確數(shù)據(jù)分析團(tuán)隊(duì)在企業(yè)組織架構(gòu)中的定位,以及主要的利益相關(guān)者。

不同企業(yè)的做法不同,有的企業(yè)讓CTO領(lǐng)導(dǎo)數(shù)據(jù)科學(xué)團(tuán)隊(duì),有的則選擇讓CFO甚至CMO領(lǐng)導(dǎo),有的選擇由一個(gè)項(xiàng)目經(jīng)理統(tǒng)領(lǐng)分散于不同業(yè)務(wù)部門的數(shù)據(jù)專家,還有一些企業(yè)將數(shù)據(jù)科學(xué)團(tuán)隊(duì)定位于研發(fā)團(tuán)隊(duì),沒有具體的日程表或利益相關(guān)者。

以上取決于企業(yè)的組織模式、企業(yè)文化、資源和數(shù)據(jù)科學(xué)團(tuán)隊(duì)的具體任務(wù)。由于數(shù)據(jù)科學(xué)如此性感,企業(yè)的高官們都想將其納入自己的管轄范圍,因此如果不能事先明確數(shù)據(jù)科學(xué)團(tuán)隊(duì)的職能定位,在日后的運(yùn)營(yíng)中勢(shì)必引起各部門之間的困惑和摩擦。

資源需求

了解技術(shù)人才市場(chǎng)的人都知道,數(shù)據(jù)科學(xué)人才的身價(jià)不菲,而企業(yè)往往在組建數(shù)據(jù)科學(xué)團(tuán)隊(duì)前對(duì)資源需求估計(jì)不足。

對(duì)于一個(gè)超過300人的互聯(lián)網(wǎng)公司來說,如果想組建一個(gè)有明確任務(wù)(例如推薦引擎、用戶激活等)的數(shù)據(jù)科學(xué)團(tuán)隊(duì),第一階段可以考慮組建一個(gè)5-8人的團(tuán)隊(duì),包括一名技術(shù)項(xiàng)目經(jīng)理、1-2名負(fù)責(zé)建模的數(shù)據(jù)科學(xué)家,以及3-5名數(shù)據(jù)工程師負(fù)責(zé)部署生產(chǎn)代碼。

團(tuán)隊(duì)構(gòu)成

當(dāng)明確了資源需求和團(tuán)隊(duì)規(guī)模后,下一步面臨的問題是如何找到合適的數(shù)據(jù)科學(xué)人才。正如文章開頭提到的,這對(duì)于企業(yè)的人力資源部門來說幾乎是個(gè)不可能完成的任務(wù),人力資源經(jīng)理的郵箱會(huì)迅速被充斥各種新鮮技術(shù)名詞的簡(jiǎn)歷填滿。

人力資源部門還非常容易受到媒體或數(shù)據(jù)分析廠商的影響,企業(yè)需要根據(jù)需求自行定義招聘說明中的技能要求,例如教育背景與實(shí)操經(jīng)驗(yàn)的孰重孰輕等。當(dāng)然,這些都是說起來容易做起來難。

以8人數(shù)據(jù)科學(xué)團(tuán)隊(duì)為例,團(tuán)隊(duì)初創(chuàng)成員大致分為以下三類:

1、技術(shù)項(xiàng)目經(jīng)理。

擁有3~5年的相關(guān)團(tuán)隊(duì)管理和項(xiàng)目經(jīng)驗(yàn);最好擁有扎實(shí)的技術(shù)背景,最好能夠編程(雖然并不需要真的去編程)。數(shù)據(jù)分析團(tuán)隊(duì)的技術(shù)項(xiàng)目經(jīng)理不僅僅需要豐富的項(xiàng)目管理經(jīng)驗(yàn),還必須了解數(shù)據(jù)分析相關(guān)的算法和技能,最好能夠進(jìn)行代碼審核。

2、數(shù)據(jù)科學(xué)家。

數(shù)據(jù)科學(xué)家要求有廣泛而扎實(shí)的專業(yè)背景,最好擁有物理學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)、生物學(xué)或相關(guān)學(xué)科領(lǐng)域的博士學(xué)位。判斷數(shù)據(jù)科學(xué)家水平最簡(jiǎn)單的依據(jù)是她曾經(jīng)發(fā)表過的研究論文質(zhì)量。

有一點(diǎn)需要注意的是,一位機(jī)器學(xué)習(xí)領(lǐng)域的資深專家很可能軟件開發(fā)技能很差,因此在考察數(shù)據(jù)科學(xué)家技能時(shí)不要想當(dāng)然,務(wù)必要明確其編程技能。對(duì)于以應(yīng)用為主的互聯(lián)網(wǎng)企業(yè)來說,編程技能對(duì)于一個(gè)初創(chuàng)的數(shù)據(jù)科學(xué)團(tuán)隊(duì)來說非常重要,除非你要組建的是一個(gè)學(xué)術(shù)性的數(shù)據(jù)科學(xué)團(tuán)隊(duì)。

3、數(shù)據(jù)工程師。

不需要太多學(xué)術(shù)背景,只要是對(duì)數(shù)據(jù)分析感興趣的靠譜的軟件開發(fā)人員都可勝任。數(shù)據(jù)工程師需要對(duì)算法、數(shù)據(jù)架構(gòu)和軟件工程有深入了解,尤其是算法層面,因?yàn)楹芏嘬浖こ處熯@方面的知識(shí)很薄弱,而對(duì)于數(shù)據(jù)科學(xué)團(tuán)隊(duì)來說算法至關(guān)重要??梢試L試從開源項(xiàng)目的積極貢獻(xiàn)者中去尋找未來的數(shù)據(jù)工程師。通常對(duì)數(shù)據(jù)工程師的技能要求與數(shù)據(jù)科學(xué)家類似(例如Python、Scala等)

以上每類數(shù)據(jù)科學(xué)人才的招聘要求視企業(yè)和預(yù)算的不同而異,團(tuán)隊(duì)組建初期沒必要招聘太過資深的人士,因?yàn)樵趫F(tuán)隊(duì)職能和領(lǐng)域范圍在初期會(huì)經(jīng)歷比較大的變動(dòng)。而且數(shù)據(jù)科學(xué)團(tuán)隊(duì)初期由于需要搭建數(shù)據(jù)平臺(tái),清洗數(shù)據(jù),需要干大量“臟活”。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容