初入數(shù)據(jù)科學(xué)職業(yè)時,要避免的9個錯誤

如果你想要在數(shù)據(jù)科學(xué)方向發(fā)展,避免這9個代價不菲的初學(xué)者錯誤,你能夠免去數(shù)天,數(shù)周甚至數(shù)月的受挫。

如果您不小心,這些錯誤將會消耗您最寶貴的資源:您的時間,精力和動力。

我們將它們分為三類:

  • 學(xué)習(xí)數(shù)據(jù)科學(xué)時的錯誤
  • 申請工作時的錯誤
  • 工作面試中的錯誤

何時學(xué)習(xí)數(shù)據(jù)科學(xué)

第一套錯誤是“臥底”,很難發(fā)現(xiàn)。他們慢慢地,但肯定會耗盡你的時間和精力,而不會給你警告,他們從這個領(lǐng)域的誤解中產(chǎn)生。

1. 花費太多時間在理論上。

許多初學(xué)者陷入了花費太多時間在理論上的陷阱,無論是數(shù)學(xué)相關(guān)(線性代數(shù),統(tǒng)計學(xué)等)還是機器學(xué)習(xí)相關(guān)的(算法,派生等)。

這種方法效率低下有三個主要原因:

  • 首先,這是緩慢而艱巨的。如果你曾經(jīng)感到所有學(xué)習(xí)的內(nèi)容都非常費解,你可能已深陷陷阱。
  • 第二,你也不會保留這些概念。數(shù)據(jù)科學(xué)是一個應(yīng)用領(lǐng)域,鞏固技能的最佳方法是通過實踐。
  • 最后,如果你不能看到你正在學(xué)習(xí)的東西如何和現(xiàn)實聯(lián)系起來,那么會增加你變得消極想要放棄的風(fēng)險。
    這種重視理論的方法是學(xué)術(shù)界教授的傳統(tǒng)論調(diào),但大多數(shù)從業(yè)者更易從結(jié)果導(dǎo)向中受益。

為了避免這個錯誤:

  • 平衡花費在研究與提供實踐機會的項目的時間。
  • 學(xué)會對部分知識不求甚解。隨著進度,你自然會填補空白。
  • 了解每件作品如何適應(yīng)背景。

2.從頭編寫太多的算法。

下一個錯誤也會導(dǎo)致學(xué)生為了一棵樹錯過一片森林。在最初,你真的不需要從頭開始編寫每個算法。

雖然實現(xiàn)一些只是為了學(xué)習(xí)目的很好,但現(xiàn)實是算法正在成為商品。由于成熟的機器學(xué)習(xí)庫和基于云的解決方案,大多數(shù)從業(yè)人員從來沒有從頭開始編碼算法。

今天,了解如何在正確的設(shè)置(以正確的方式)應(yīng)用正確的算法更為重要。

為了避免這個錯誤:

  • 學(xué)習(xí)通用機器學(xué)習(xí)庫,如Scikit-Learn(Python)或Caret(R) 。
  • 如果你從頭開始編寫一個算法,這樣做是為了學(xué)習(xí)而不是完善你的實現(xiàn)。
  • 了解現(xiàn)代機器學(xué)習(xí)算法的優(yōu)勢及其優(yōu)缺點。

3. 跳入深淵。

有些人進入這個領(lǐng)域是因為他們想要構(gòu)建未來的技術(shù):自駕車,高級機器人,計算機視覺等。這些技術(shù)由深度學(xué)習(xí)和自然語言處理等技術(shù)驅(qū)動。

但是,掌握基本原理很重要。正如每個奧運潛水員都需要先學(xué)習(xí)如何游泳,你也一樣。

為了避免這個錯誤:

  • 首先掌握“古典”機器學(xué)習(xí)的技術(shù)和算法,作為高級課題的基石。
  • 知道古典機器學(xué)習(xí)仍然具有難以置信的未開發(fā)潛力。雖然算法已經(jīng)成熟,但我們?nèi)匀惶幱谕诰蛉绾卫盟鼈兊脑缙陔A段。
  • 學(xué)習(xí)系統(tǒng)的方法來解決任何形式的機器學(xué)習(xí)問題。

申請工作時

下一套錯誤可能會導(dǎo)致您在求職過程中錯過一些很好的機會。即使你已經(jīng)合格,你可以通過避免這些小錯誤來最大限度地發(fā)揮你的作用。

4.在簡歷中有太多的技術(shù)術(shù)語。

許多申請人在寫簡歷時最大的錯誤是用太多技術(shù)術(shù)語。

相反,你的簡歷應(yīng)該畫一張照片,你的核心應(yīng)該講故事。您的簡歷應(yīng)主張您對組織帶來的影響,特別是如果您申請入門級職位。

為了避免這個錯誤:

  • 不要簡單地列出您使用的編程語言或庫。描述你如何使用它們并解釋結(jié)果。
  • “少即是多……”仔細思考后強調(diào)最重要的技能,并通過消除其他不必要的內(nèi)容。
  • 制作簡歷主模板,以便您可以分離針對不同角色定制的不同版本。這保持每個版本干凈。

5. 高估學(xué)位的價值。

有時,畢業(yè)生可以高估他們的教育價值。雖然在相關(guān)領(lǐng)域的強大程度肯定會提高您的機會,但它也不夠充分,也不是通常最重要的因素。

很顯然,我們不是說畢業(yè)生傲慢自大...

在大多數(shù)情況下,在學(xué)術(shù)環(huán)境中所教授的東西與企業(yè)中應(yīng)用的機器學(xué)習(xí)過程截然不同。使用期限,客戶和技術(shù)阻礙在學(xué)術(shù)界不那么迫切地需要根據(jù)實際權(quán)衡。

為了避免這個錯誤:

  • 用使用現(xiàn)實世界數(shù)據(jù)的項目練習(xí)作為課程的補充。
  • 系統(tǒng)學(xué)習(xí)解決機器學(xué)習(xí)問題的方法。
  • 參加相關(guān)實習(xí),即使是兼職。
  • 在LinkedIn上接觸當(dāng)?shù)氐臄?shù)據(jù)科學(xué)家進行咖啡聊天。

6. 搜索工作時太局限。

數(shù)據(jù)科學(xué)是一個相對較新的領(lǐng)域,組織仍在不斷發(fā)展,以適應(yīng)日益增長的數(shù)據(jù)影響。如果您只搜索“數(shù)據(jù)科學(xué)家”開頭,那么您將會限制自己。

許多職位沒有被標(biāo)注為“數(shù)據(jù)科學(xué)”,但是它們將允許您以類似的角色發(fā)展類似的技能和功能。

為了避免這個錯誤:

  • 通過所需技能 (機器學(xué)習(xí),數(shù)據(jù)可視化,SQL等)進行搜索。
  • 按工作職責(zé)搜索(預(yù)測建模,A / B測試,數(shù)據(jù)分析等)。
  • 通過所用技術(shù)手段搜索(Python,R,Scikit-Learn,Keras等)。
  • 根據(jù)職位擴展您的搜索(數(shù)據(jù)分析師,定量分析師,機器學(xué)習(xí)工程師等)。

面試期間

最后一套錯誤是面試過程中的絆腳石。你已經(jīng)做了艱苦的工作來實現(xiàn)這一步,所以現(xiàn)在是時候做個好的結(jié)尾。

7.沒有為面試時可能談及的項目做準(zhǔn)備。

有實際的項目經(jīng)驗是當(dāng)遇到“如何做”類型面試問題時的應(yīng)對保障。不僅僅只能在假設(shè)的說明應(yīng)對方案,你還可以指出處理某些情況的具體例子。

此外,許多招聘經(jīng)理會想要你有自給自足的能力,因為數(shù)據(jù)科學(xué)角色自然包括項目管理的要素。這意味著您應(yīng)該了解整個數(shù)據(jù)科學(xué)工作流程,并了解如何將所有內(nèi)容整理在一起。

為了避免這個錯誤:

  • 從頭到尾地完成一次項目,使您能夠練習(xí)每一個重要步驟 (即數(shù)據(jù)清理,模型訓(xùn)練等)。
  • 組織你的方法論。數(shù)據(jù)科學(xué)應(yīng)該是深思熟慮的,而不是無計劃的。
  • 回顧和重新描述你過去在實習(xí),工作或課程中曾做過的項目。

8.低估領(lǐng)域知識的價值。

技術(shù)技能和機器學(xué)習(xí)知識是獲取數(shù)據(jù)科學(xué)職位的基本先決條件。但是,要真正脫穎而出,您應(yīng)該了解更多關(guān)于您將應(yīng)用您的技能的具體行業(yè)。

記住,數(shù)據(jù)科學(xué)從來不存在于真空中。

為了避免這個錯誤:

  • 如果你正在面試一個銀行的職位,請刷一些基本的財務(wù)概念。
  • 如果您在《財富》雜志500周年期間面試一個重要位置,那么就可以進行一些案例訪談并了解盈利能力的驅(qū)動因素。
  • 如果您正在為創(chuàng)業(yè)公司面試,了解其市場,并嘗試了解如何獲得競爭優(yōu)勢。
  • 簡而言之,在這里采取一點額外的舉措可以帶來很大的好處!

9.忽視溝通技巧

目前,在大多數(shù)組織中,與開發(fā)團隊或分析師團隊相比,數(shù)據(jù)科學(xué)團隊仍然很小。因此,當(dāng)入門級軟件工程師一般被一名高級工程師指導(dǎo)時,數(shù)據(jù)科學(xué)家往往在更多的跨功能設(shè)置中工作。

面試官會需要你有能夠與技術(shù)或數(shù)學(xué)背景的同事溝通的能力。

為了避免這個錯誤:

  • 練習(xí)為非技術(shù)觀眾解釋技術(shù)概念。例如,嘗試向朋友解釋你最喜歡的算法。
  • 為常見的面試問題準(zhǔn)備重點,并提供答案。
  • 實踐分析各種數(shù)據(jù)集,提取關(guān)鍵洞察力,并呈現(xiàn)您的發(fā)現(xiàn)。

結(jié)論

在本指南中,您學(xué)習(xí)了避免數(shù)據(jù)科學(xué)初學(xué)者9個最常見錯誤的實用技巧:

1.花費太多時間在理論上。
2.從頭編寫太多的算法。
3.直接跳入高級課程,例如深度學(xué)習(xí),太快。
4.在簡歷中有太多的技術(shù)術(shù)語。
5.高估學(xué)位的價值。
6.搜索工作時太局限。
7.沒有為面試時可能談及的項目做準(zhǔn)備.
8.低估領(lǐng)域知識的價值。
9.忽視溝通技巧。

翻譯來源:elitedatascience | 2017 年 6 月 23 日
本文鏈接:https://elitedatascience.com/beginner-mistakes

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容