數(shù)據(jù)挖掘?qū)W習(xí)規(guī)劃

感謝“凡人求索”給大家提供的這個(gè)機(jī)會(huì),可以共同來(lái)學(xué)習(xí)數(shù)據(jù)分析、數(shù)據(jù)挖掘。因?yàn)楦膶?dǎo)師不是數(shù)據(jù)挖掘方向,但是想明年秋招找數(shù)據(jù)挖掘算法相關(guān)的工作,所以2018就是一邊忙導(dǎo)師方面的事情,一邊自己學(xué)習(xí)數(shù)據(jù)挖掘方面的知識(shí)。但目前主要存在三點(diǎn)問(wèn)題:

  1. 畏懼算法的難度,沒(méi)有下定決心要做這方面工作。機(jī)器學(xué)習(xí)是今年計(jì)算機(jī)專業(yè)最火的方向,從去年研一的課程就能看出來(lái),學(xué)院里基本上人手一本周志華的《機(jī)器學(xué)習(xí)》,但是看到師兄師姐秋招的時(shí)候,基本上還是找的研發(fā)崗位,做數(shù)據(jù)挖掘、算法的人很少。原因一般都是說(shuō)算法下功夫是能學(xué)好的,但是算法崗的競(jìng)爭(zhēng)太厲害了,都是要和985的碩士去競(jìng)爭(zhēng)算法崗。所以說(shuō)算法難,不是說(shuō)學(xué)習(xí)算法難,而是說(shuō)競(jìng)爭(zhēng)工作崗位太難。
  2. 2018年所學(xué)的數(shù)據(jù)知識(shí)太過(guò)于零散,沒(méi)有成為體系?,F(xiàn)在網(wǎng)上的資料太多,把大部分資料存在網(wǎng)盤、電腦里。每天都有公眾號(hào)、閱讀平臺(tái)推薦很多書(shū)籍、視頻等。很多時(shí)候是一本書(shū)沒(méi)有看完,又去看其他的資料了。這樣導(dǎo)致說(shuō)到某個(gè)知識(shí)點(diǎn),感覺(jué)我聽(tīng)過(guò)這個(gè)術(shù)語(yǔ),但是沒(méi)有掌握它。得到的知識(shí)點(diǎn)都是碎片化的,沒(méi)有形成自己的數(shù)據(jù)挖掘知識(shí)體系。
  3. 沒(méi)有找到志同道合的小伙伴。學(xué)習(xí)的道路上,有一致目標(biāo)的小伙伴感覺(jué)還是非常重要的,可是互相監(jiān)督,競(jìng)爭(zhēng)加合作的良性循環(huán)?,F(xiàn)在身邊的人都說(shuō)算法太難了,不要弄算法,搞得每次看數(shù)據(jù)挖掘的東西都要偷偷摸摸的感覺(jué)。

馬上2019年了,這段時(shí)間也思考了很多,現(xiàn)在至少?zèng)Q定了以后就要做數(shù)據(jù)相關(guān)的工作,一來(lái)因?yàn)楝F(xiàn)在數(shù)據(jù)崗位火熱,其次現(xiàn)在越來(lái)越喜歡數(shù)據(jù)思維。數(shù)據(jù)思維就是我們對(duì)這個(gè)世界的認(rèn)知方法,從日常大量所見(jiàn),得出對(duì)自身有利的規(guī)律和對(duì)這個(gè)世界的理解。興趣是很重要的驅(qū)動(dòng)力,所以決定好好學(xué)習(xí)數(shù)據(jù)挖掘。決定了就好好去干,在這次機(jī)會(huì)下,做一個(gè)學(xué)習(xí)數(shù)據(jù)挖掘的計(jì)劃。

  • 理論篇:
    1. 數(shù)學(xué)基礎(chǔ):高等數(shù)學(xué)、線性代數(shù)、概率論、最優(yōu)化理論。數(shù)學(xué)部分基本上都已經(jīng)學(xué)過(guò),以后碰到不熟悉的知識(shí)點(diǎn)再去查看就好,不再次進(jìn)行整體學(xué)習(xí)。
    2. 傳統(tǒng)數(shù)據(jù)結(jié)構(gòu)算法:LeetCode刷題。這一部分感覺(jué)是面試很重要的東西。
    3. 機(jī)器學(xué)習(xí)算法:李航的《統(tǒng)計(jì)學(xué)方法》、周志華的《機(jī)器學(xué)習(xí)》、吳恩達(dá)的《深度學(xué)習(xí)》。要理解其原理,不能將建模過(guò)程作為一個(gè)黑箱操作,可以將一些傳統(tǒng)的機(jī)器學(xué)習(xí)算法手推出來(lái)。
      理論著重于對(duì)算法的理解,如何將一個(gè)實(shí)際問(wèn)題抽象為數(shù)學(xué)問(wèn)題,選擇合適的模型,更進(jìn)一步選擇合適的超參數(shù)。比較出各個(gè)算法的優(yōu)缺點(diǎn),各自適應(yīng)的情況。
  • 工具篇:
    1. python編程語(yǔ)言:這一部分著重學(xué)習(xí)python基礎(chǔ)和數(shù)據(jù)挖掘相應(yīng)的包。從數(shù)據(jù)獲取與存儲(chǔ)、數(shù)據(jù)清洗、特征工程、 建立模型、數(shù)據(jù)可視化等方面來(lái)學(xué)習(xí)使用python。
    2. SQL語(yǔ)言與數(shù)據(jù)庫(kù)原理:本科的時(shí)候?qū)W習(xí)過(guò)數(shù)據(jù)庫(kù)原理,但沒(méi)有使用過(guò)MySQL,需要練習(xí)MySQL的實(shí)際操作。
    3. 商用軟件如Excel。
      這是目前計(jì)劃的學(xué)習(xí)內(nèi)容,需要好好堅(jiān)持,希望可以在這個(gè)一周一篇文章的激勵(lì)下,每周都有好的產(chǎn)出成果。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 本文意在簡(jiǎn)單區(qū)分這幾者的關(guān)系,然后簡(jiǎn)單闡述如何去學(xué)習(xí)這幾個(gè)應(yīng)用. 數(shù)據(jù)分析 引用自→維基百科|數(shù)據(jù)分析 數(shù)據(jù)分析是...
    ShibaInu閱讀 6,678評(píng)論 0 6
  • (吐槽篇,實(shí)在是對(duì)傻逼無(wú)語(yǔ)了) “喂,你在哪里呀?”(語(yǔ)氣極其不耐煩) “你是誰(shuí)呀?我在外面辦事”(面對(duì)這樣的語(yǔ)氣...
    Janetff閱讀 462評(píng)論 3 1
  • 最早被這本書(shū)吸引, 是這本書(shū)的副標(biāo)題 普通人如何通過(guò)寫(xiě)作表達(dá)自己, 出于好奇翻開(kāi)來(lái)看, 竟一發(fā)不可收拾。 書(shū)中告訴...
    聽(tīng)瑛語(yǔ)閱讀 142評(píng)論 0 0
  • 在火車站等候還有將近一個(gè)小時(shí)才進(jìn)站的火車,好冷之余又有些許無(wú)聊。我今年已經(jīng)28歲了,正是人生的黃金時(shí)段。和很多大齡...
    張凡25閱讀 308評(píng)論 0 0

友情鏈接更多精彩內(nèi)容