感謝“凡人求索”給大家提供的這個(gè)機(jī)會(huì),可以共同來(lái)學(xué)習(xí)數(shù)據(jù)分析、數(shù)據(jù)挖掘。因?yàn)楦膶?dǎo)師不是數(shù)據(jù)挖掘方向,但是想明年秋招找數(shù)據(jù)挖掘算法相關(guān)的工作,所以2018就是一邊忙導(dǎo)師方面的事情,一邊自己學(xué)習(xí)數(shù)據(jù)挖掘方面的知識(shí)。但目前主要存在三點(diǎn)問(wèn)題:
- 畏懼算法的難度,沒(méi)有下定決心要做這方面工作。機(jī)器學(xué)習(xí)是今年計(jì)算機(jī)專業(yè)最火的方向,從去年研一的課程就能看出來(lái),學(xué)院里基本上人手一本周志華的《機(jī)器學(xué)習(xí)》,但是看到師兄師姐秋招的時(shí)候,基本上還是找的研發(fā)崗位,做數(shù)據(jù)挖掘、算法的人很少。原因一般都是說(shuō)算法下功夫是能學(xué)好的,但是算法崗的競(jìng)爭(zhēng)太厲害了,都是要和985的碩士去競(jìng)爭(zhēng)算法崗。所以說(shuō)算法難,不是說(shuō)學(xué)習(xí)算法難,而是說(shuō)競(jìng)爭(zhēng)工作崗位太難。
- 2018年所學(xué)的數(shù)據(jù)知識(shí)太過(guò)于零散,沒(méi)有成為體系?,F(xiàn)在網(wǎng)上的資料太多,把大部分資料存在網(wǎng)盤、電腦里。每天都有公眾號(hào)、閱讀平臺(tái)推薦很多書(shū)籍、視頻等。很多時(shí)候是一本書(shū)沒(méi)有看完,又去看其他的資料了。這樣導(dǎo)致說(shuō)到某個(gè)知識(shí)點(diǎn),感覺(jué)我聽(tīng)過(guò)這個(gè)術(shù)語(yǔ),但是沒(méi)有掌握它。得到的知識(shí)點(diǎn)都是碎片化的,沒(méi)有形成自己的數(shù)據(jù)挖掘知識(shí)體系。
- 沒(méi)有找到志同道合的小伙伴。學(xué)習(xí)的道路上,有一致目標(biāo)的小伙伴感覺(jué)還是非常重要的,可是互相監(jiān)督,競(jìng)爭(zhēng)加合作的良性循環(huán)?,F(xiàn)在身邊的人都說(shuō)算法太難了,不要弄算法,搞得每次看數(shù)據(jù)挖掘的東西都要偷偷摸摸的感覺(jué)。
馬上2019年了,這段時(shí)間也思考了很多,現(xiàn)在至少?zèng)Q定了以后就要做數(shù)據(jù)相關(guān)的工作,一來(lái)因?yàn)楝F(xiàn)在數(shù)據(jù)崗位火熱,其次現(xiàn)在越來(lái)越喜歡數(shù)據(jù)思維。數(shù)據(jù)思維就是我們對(duì)這個(gè)世界的認(rèn)知方法,從日常大量所見(jiàn),得出對(duì)自身有利的規(guī)律和對(duì)這個(gè)世界的理解。興趣是很重要的驅(qū)動(dòng)力,所以決定好好學(xué)習(xí)數(shù)據(jù)挖掘。決定了就好好去干,在這次機(jī)會(huì)下,做一個(gè)學(xué)習(xí)數(shù)據(jù)挖掘的計(jì)劃。
- 理論篇:
- 數(shù)學(xué)基礎(chǔ):高等數(shù)學(xué)、線性代數(shù)、概率論、最優(yōu)化理論。數(shù)學(xué)部分基本上都已經(jīng)學(xué)過(guò),以后碰到不熟悉的知識(shí)點(diǎn)再去查看就好,不再次進(jìn)行整體學(xué)習(xí)。
- 傳統(tǒng)數(shù)據(jù)結(jié)構(gòu)算法:LeetCode刷題。這一部分感覺(jué)是面試很重要的東西。
- 機(jī)器學(xué)習(xí)算法:李航的《統(tǒng)計(jì)學(xué)方法》、周志華的《機(jī)器學(xué)習(xí)》、吳恩達(dá)的《深度學(xué)習(xí)》。要理解其原理,不能將建模過(guò)程作為一個(gè)黑箱操作,可以將一些傳統(tǒng)的機(jī)器學(xué)習(xí)算法手推出來(lái)。
理論著重于對(duì)算法的理解,如何將一個(gè)實(shí)際問(wèn)題抽象為數(shù)學(xué)問(wèn)題,選擇合適的模型,更進(jìn)一步選擇合適的超參數(shù)。比較出各個(gè)算法的優(yōu)缺點(diǎn),各自適應(yīng)的情況。
- 工具篇:
- python編程語(yǔ)言:這一部分著重學(xué)習(xí)python基礎(chǔ)和數(shù)據(jù)挖掘相應(yīng)的包。從數(shù)據(jù)獲取與存儲(chǔ)、數(shù)據(jù)清洗、特征工程、 建立模型、數(shù)據(jù)可視化等方面來(lái)學(xué)習(xí)使用python。
- SQL語(yǔ)言與數(shù)據(jù)庫(kù)原理:本科的時(shí)候?qū)W習(xí)過(guò)數(shù)據(jù)庫(kù)原理,但沒(méi)有使用過(guò)MySQL,需要練習(xí)MySQL的實(shí)際操作。
- 商用軟件如Excel。
這是目前計(jì)劃的學(xué)習(xí)內(nèi)容,需要好好堅(jiān)持,希望可以在這個(gè)一周一篇文章的激勵(lì)下,每周都有好的產(chǎn)出成果。