Preliminary

之前最近可能以后都有學(xué)弟學(xué)妹問我這么一個(gè)問題:“如何快速成為數(shù)據(jù)分析師?” 因?yàn)槲移綍r(shí)苦于磕鹽(被動(dòng) - -?。瑫r(shí)間比較緊,就想著干脆寫下來(lái),也是對(duì)自己的一種重溫。

有幾句話先說(shuō)在前頭:1、這個(gè)貼只是入門,談不上高深。 如果你真的只學(xué)了三個(gè)月,那可能真的只是學(xué)了一點(diǎn)入門的知識(shí),可是如果你用一年甚至兩年的時(shí)間去仔細(xì)的咀嚼這幾本書的知識(shí),那么你遠(yuǎn)遠(yuǎn)不止入門這么簡(jiǎn)單。還是那句話,你可以秒殺一大半人。 我們都知道知識(shí)的累積和消化是需要時(shí)間和不斷的重復(fù)的。從我個(gè)人經(jīng)驗(yàn)來(lái)講,下面的很多書我都已經(jīng)看了兩三遍了,還只能懂個(gè)50%這個(gè)樣子。也就是說(shuō)其實(shí)下面這些書是有一定難度和深度的,要不然怎么能說(shuō)它們是經(jīng)典書籍呢? 好的書籍都是經(jīng)得起時(shí)間的推敲以及人類思想的咀嚼的,因此你如果真的想學(xué)好下面這十本書,1年的時(shí)間還是需要的~(先打預(yù)防針哈)

但是這個(gè)題目是關(guān)于如何快速成為數(shù)據(jù)分析師的,因此我給出的方案是在最短的時(shí)間內(nèi)掌握下面書籍的一些核心知識(shí),并不要求掌握一些細(xì)枝末節(jié),還望大家見諒。我和很多人一樣,不太喜歡快速這個(gè)詞,急于求成的結(jié)果是得不償失。換句話說(shuō),我更喜歡將題主的“快速”理解為如何在最短的時(shí)間內(nèi)高效率的成為數(shù)據(jù)分析師。?

首先,成為任何一個(gè)技術(shù)型工作的從業(yè)者最需要的就是掌握相關(guān)的專業(yè)技能,因此也可以這么理解題主的話:如何在最短的時(shí)間內(nèi)高效率的掌握數(shù)據(jù)分析知識(shí)從而達(dá)到找一份相關(guān)工作的資格!注意,我說(shuō)的是資格!

看清楚哦,我說(shuō)的是入門。入門基本上就是懂得了常規(guī)的數(shù)據(jù)分析知識(shí)并且據(jù)此找到一份簡(jiǎn)單的工作!

知乎里面有很多關(guān)于學(xué)習(xí)數(shù)據(jù)分析的帖子,寫的都很好。但是它們和快速?zèng)]有任何關(guān)系,你要完成那些大神們的書單貼,至少需要3、5年才行。因?yàn)槟鞘且粋€(gè)perfect 的數(shù)據(jù)分析師,而不是入門級(jí)別的!

我簡(jiǎn)單的將學(xué)習(xí)數(shù)據(jù)分析的同學(xué)分為三種:

1.學(xué)過(guò)計(jì)算機(jī)但不會(huì)統(tǒng)計(jì)學(xué)(新手)

2.學(xué)過(guò)統(tǒng)計(jì)學(xué)但不會(huì)計(jì)算機(jī)(小白)

3.統(tǒng)計(jì)學(xué)和計(jì)算機(jī)都不會(huì)(菜鳥)

他們的排名是: 菜鳥 < 小白 <= 新手。 無(wú)需置疑,菜鳥是最弱的級(jí)別,學(xué)習(xí)起來(lái)也是困難重重。小白和新手算是有一定的基礎(chǔ),學(xué)習(xí)起來(lái)會(huì)比較輕松一點(diǎn)。 從我個(gè)人角度來(lái)看,我覺得計(jì)算機(jī)技術(shù)要重于統(tǒng)計(jì)學(xué)知識(shí),因此我認(rèn)為學(xué)計(jì)算機(jī)的同學(xué)更容易入門。

了一個(gè)初級(jí)數(shù)據(jù)分析師應(yīng)該掌握的技能:

統(tǒng)計(jì)學(xué)基礎(chǔ);常用模型理論;R和PYTHON;網(wǎng)頁(yè)分析;數(shù)據(jù)庫(kù)技術(shù);實(shí)戰(zhàn)應(yīng)用。

簡(jiǎn)單的描述下:

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

統(tǒng)計(jì)學(xué)無(wú)需置疑是一個(gè)數(shù)據(jù)分析師的核心功底,你只有學(xué)好了統(tǒng)計(jì)學(xué)才能談得上數(shù)據(jù)分析。

但是統(tǒng)計(jì)學(xué)又常常是不夠用的,我們還需要一些高級(jí)的模型來(lái)解決我們實(shí)際業(yè)務(wù)中的問題,比如:銀行需要判斷是否給某個(gè)客戶發(fā)放信用卡 這就需要一個(gè)高級(jí)的二分類模型。這里我們的數(shù)據(jù)挖掘理論就派上用場(chǎng)了。

有了理論知識(shí),我們需要用工具去實(shí)現(xiàn)我們的理論并加以應(yīng)用。這個(gè)年代,已經(jīng)沒有人會(huì)去手工計(jì)算某個(gè)問題了,R和PYTHON就是最負(fù)盛名的數(shù)據(jù)分析工具。 關(guān)于R和PYTHON的地位,各有千秋。 至于如何學(xué)習(xí),請(qǐng)看上面的書單!

如果致力于在互聯(lián)網(wǎng)領(lǐng)域發(fā)展,那么網(wǎng)頁(yè)分析是你必看的一本書籍。這本是是大名鼎鼎的GA創(chuàng)始人著作,看一遍,做一遍會(huì)有一個(gè)不錯(cuò)的收獲。

數(shù)據(jù)分析師是跟數(shù)據(jù)打交道的,我們的數(shù)據(jù)都是存儲(chǔ)在數(shù)據(jù)庫(kù)里面的,因此掌握必備的數(shù)據(jù)庫(kù)技術(shù)是肯定要的!

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

以上就是對(duì)入門級(jí)別的數(shù)據(jù)分析師做的一個(gè)簡(jiǎn)單的描述!?

那么,在對(duì)書籍有了一定的了解之后,具體的該怎么學(xué)習(xí)呢?

我將三個(gè)月分為三個(gè)學(xué)習(xí)階段,每個(gè)階段請(qǐng)務(wù)必保持每天3個(gè)小時(shí)以上的學(xué)習(xí)時(shí)間。這個(gè)時(shí)間要求不過(guò)分,不管是對(duì)學(xué)生黨還是上班族,三個(gè)小時(shí)總是抽的出來(lái)的。

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

第一階段:初識(shí)數(shù)據(jù)分析

這個(gè)階段是你學(xué)習(xí)數(shù)據(jù)分析的第一個(gè)月。核心的三本書就是:統(tǒng)計(jì)學(xué)、R IN ACTION、深入淺出數(shù)據(jù)分析。

第一星期:好好的閱讀一下統(tǒng)計(jì)學(xué)這本教材。按照每天3個(gè)小時(shí)的時(shí)間,一個(gè)星期你至少能看完8章。踏踏實(shí)實(shí)的看完,課后習(xí)題不需要做,重點(diǎn)放在理解公式推導(dǎo)以及專業(yè)名字定義的理解上。

第二星期:有了統(tǒng)計(jì)學(xué)基礎(chǔ),R語(yǔ)言學(xué)習(xí)起來(lái)就不會(huì)太費(fèi)勁。《R in action》 是公認(rèn)的R語(yǔ)言經(jīng)典教材。跟著書上的代碼仔細(xì)的敲一筆遍,你不需要全部看完這本書,只需要學(xué)會(huì)前8章左右就差不多了。 學(xué)完后你會(huì)對(duì)統(tǒng)計(jì)學(xué)有一個(gè)更深的認(rèn)識(shí)~

第三個(gè)星期:《深入淺出數(shù)據(jù)分析》這本書很大頭,不是因?yàn)樗鼉?nèi)容多,而是因?yàn)樗鼜U話和插圖多。很有意思的一本入門級(jí)別的教材,花一個(gè)星期好好的讀一下,能學(xué)多少是多少。

第四個(gè)星期:查漏補(bǔ)缺。經(jīng)過(guò)前三個(gè)星期的學(xué)習(xí),你一定有不少的疑惑或者遺忘了某些知識(shí)。不要著急,這個(gè)星期就是用來(lái)好好回顧一下你本月所學(xué)的東西,不懂的定義再看看,不會(huì)的代碼再敲敲,不懂的知識(shí)再google一下~

第二階段:升級(jí)你的技能

第一個(gè)月只是讓你對(duì)數(shù)據(jù)分析有一個(gè)初步的認(rèn)識(shí),你已經(jīng)可以秒殺20%左右的人了(我瞎猜的)

這個(gè)月就是要升級(jí)你的技能,在對(duì)已有的知識(shí)基礎(chǔ)上做一個(gè)升華。本月任務(wù)較重,小伙伴需要?jiǎng)幽X和動(dòng)手的地方比較多。

第一個(gè)星期:《數(shù)據(jù)挖掘?qū)д摗愤@本書絕對(duì)是一本良心教材。拿到手從第一章開始閱讀,在一個(gè)星期之內(nèi)能看多少就看多少。但是要盡量多看點(diǎn),因?yàn)榇藭憧赡芤匆惠呑拥摹灰龉P記,因?yàn)槟阕龅墓P記大部分時(shí)間都是在抄書,沒啥意思的。數(shù)據(jù)挖掘可不是記憶的東西,是要靠理解的!

第二個(gè)星期:來(lái)來(lái)來(lái),python大法學(xué)起來(lái)。正所謂 life is short, I use python. 不要問那種爛大街的問題:R和PYTHON哪個(gè)好。 等你都學(xué)了,你就再也不會(huì)問這個(gè)問題了。 《利用PYTHON進(jìn)行數(shù)據(jù)分析》是你學(xué)習(xí)PYTHON的不二之選,對(duì)著書,著重學(xué)習(xí)numpy,pandas兩個(gè)包! 對(duì)了,也要學(xué)會(huì)怎么安裝PYTHON這也是技術(shù)活!

第三個(gè)星期:為什么感覺前兩個(gè)星期啥也沒學(xué)到?亂七八糟的! 沒事,這是正常的,難道你指望兩個(gè)星期就能學(xué)完數(shù)據(jù)挖掘嗎? 在此,你已經(jīng)有了一定的Python,統(tǒng)計(jì)學(xué),數(shù)據(jù)挖掘基礎(chǔ)知識(shí),那么是不是能夠講它們組合起來(lái)用一用呢? scikit-learn,你值得擁有。 看不懂沒關(guān)系,先去看看它們的文檔以及那些莫名的專業(yè)詞語(yǔ)。 然后接著學(xué)你的數(shù)據(jù)挖掘和PYTHON。

第四個(gè)星期:重復(fù)第三個(gè)星期的內(nèi)容。對(duì)了,你是不是應(yīng)該對(duì)R再做點(diǎn)事情呢?

第三階段:準(zhǔn)備一個(gè)小小的畢業(yè)吧

前兩個(gè)月會(huì)過(guò)的很痛苦,很累,很煩躁!不用擔(dān)心,你終于來(lái)到了第三個(gè)月,這個(gè)月與前兩個(gè)月完全不一樣,因?yàn)檫@個(gè)月會(huì)更加更加的痛苦?。?/p>

在這個(gè)月,我們需要開始學(xué)習(xí)sql的相關(guān)知識(shí)。SQL絕對(duì)是數(shù)據(jù)分析師的必備技能,沒有之一。作為這個(gè)星球上一個(gè)通用的語(yǔ)言,它的存在使得我們進(jìn)行數(shù)據(jù)處理時(shí)大大的提高了效率。既然SQL學(xué)了,那也就學(xué)學(xué)mysql吧,這是一個(gè)存儲(chǔ)數(shù)據(jù)的東西,你說(shuō)它重不重要呢? 這兩個(gè)并不難學(xué),稍微花點(diǎn)功夫就能入門了。

本月重點(diǎn)是重復(fù)第二個(gè)月的工作啊,繼續(xù)研究統(tǒng)計(jì)學(xué)、數(shù)據(jù)挖掘、PYTHON還有那可愛的R語(yǔ)言。怎么研究? 這個(gè)還要來(lái)問我嗎? 書單都在上面了~ 看著書復(fù)習(xí)就行。 不要忘了那個(gè)神技:scikit-learn

對(duì)了,如果你想去互聯(lián)網(wǎng)公司投份簡(jiǎn)歷,記得要把《網(wǎng)頁(yè)分析》這本書好好的過(guò)一遍,相信我。

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

最后,希望大家堅(jiān)持~ 以后有時(shí)間我也會(huì)慢慢寫更多的技術(shù)帖~

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容