一,學(xué)習(xí)方法 MAS
總結(jié)一下,就是他找到了高效的學(xué)習(xí)方法,我把它稱為MAS 方法。
* Multi-Dimension:想要掌握一個(gè)事物,就要從多個(gè)角度去認(rèn)識(shí)它。
* Ask:不懂就問,程序員大多都很羞澀,突破這一點(diǎn),不懂就問最重要。
* Sharing:最好的學(xué)習(xí)就是分享。用自己的語(yǔ)言講出來(lái),是對(duì)知識(shí)的進(jìn)一步梳理。
二,與數(shù)據(jù)建立多維度連接
怎么和數(shù)據(jù)分析建立多維度連接呢?我特意把內(nèi)容分成了三個(gè)大類。
* 第一類是基礎(chǔ)概念。這是我們學(xué)習(xí)的基礎(chǔ),一定不能落下。
* 第二類是工具。這個(gè)部分可以很好地鍛煉你的實(shí)操能力。
* 第三類是題庫(kù)。題庫(kù)的作用是幫你查漏補(bǔ)缺,在這個(gè)過程中,你會(huì)情不自禁地進(jìn)行思考。
這個(gè)連接的過程,也是我們從“思維”到“工具”再到“實(shí)踐”的一個(gè)突破過程。如果說重要性,一定是“思維”最重要,因?yàn)樗季S是底層邏輯和框架,可以讓我們一通百通,舉一反三,但是思維修煉也是最難的。所以,我強(qiáng)調(diào)把學(xué)習(xí)重心放在工具和實(shí)踐上,即學(xué)即用,不斷積累成就感,思維也就慢慢養(yǎng)成了。
三,學(xué)習(xí)的模塊
說到底,學(xué)習(xí)數(shù)據(jù)分析的核心就是培養(yǎng)數(shù)據(jù)思維,掌握挖掘工具,熟練實(shí)踐并積累經(jīng)驗(yàn)。為了能帶給你更好的學(xué)習(xí)效果,我在專欄里設(shè)計(jì)了五大模塊。
1. 預(yù)習(xí)篇
我會(huì)給你介紹數(shù)據(jù)分析的全景圖,和你進(jìn)一步探討最佳的學(xué)習(xí)路徑。我還專門準(zhǔn)備了 3 篇 Python 入門內(nèi)容,如果你還沒有 Python 基礎(chǔ),希望能幫你快速上手,如果你已掌握了 Python,可以當(dāng)作一個(gè)復(fù)習(xí)。這么安排是因?yàn)?Python 是數(shù)據(jù)科學(xué)領(lǐng)域當(dāng)之無(wú)愧的王牌語(yǔ)言,很多數(shù)據(jù)分析利器也是基于 Python 的(再或者,你也可以購(gòu)買極客時(shí)間上的“零基礎(chǔ)學(xué) Python”視頻課程)。
2. 基礎(chǔ)篇
我會(huì)帶你修煉數(shù)據(jù)思維,從數(shù)據(jù)分析的基礎(chǔ)概念,到數(shù)據(jù)采集、數(shù)據(jù)處理以及數(shù)據(jù)可視化。我們一起從數(shù)據(jù)準(zhǔn)備的整個(gè)流程上了解數(shù)據(jù)的方方面面。
3.? 算法篇
算法是數(shù)據(jù)挖掘的精華所在,也是我們專欄的重點(diǎn)內(nèi)容。我精選了 10 大算法,包括分類、聚類和預(yù)測(cè)三大類型。每個(gè)算法我們都從原理和案例兩個(gè)維度來(lái)理解,達(dá)到即學(xué)即用的目的。
4.? 實(shí)戰(zhàn)篇
項(xiàng)目實(shí)戰(zhàn)是我們學(xué)習(xí)的一個(gè)重要關(guān)卡。我準(zhǔn)備了 5 個(gè)項(xiàng)目帶你真實(shí)體驗(yàn)。比如在金融行業(yè)中,如何使用數(shù)據(jù)分析算法對(duì)信用卡違約率進(jìn)行分析?現(xiàn)在的互聯(lián)網(wǎng)產(chǎn)品都進(jìn)入到千人千面的人工智能階段,如何針對(duì)一個(gè)視頻網(wǎng)站搭建視頻推薦算法?
5.? 工作篇
我選擇了幾個(gè)大家最關(guān)心的職場(chǎng)問題,比如面試時(shí)注意什么,職位晉升路徑是怎樣的等等,助你一臂之力。
我希望,通過這個(gè)專欄,你將有如下收獲。
1. 數(shù)據(jù)和算法思維
這不僅是在技術(shù)上的思維模式,更是我們平時(shí)看待問題解決問題的思維方式。如果你將數(shù)據(jù)視為財(cái)富,將數(shù)據(jù)分析視為獲得財(cái)富的工具,那么在大數(shù)據(jù)時(shí)代,你將獲得更寬廣的視野。
2.? 工具
用好工具,你將擁有收集數(shù)據(jù)、處理數(shù)據(jù)、得到結(jié)果的能力,它會(huì)讓你在工作中游刃有余。
3.? 更好的工作機(jī)會(huì)和價(jià)值
無(wú)論是當(dāng)前火爆的人工智能,還是數(shù)據(jù)算法工程師的市場(chǎng),都很看重?cái)?shù)據(jù)分析和數(shù)據(jù)處理的能力。從“思維”到“工具”再到“實(shí)踐”,沿著這個(gè)路徑拓展自己的能力邊界,擁有更強(qiáng)的競(jìng)爭(zhēng)力。
在你面前,即將開始一場(chǎng)數(shù)據(jù)科學(xué)之旅。我們一起用 15 周的時(shí)間,從算法原理、分析工具和實(shí)戰(zhàn)案例三個(gè)維度體會(huì)數(shù)據(jù)科學(xué)之美。
正式啟程之前,我想邀請(qǐng)你聊聊自己對(duì)課程的期待,你如何看待數(shù)據(jù)挖掘和數(shù)據(jù)分析?你的工作和生活中有什么事情用到過數(shù)據(jù)思維嗎?
寫留言
精選留言
Hank_Yan
15
業(yè)務(wù)洞察是分析數(shù)據(jù)的前提,分析數(shù)據(jù)是理解數(shù)據(jù)的前提,理解數(shù)據(jù)是數(shù)據(jù)挖掘的前提。從業(yè)務(wù)到數(shù)據(jù)再到挖掘,每一步環(huán)環(huán)相扣,相輔相成。業(yè)務(wù)千變?nèi)f化,規(guī)律亙古不變。期待老師提綱挈領(lǐng),從整體思路點(diǎn)撥,用經(jīng)典案例教學(xué),讓每一位學(xué)生學(xué)到真本事,共勉。
2018-12-17
作者回復(fù)
這位老師總結(jié)的也很到位
2018-12-18
Aggi
8
希望多講一些分析的思維,以及和實(shí)際業(yè)務(wù)關(guān)聯(lián)的案例的整個(gè)流程
2018-12-17
作者回復(fù)
這個(gè)沒問題,專欄中重點(diǎn)就是告訴你如何使用這些工具,以及案例實(shí)戰(zhàn)訓(xùn)練。當(dāng)然你也會(huì)在案例和工具中,訓(xùn)練你的數(shù)據(jù)思維,以及對(duì)他們的認(rèn)知
2018-12-17
別問
7
求推薦一些數(shù)據(jù)分析的書,謝謝。
2018-12-17
作者回復(fù)
思維:
《思維簡(jiǎn)史:從叢林到宇宙》
數(shù)據(jù)處理
《數(shù)據(jù)挖掘:概念與技術(shù)》
《Pentaho Kettle解決方案》
《精益數(shù)據(jù)分析》
《Small Data》
《利用Python進(jìn)行數(shù)據(jù)分析》
2018-12-17
汪汪汪
6
本人是轉(zhuǎn)行學(xué)習(xí)數(shù)據(jù)分析,想通過兩個(gè)月時(shí)間自學(xué),順利拿到offer進(jìn)入崗位進(jìn)行實(shí)操。目前看了《深入淺出數(shù)據(jù)分析》那本書,然后學(xué)了python基礎(chǔ)知識(shí),想請(qǐng)問老師,接下來(lái)該如何開展學(xué)習(xí)計(jì)劃。我想學(xué)python常用的幾個(gè)庫(kù),從爬蟲開始獲取外部數(shù)據(jù),熟悉常用的數(shù)據(jù)挖掘算法,最后花兩個(gè)星期學(xué)習(xí)基礎(chǔ)的SQL和excel操作。您的建議是什么?我手上的學(xué)習(xí)資源比較多,所以得重點(diǎn)篩選。期待老師的回信
2018-12-18
作者回復(fù)
多謝關(guān)注,1)首先從爬蟲開始是不錯(cuò)的,這樣你能感受到成長(zhǎng)的過程。
2)數(shù)據(jù)挖掘算法,如果你想了解十大算法的話,理論部分你需要花一些功夫。當(dāng)然這些在Python中都有類庫(kù)可以使用。做練習(xí)的話,你也可以把這些算法都用一遍,然后看下哪個(gè)算法模型的結(jié)果更好
3)網(wǎng)上這方面的資源確實(shí)比較多,他們大多講的是理論原理。我認(rèn)為你更注重的在于實(shí)戰(zhàn),因?yàn)樽鲰?xiàng)目不僅更有成就感,還能更好的讓你理解這些算法、爬蟲的原理。
我會(huì)在專欄里給你做個(gè)“專屬題庫(kù)”,對(duì)應(yīng)爬蟲、數(shù)據(jù)挖掘這些的題目,你可以做個(gè)評(píng)測(cè),不明白的地方,我也會(huì)給你做講解。
4)資料比較多,但其實(shí)不用每個(gè)都看一遍。尤其是理論的部分,看一遍就可以了。關(guān)鍵是把它抽出來(lái)做個(gè)思維導(dǎo)圖,方便查詢,這樣下次看導(dǎo)圖就能回憶起來(lái)講的是什么。省時(shí)又高效!
2018-12-18
五岳尋仙
6
老師好!看到這個(gè)專欄很興奮!對(duì)數(shù)據(jù)挖掘/機(jī)器學(xué)習(xí)很感興趣,自學(xué)有段時(shí)間了,也接觸了不少工具,但遇到具體問題還是很盲目,有下面幾個(gè)方面的困惑:
1. 如何做好“特征工程”,沒有思路,也沒有思考方向,看了不少博客,所謂的技巧也都知道了,但遇到問題還是用不好;
2. 對(duì)于樣本類別不均衡的問題,不會(huì)處理,嘗試過下采樣或過采樣,但似乎改變了樣本原本的分布,效果不太好;
3. 對(duì)各種機(jī)器模型輸出的結(jié)果沒有把控能力,搞不懂為何有時(shí)效果好,有時(shí)效果卻很差。
因?yàn)闆]有人帶,自學(xué)感覺很迷茫,希望能跟隨這門課程提升自己應(yīng)用能力。
另外,想請(qǐng)教一下老師,為了能更好地掌握經(jīng)典的機(jī)器學(xué)習(xí)算法,有沒有必要自己實(shí)現(xiàn)一遍?
2018-12-17
作者回復(fù)
感謝你的熱情和關(guān)注,我認(rèn)為非常有必要自己使用這些機(jī)器學(xué)習(xí)算法來(lái)解決實(shí)際問題。
當(dāng)然原理可以采用偽代碼的方式,把流程畫出來(lái)即可。項(xiàng)目中,很多時(shí)候都是直接使用類庫(kù),所以你更應(yīng)該關(guān)注的機(jī)器學(xué)習(xí)的效率和結(jié)果。
很多時(shí)候,我們?cè)谶x擇模型的時(shí)候,都要試,一次會(huì)用多種模型,然后看訓(xùn)練結(jié)果的好壞,再?zèng)Q定采用哪個(gè)模型。
特征工程,以及調(diào)試的過程其實(shí)就是經(jīng)驗(yàn)積累的過程,很多時(shí)候調(diào)參數(shù)的時(shí)間,比你寫程序的時(shí)間還要長(zhǎng)。但是這個(gè)積累過程還是挺重要的,當(dāng)你有了更多經(jīng)驗(yàn)之后,這個(gè)“試”的效率就會(huì)提升!
2018-12-18
姜戈
3
之前一直在看推薦系統(tǒng)的內(nèi)容,還沒入門,就被各種算法搞得頭大,瀏覽了課程安排,希望數(shù)據(jù)分析45講讓我對(duì)推薦系統(tǒng)的學(xué)習(xí)打下堅(jiān)實(shí)基礎(chǔ).
2018-12-17
作者回復(fù)
其實(shí)實(shí)戰(zhàn)是最好的學(xué)習(xí),你可以在項(xiàng)目實(shí)戰(zhàn)中體會(huì)這些算法,當(dāng)然我也會(huì)給你講解這些算法的原理。所以我安排了從“認(rèn)知”=>“工具”=>“實(shí)戰(zhàn)”的過程,并且會(huì)給你總結(jié)“思維導(dǎo)圖”和“專屬題庫(kù)”幫你來(lái)鞏固學(xué)習(xí)
2018-12-17
草莓味冰糕
2
我是一個(gè)想轉(zhuǎn)商業(yè)數(shù)據(jù)分析與挖掘的生物學(xué)(生物信息方向)碩士研究生,很需要有一門課大概能告訴我一個(gè)算法或者數(shù)學(xué)模型適用于哪些商業(yè)或者運(yùn)營(yíng)的情景,這是我現(xiàn)在急需的,也是對(duì)課程的期望,哪些東西可以解決哪些問題,也希望作者能推薦一些類似的書,期望自己能在這么課收獲很多,找到自己的路
2018-12-18
作者回復(fù)
我上大學(xué)的時(shí)候,也了解一些生物信息學(xué)的情況,非常能理解你的心情和想轉(zhuǎn)到商業(yè)數(shù)據(jù)分析的決心。
我覺得需要從兩個(gè)方面來(lái)下手:
1)工具角度:課程里講的算法,你可以幫他當(dāng)做是個(gè)工具。他的誕生是從數(shù)學(xué)原理開始,形成的理論模型。
這些模型都有自己的特點(diǎn)和適用范圍。但總的來(lái)說,還是工具
2)商業(yè)角度:工作或應(yīng)用中,首先都是從商業(yè)角度出發(fā)的,尤其是哪些是高頻使用的,或者離“錢”更近的地方,也就是決策價(jià)值更大的地方。
當(dāng)然從工具使用到商業(yè)價(jià)值的轉(zhuǎn)換,還需要你有自己的思維和建模能力
商業(yè)相關(guān)書籍推薦:
《洛克菲勒留給兒子的38封信》
《商業(yè)冒險(xiǎn):華爾街的12個(gè)經(jīng)典故事》
《從0到1:開啟商業(yè)與未來(lái)的秘密》
《商業(yè)的本質(zhì)》
數(shù)據(jù)分析相關(guān)書籍:
《數(shù)據(jù)挖掘:概念與技術(shù)》
《Pentaho Kettle解決方案》
《精益數(shù)據(jù)分析》
《Small Data》
《利用Python進(jìn)行數(shù)據(jù)分析》
2018-12-18
upup
2
思維和業(yè)務(wù)能畫等號(hào)嗎?我認(rèn)為不懂業(yè)務(wù)只會(huì)工具和算法的不叫數(shù)據(jù)分析師,因?yàn)樗麤]辦法解釋業(yè)務(wù)。有了數(shù)據(jù)思維能通用于任何行業(yè)嗎?
2018-12-18
作者回復(fù)
同意你說的,我在后面也會(huì)講到,想要用數(shù)據(jù)挖掘,第一步是對(duì)商業(yè)的理解,只有確定好了商業(yè)目標(biāo),數(shù)據(jù)挖掘才有目標(biāo)。
數(shù)據(jù)思維是一種思考方式,世界本身有很多維度,我們從哪個(gè)維度看待它,就會(huì)從哪個(gè)維度收獲它
2018-12-18
勿忘初心
2
數(shù)據(jù)挖掘:對(duì)數(shù)據(jù)累計(jì)過程
數(shù)據(jù)分析:通過數(shù)據(jù)關(guān)聯(lián),進(jìn)一步解決現(xiàn)實(shí)問題
數(shù)據(jù)思維:暫時(shí)沒想到
2018-12-17
作者回復(fù)
感謝你的分享,數(shù)據(jù)挖掘其實(shí)是算法的過程,也就是創(chuàng)造“分類器”,這個(gè)分類器就是機(jī)器的大腦
數(shù)據(jù)分析,算是個(gè)比較大的概念,包括了 數(shù)據(jù)采集,數(shù)據(jù)預(yù)處理,數(shù)據(jù)可視化,和數(shù)據(jù)挖掘的過程。
數(shù)據(jù)思維,這個(gè)應(yīng)該是底層的思維了。更多時(shí)候,是我們看待問題的角度。
你用什么樣的方式看待它,就會(huì)有什么樣的結(jié)果。這個(gè)說起來(lái)有些“哲學(xué)”高度,換個(gè)角度來(lái)說,也可以說是我們對(duì)“數(shù)據(jù)”的好奇心。
2018-12-18
魚魚魚培填
1
學(xué)習(xí)筆記:
數(shù)據(jù)分析的運(yùn)用:
? ? ? ? 了解產(chǎn)品用戶畫像,分析留存率/流失率等指標(biāo),更好地改善產(chǎn)品
? ? ? ? 預(yù)測(cè)股票、比特幣的走勢(shì)
? ? ? ? 信用卡反欺詐、屏蔽垃圾郵件等生活煩事
MAS學(xué)習(xí)法
多角度認(rèn)識(shí)
掌握基礎(chǔ)概念
使用好工具
多練習(xí)多實(shí)踐
不懂就要向他人學(xué)習(xí)
將學(xué)到的知識(shí)用自我認(rèn)知分享出來(lái)
期待跟著老師學(xué)習(xí),之后可以找到相關(guān)工作
2018-12-19
極客李
1
您好,看到這個(gè)課程很興奮,感覺實(shí)用性會(huì)很強(qiáng),能理論結(jié)合實(shí)際。我之前自學(xué)過numpy和pandas庫(kù),但是一直沒明白怎么把它們應(yīng)用到具體的場(chǎng)景,能帶來(lái)什么實(shí)際的效益。
2018-12-18
作者回復(fù)
numpy和pandas是python的第三方庫(kù),你可以理解是對(duì)python的擴(kuò)展,他定義了適合數(shù)組和矩陣的 數(shù)據(jù)結(jié)構(gòu)和基礎(chǔ)算法。我們就可以很方便的對(duì)他們進(jìn)行操作。
當(dāng)然進(jìn)一步的使用數(shù)據(jù)挖掘算法,你還會(huì)用到sklearn庫(kù)。如果是深度學(xué)習(xí)的話,還會(huì)使用到keras, pytorch 或者 tensorflow框架