簡單整理一下機(jī)器學(xué)習(xí)方面入門的資料。
前言
? ? ? ?首先放棄海量的資料,什么 xx學(xué)院機(jī)器學(xué)習(xí)內(nèi)部資源、機(jī)器學(xué)習(xí)從入門到進(jìn)階百 G 資源、xx 人工智能教程,等等。都沒用,幾十個(gè)G,沒工夫看完,而且資料越多越迷茫。
? ? ? ?其次,也不用從零開始。機(jī)器學(xué)習(xí)是一門融合概率論、線性代數(shù)、凸優(yōu)化、計(jì)算機(jī)、神經(jīng)科學(xué)等多方面的復(fù)雜技術(shù)。學(xué)好機(jī)器學(xué)習(xí)需要的理論知識(shí)很多,當(dāng)前沒用學(xué)習(xí)到的東西肯定也很多,所以會(huì)在學(xué)習(xí)的過程中產(chǎn)生懈怠,喪失學(xué)習(xí)的積極性。直接從實(shí)踐入手的話,從實(shí)踐到理論的話,方便查漏補(bǔ)缺,也會(huì)對學(xué)習(xí)產(chǎn)生更多的正反饋。
? ? ? ?下面進(jìn)入正題。
機(jī)器學(xué)習(xí)基礎(chǔ)
1)Andrew Ng《Machine Learning》
? ? ? ?首先非常推薦這門課,地址:
? ? ? ?機(jī)器學(xué)習(xí)-吳恩達(dá)(b站上也有)。
? ? ? ?關(guān)于這門課的官方介紹是:本課程將廣泛介紹機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和統(tǒng)計(jì)模式識(shí)別。相關(guān)主題包括:(i) 監(jiān)督式學(xué)習(xí)(參數(shù)和非參數(shù)算法、支持向量機(jī)、核函數(shù)和神經(jīng)網(wǎng)絡(luò))。(ii) 無監(jiān)督學(xué)習(xí)(集群、降維、推薦系統(tǒng)和深度學(xué)習(xí))。(iii) 機(jī)器學(xué)習(xí)實(shí)例(偏見/方差理論;機(jī)器學(xué)習(xí)和AI領(lǐng)域的創(chuàng)新)。課程將引用很多案例和應(yīng)用,您還需要學(xué)習(xí)如何在不同領(lǐng)域應(yīng)用學(xué)習(xí)算法,例如智能機(jī)器人(感知和控制)、文本理解(網(wǎng)絡(luò)搜索和垃圾郵件過濾)、計(jì)算機(jī)視覺、醫(yī)學(xué)信息學(xué)、音頻、數(shù)據(jù)庫挖掘等領(lǐng)域。
? ? ? ?這門課基本涵蓋了機(jī)器學(xué)習(xí)的主要知識(shí)點(diǎn),例如:線性回歸、邏輯回歸、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、K-Means、異常檢測等等。而且課程中沒有復(fù)雜的公式推導(dǎo)和理論分析。Ng 的目的是讓機(jī)器學(xué)習(xí)初學(xué)者能夠快速對整個(gè)機(jī)器學(xué)習(xí)知識(shí)點(diǎn)有比較整體的認(rèn)識(shí),便于快速入門。
這門課每個(gè)知識(shí)點(diǎn)都會(huì)配套相應(yīng)的練習(xí)題。可以在 Coursera 上下載,線下完成并提交。唯一的缺點(diǎn)可能是該習(xí)題都是基于 matlab 平臺(tái)的。但是,Github 上已經(jīng)有人把作業(yè)整理成為 Python 的形式了。有 .py 和 .ipynb 兩種格式。
https://github.com/nsoojin/coursera-ml-py
https://github.com/kaleko/CourseraML
2)臺(tái)大林軒田《機(jī)器學(xué)習(xí)基石》
? ? ? ?臺(tái)灣大學(xué)林軒田老師的《機(jī)器學(xué)習(xí)基石》課程由淺入深、內(nèi)容全面,基本涵蓋了機(jī)器學(xué)習(xí)領(lǐng)域的很多方面。其作為機(jī)器學(xué)習(xí)的入門和進(jìn)階資料非常適合。而且林老師的教學(xué)風(fēng)格也很幽默風(fēng)趣,總讓讀者在輕松愉快的氛圍中掌握知識(shí)。這門課比 Ng 的《Machine Learning》稍難一些,側(cè)重于機(jī)器學(xué)習(xí)理論知識(shí)。 地址:
? ? ? ?https://www.csie.ntu.edu.tw/~htlin/(視頻B站有)
下面是一位大神在這門課的16節(jié)課的精煉筆記,以供參考:
【11】Linear Models for Classification
3)臺(tái)大林軒田《機(jī)器學(xué)習(xí)技法》
? ? ? ?《機(jī)器學(xué)習(xí)技法》課程是《機(jī)器學(xué)習(xí)基石》的進(jìn)階課程。主要介紹了機(jī)器學(xué)習(xí)領(lǐng)域經(jīng)典的一些算法,包括支持向量機(jī)、決策樹、隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)等等。難度要略高于《機(jī)器學(xué)習(xí)基石》,具有很強(qiáng)的實(shí)用性。地址:
https://www.csie.ntu.edu.tw/~htlin/
下面同是這位大神給出的課程筆記:
【1】Linear Support Vector Machine
【2】Dual Support Vector Machine
【3】Kernel Support Vector Machine
【4】Soft-Margin Support Vector Machine
【11】Gradient Boosted Decision Tree
【14】Radial Basis Function Network
進(jìn)階
斯坦福CS231n李飛飛計(jì)算機(jī)視覺
? ? ? ?這門課是李飛飛主講的王牌課程,屬于機(jī)器學(xué)習(xí)的深化課程。主要介紹深度學(xué)習(xí)(尤其是卷積神經(jīng)網(wǎng)絡(luò)和與其相關(guān)的框架)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用,內(nèi)容涵蓋多種神經(jīng)網(wǎng)絡(luò)具體結(jié)構(gòu)與訓(xùn)練應(yīng)用細(xì)節(jié),以及針對大規(guī)模圖像識(shí)別,物體定位,物體檢測,圖像風(fēng)格遷移,圖像理解描述與視頻內(nèi)容識(shí)別等問題的前沿解決思路。漢化課程鏈接:
? ? ? ?斯坦福CS231n李飛飛計(jì)算機(jī)視覺