機(jī)器學(xué)習(xí)入門(中/英)有趣及有利的特征識(shí)別

如果我的分享對(duì)您有用,可以點(diǎn)擊下面鏈接支持一下我的勞動(dòng)成果
我分享了300元學(xué)費(fèi)紅包給你,快來(lái)學(xué)Google、亞馬遜、Facebook官方的機(jī)器學(xué)習(xí)、數(shù)據(jù)分析、前端開發(fā)課程。在這領(lǐng)取:
https://cn.udacity.com/referral-invitation/?referral_recipient_amount_off=300&referral_recipient_coupon_code=E54FD818


課程概述
如今,機(jī)器學(xué)習(xí)是通向數(shù)據(jù)分析領(lǐng)域最令人興奮的職業(yè)生涯的“頭等艙”機(jī)票。隨著數(shù)據(jù)源以及處理這些數(shù)據(jù)所需計(jì)算能力的不斷增殖,直搗數(shù)據(jù)“黃龍”已成為快速獲取洞見和做出預(yù)測(cè)的最簡(jiǎn)單直白的方法。
機(jī)器學(xué)習(xí)將計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)結(jié)合起來(lái),駕馭這種預(yù)測(cè)能力。對(duì)于所有志向遠(yuǎn)大的數(shù)據(jù)分析師和數(shù)據(jù)科學(xué)家,或者希望將浩瀚的原始數(shù)據(jù)整理成提純的趨勢(shì)和預(yù)測(cè)值的其他所有人士,機(jī)器學(xué)習(xí)都是一項(xiàng)必備技能。
本課程將透過(guò)機(jī)器學(xué)習(xí)的視角向你講授終端到終端的數(shù)據(jù)調(diào)查過(guò)程。課程將向你講解如何提取和識(shí)別最能表示你的數(shù)據(jù)的有用特征、一些最重要的機(jī)器學(xué)習(xí)算法,以及如何評(píng)價(jià)你的機(jī)器學(xué)習(xí)算法的性能。此課程提供中文版本。
喜歡這門課程?加入“機(jī)器學(xué)習(xí)工程師”或“數(shù)據(jù)分析師納米學(xué)位。

** 為什么學(xué)習(xí)這門課程?
這門課程中,你將手腦并用,通過(guò)實(shí)踐來(lái)學(xué)習(xí)!我們將通過(guò)展示引人入勝的使用案例以及解決趣味橫生的現(xiàn)實(shí)世界問(wèn)題(例如無(wú)人駕駛車),將機(jī)器學(xué)習(xí)帶到現(xiàn)實(shí)生活中來(lái)。在畢業(yè)設(shè)計(jì)中,你將挖掘美國(guó)安然(Enron)公司的電子郵件和財(cái)務(wù)數(shù)據(jù),找出美國(guó)歷史上一次最大的公司欺詐案中的利益相關(guān)人士。
完成此入門課程之后,你將可以使用機(jī)器學(xué)習(xí)技術(shù)分析數(shù)據(jù),也準(zhǔn)備好攻讀我們的數(shù)據(jù)分析師納米學(xué)位了。課程一開始,為了助你在機(jī)器學(xué)習(xí)的旅程上起步,我們將教你如何使用輔助工具(如預(yù)先寫好的算法與程序庫(kù))回答有趣的問(wèn)題。

** 先修要求
要想通過(guò)本課程,你必須事先精通 Python 編程,并了解基本統(tǒng)計(jì)學(xué)知識(shí)。如果你需要回顧一下這些主題,可以看一看以下課程:
計(jì)算機(jī)科學(xué)導(dǎo)論 (你需要知道基本數(shù)據(jù)結(jié)構(gòu)和控制語(yǔ)句,并能夠編寫和導(dǎo)入函數(shù)。)
推論統(tǒng)計(jì)學(xué)入門
描述統(tǒng)計(jì)學(xué)入門

另一門課程數(shù)據(jù)科學(xué)入門最好也學(xué)一下,因?yàn)樗鼘⒂兄闶煜と绾我钥茖W(xué)的方式解決問(wèn)題。然而,不需要完成此額外課程,即能夠通過(guò)本課程。我們還將用到一點(diǎn)點(diǎn) git 的東西,相關(guān)課程也可以在優(yōu)達(dá)學(xué)城上找到。
有一點(diǎn)我們不作要求,那就是你不需要事先了解機(jī)器學(xué)習(xí)。如果你是剛剛接觸機(jī)器學(xué)習(xí)的初學(xué)者,那你來(lái)對(duì)地方了。
查看使用優(yōu)達(dá)學(xué)城的技術(shù)要求。

** 你將學(xué)習(xí)什么內(nèi)容?
項(xiàng)目
從安然公司郵件中識(shí)別欺詐行為
你將扮演偵探角色,運(yùn)用你所學(xué)的機(jī)器學(xué)習(xí)技能,根據(jù)安然公司公開的財(cái)務(wù)和郵件數(shù)據(jù)集,創(chuàng)建一個(gè)算法,從而識(shí)別可能有欺詐行為的安然公司員工。

** 學(xué)習(xí)計(jì)劃
你將學(xué)習(xí)如何從一個(gè)問(wèn)題和/或數(shù)據(jù)集入手,使用機(jī)器學(xué)習(xí)把它們轉(zhuǎn)化為洞見。
第 1-4 課:監(jiān)督分類
樸素貝葉斯模型:我們首先學(xué)習(xí)也許是世界上最偉大的文本分類算法。
支持向量機(jī) (SVMs):機(jī)器學(xué)習(xí)領(lǐng)域10佳算法之一,在許多分類任務(wù)中都必須嘗試的一種算法。它為什么如此特別?因?yàn)樗軌颡?dú)立地、飛速地生成新特征。
決策樹:非常直白,往往準(zhǔn)確度不亞于SVM,但是(通常)要快得多。它是更復(fù)雜的方法(比如隨機(jī)森林和 Boosting 方法)的起步點(diǎn)。
第 5 課:數(shù)據(jù)集和問(wèn)題
在任何大型機(jī)器學(xué)習(xí)項(xiàng)目的背后,都有一個(gè)巨大的數(shù)據(jù)集,供算法從中借鑒。我們的靈感來(lái)自安然公司的電子郵件和財(cái)務(wù)數(shù)據(jù)這個(gè)“寶箱”,它本來(lái)應(yīng)該是嚴(yán)格保密的,但是當(dāng)該公司因一件重大欺詐案破產(chǎn)后,公諸于世。在講師的帶領(lǐng)下,讓我們將這個(gè)數(shù)據(jù)集整理成準(zhǔn)備好可供機(jī)器學(xué)習(xí)的格式,目標(biāo)是嘗試預(yù)測(cè)欺詐案件。
第 6、7 課:回歸與異常值
回歸法是使用最廣泛的機(jī)器學(xué)習(xí)算法,其重要程度與“分類”不相上下。然而,在回歸法當(dāng)中,有種情況會(huì)造成迅速出錯(cuò),知道是什么嗎?那就是數(shù)據(jù)中存在讓人傷腦筋的異常值。我們將攻克難關(guān),看一看如何識(shí)別和清理走那些煩人的數(shù)據(jù)點(diǎn)。
第 8 課:非監(jiān)督學(xué)習(xí)
K-Means 聚類:處理沒有標(biāo)記的數(shù)據(jù)時(shí),它是同類算法中的佼佼者。使用它可以在首次接觸數(shù)據(jù)集時(shí)快速地搜尋其中的范式。
第 9-12 課:特征、特征、特征!
特征創(chuàng)建:把你對(duì)世界具有的人類直覺變成計(jì)算機(jī)可以使用的數(shù)據(jù)。
特征選擇:愛因斯坦說(shuō)得好:“讓一切盡可能的簡(jiǎn)單,簡(jiǎn)單到不能再簡(jiǎn)單。”應(yīng)用到我們這門課,就是說(shuō)要識(shí)別你的數(shù)據(jù)的最重要特征。
主成分分析:特征選擇的一個(gè)更復(fù)雜的做法,最重要的非監(jiān)督學(xué)習(xí)方法之一。
特征縮放:確保你的數(shù)據(jù)和算法能夠相互配合的簡(jiǎn)單技巧。從文本學(xué)習(xí):在文本中可以找到的信息比任何其他格式都多,而且我們有現(xiàn)成的有效而又簡(jiǎn)單的工具用于提取這些信息。
第 13-14 課:驗(yàn)證與評(píng)價(jià)
培訓(xùn)/測(cè)試數(shù)據(jù)拆分:怎樣才能知道你所做的是否有效?只有靠驗(yàn)證。訓(xùn)練-測(cè)試拆分十分簡(jiǎn)單,也是理解你的結(jié)果的黃金標(biāo)準(zhǔn)。
交叉驗(yàn)證:給你的訓(xùn)練/測(cè)試拆分函數(shù)注射一點(diǎn)激素!像專業(yè)人士那樣驗(yàn)證你的機(jī)器學(xué)習(xí)結(jié)果。
精度、召回和 F1 得分(調(diào)和均值):經(jīng)過(guò)所有這些數(shù)據(jù)驅(qū)動(dòng)的辛苦勞作,現(xiàn)在應(yīng)該針對(duì)你最關(guān)心的問(wèn)題定制指標(biāo),用來(lái)量化你的結(jié)果了。
第 15 課:最后總結(jié)
我們退后一步,回顧我們迄今已經(jīng)學(xué)到了哪些內(nèi)容,看一看它們?nèi)绾涡纬梢粋€(gè)整體。
項(xiàng)目
每節(jié)課結(jié)束有迷你項(xiàng)目
畢業(yè)設(shè)計(jì):在安然公司數(shù)據(jù)中尋找公司欺詐的跡象。

講師與合作伙伴

Katie Malone

** Katie Malone

Katie 是實(shí)驗(yàn)物理學(xué)家出身,她第一次接觸到機(jī)器學(xué)習(xí)是在搜索希格斯玻色子等新粒子時(shí),并從此對(duì)機(jī)器學(xué)習(xí)產(chǎn)生了興趣。不過(guò),學(xué)習(xí)機(jī)器學(xué)習(xí)可不需要物理博士學(xué)位。很榮幸,Katie 欣然接受了我們的邀請(qǐng),來(lái)教大家如何使用數(shù)據(jù)分析解決有趣的問(wèn)題。除了在實(shí)驗(yàn)室尋找新粒子和從事教學(xué)之外,她通常會(huì)在野外跑跑步,或者用食物“賄賂”鄰家的小狗。

Sebastian Thrun

** Sebastian Thrun

Sebastian Thrun 是優(yōu)達(dá)學(xué)城的創(chuàng)始人,同時(shí)也是斯坦福大學(xué)計(jì)算機(jī)科學(xué)專業(yè)研究教授、Google 研究員、美國(guó)國(guó)家工程院和德國(guó)科學(xué)院成員。Thrun 因?yàn)樗跈C(jī)器人和機(jī)器學(xué)習(xí)領(lǐng)域的研究為人所知,他在無(wú)人駕駛車領(lǐng)域的研究尤為出眾。


如果我的分享對(duì)您有用,可以點(diǎn)擊下面鏈接支持一下我的勞動(dòng)成果
我分享了300元學(xué)費(fèi)紅包給你,快來(lái)學(xué)Google、亞馬遜、Facebook官方的機(jī)器學(xué)習(xí)、數(shù)據(jù)分析、前端開發(fā)課程。在這領(lǐng)取:
https://cn.udacity.com/referral-invitation/?referral_recipient_amount_off=300&referral_recipient_coupon_code=E54FD818

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容