我的ML啟蒙男神吳恩達(dá)ML公開課筆記(一)中學(xué)生也能看懂

前言:我是一個(gè)工作后的寶媽,很多人覺得人工智能入門很難,其實(shí)并沒有那么難。所以,我希望用非常通俗的,中學(xué)生都可以看的懂的語(yǔ)言來(lái)寫一些文章,給大家學(xué)習(xí)AI的信心。

吳恩達(dá)教授教的非常好,生動(dòng)有趣,故整理出了課堂筆記。

1 機(jī)器學(xué)習(xí)的動(dòng)機(jī)

機(jī)器學(xué)習(xí)是從早期的人工智能中興起的 ,在過(guò)去的15到20年間,他認(rèn)為是正在發(fā)展的計(jì)算機(jī)的新能力。事實(shí)上,他證明了計(jì)算機(jī)的很多程序你是無(wú)法直接編寫出來(lái)的。例如,你想通過(guò)電腦閱讀手寫的字母或是數(shù)字,那么通過(guò)給計(jì)算機(jī)編程去將我寫的東西作為輸入并且將我的草書手稿轉(zhuǎn)化成電子手稿將會(huì)非常困難。另外一個(gè)例子是你如果編寫一個(gè)程序讓飛機(jī)飛起來(lái)也是很困難的,所以,你需要使用一個(gè)學(xué)習(xí)型算法,讓計(jì)算機(jī)自己學(xué)習(xí)。比如,學(xué)習(xí)識(shí)別你的手寫體,事實(shí)上,對(duì)于手寫識(shí)別,這幾乎是取得良好效果的唯一方法,它使用的應(yīng)用程序是很難手工編程實(shí)現(xiàn)的。

學(xué)習(xí)型算法已經(jīng)使數(shù)據(jù)挖掘領(lǐng)域的研究取得了重要的進(jìn)展。舉個(gè)例子,隨著信息技術(shù)和計(jì)算機(jī)技術(shù)的發(fā)展越來(lái)越多的醫(yī)院會(huì)保存醫(yī)療記錄,例如:病人的種類,病人遇到的問(wèn)題,病人病情的預(yù)測(cè),病人的治療結(jié)果等。利用所有的這些醫(yī)療數(shù)據(jù),在醫(yī)院實(shí)現(xiàn)數(shù)字化之后也許有15年的數(shù)據(jù),使用學(xué)習(xí)型算法對(duì)它們進(jìn)行分析, 我們就可以將純粹的醫(yī)療數(shù)據(jù)轉(zhuǎn)化成有組織的醫(yī)療知識(shí),通過(guò)它們我們可以檢測(cè)到過(guò)去這段時(shí)間的醫(yī)療行為的趨勢(shì),甚至基于這些醫(yī)療知識(shí),我們可以改變醫(yī)療。在過(guò)去的十五到二十年,我們將學(xué)習(xí)算法應(yīng)用到醫(yī)院建立的病歷記錄中,并且做成了電子格式。

2 什么是機(jī)器學(xué)習(xí)

Arthur Samuel(1959):在不直接針對(duì)問(wèn)題進(jìn)行編程的情況下,賦予計(jì)算機(jī)學(xué)習(xí)能力的一個(gè)領(lǐng)域。

Arthur Samuel在機(jī)器學(xué)習(xí)的領(lǐng)域做了一些很酷的事情 ,比如說(shuō)他寫過(guò)一個(gè)可以和自己下棋的西洋棋程序。由于計(jì)算機(jī)的運(yùn)行速度比較快,所以這個(gè)程序和自己下了成千上萬(wàn)盤棋后,程序頓悟了,它意識(shí)到什么的局勢(shì)可以取得勝利,怎么樣的局勢(shì)導(dǎo)致失敗,比如它明白了“如果我的棋子占據(jù)了這些地方,我贏的概率就大”。后來(lái)奇跡出現(xiàn)了,程序的棋藝甚至超過(guò)了Arthur Samuel本人,所以說(shuō),計(jì)算機(jī)不只可以做人類明確讓它做的事情,它也可以學(xué)習(xí)技能。


Tom Mitchell(1998):對(duì)于計(jì)算機(jī)程序來(lái)說(shuō),給它一個(gè)任務(wù)T和性能測(cè)量用戶P,如果在經(jīng)驗(yàn)E的影響下,P對(duì)T的測(cè)量結(jié)果得到了改進(jìn),那么就說(shuō)該程序從E中學(xué)習(xí)。

在剛才的下棋程序的例子中,經(jīng)驗(yàn)E對(duì)應(yīng)著程序不斷和自己下棋的經(jīng)歷,任務(wù)T是下棋,性能測(cè)試P可以是它在和人類棋手對(duì)弈的勝率,通過(guò)這個(gè)定義,我們說(shuō)下棋程序在學(xué)習(xí)怎么下棋。

監(jiān)督學(xué)習(xí)

監(jiān)督學(xué)習(xí)就是說(shuō)我們給出一組標(biāo)準(zhǔn)答案,或者也稱為訓(xùn)練數(shù)據(jù),之后我們希望算法去學(xué)習(xí)標(biāo)準(zhǔn)輸入和標(biāo)準(zhǔn)答案之間的聯(lián)系,以便我們對(duì)其它的輸入,也給出更標(biāo)準(zhǔn)的答案。

我們拿房?jī)r(jià)為例,下面的幾個(gè)點(diǎn)是現(xiàn)成的房屋面積和售價(jià),分別對(duì)應(yīng)在坐標(biāo)軸上,通過(guò)這幾個(gè)點(diǎn)可以擬合成一條直線(紅色),通過(guò)這條直接可以推測(cè)出任意房屋面積的售價(jià)

同樣,還可以用曲線(綠色)來(lái)擬合

同樣的方法還可以通過(guò)前面十幾年的房?jī)r(jià)來(lái)預(yù)測(cè)未來(lái)十年內(nèi)的房?jī)r(jià),在這里給大家出個(gè)小題目,請(qǐng)根據(jù)你所在的城市前面十年的房?jī)r(jià)來(lái)預(yù)測(cè)一下十年后你所在城市的房?jī)r(jià)。如果你預(yù)測(cè)出來(lái)了,恭喜你,你完成了一個(gè)機(jī)器學(xué)習(xí)算法。

上面的問(wèn)題也稱為“回歸問(wèn)題”,回歸這個(gè)詞在某種程度上暗示了我們需要預(yù)測(cè)的變量是連續(xù)的。

分類問(wèn)題

在分類問(wèn)題中,你們要處理的變量是離散的而不是連續(xù)的。我們以一組很通用的關(guān)于乳腺癌腫瘤的數(shù)據(jù)為例,你需要讓一個(gè)算法學(xué)會(huì)預(yù)測(cè)一個(gè)腫瘤是否是惡性的,我們收集了很多腫瘤的數(shù)據(jù),但為了簡(jiǎn)單起見,我們只考慮腫瘤的大小尺寸來(lái)辨別是良性(0)還是惡性(1)。

如圖,這些數(shù)據(jù)都是離散值


但實(shí)際上,我們不只從尺寸上來(lái)辨別良性惡性,還有別的維度來(lái)考慮。比如,我們加上年齡因素,一個(gè)學(xué)習(xí)型算法可以學(xué)習(xí)一條線,從中間劃開,區(qū)分良性和惡性。如圖,直線只能在二維中分類,但實(shí)際中,還需要考慮更多的因素,比如腫塊的厚度,細(xì)胞大小的一致性等等。

如果是無(wú)限維的話,可以用支持向量機(jī)把數(shù)據(jù)映射到無(wú)限維空間中。




3 無(wú)監(jiān)督學(xué)習(xí)

就是告訴你一組數(shù)據(jù),不給出你關(guān)于數(shù)據(jù)的任何標(biāo)準(zhǔn)答案,然后讓你從這些數(shù)據(jù)中學(xué)習(xí)到一些有趣的結(jié)構(gòu)。這就是無(wú)監(jiān)督學(xué)習(xí)。

例如,一個(gè)算法會(huì)去尋找這樣的結(jié)構(gòu),然后將數(shù)據(jù)分成兩類,這就是聚類問(wèn)題。

聚類問(wèn)題可以解決很多問(wèn)題,比如說(shuō)下圖,就是嘗試按照基因在試驗(yàn)中體驗(yàn)出來(lái)的形狀對(duì)單獨(dú)的基因進(jìn)行分組

用聚類問(wèn)題也可以處理圖像,事實(shí)證明,對(duì)于一張照片,使用特定的無(wú)監(jiān)督算法,它可以學(xué)習(xí)對(duì)這些像素進(jìn)行聚類,比如下面的圖片就是聚類處理。下面兩張圖是對(duì)同一種聚類的等效表達(dá)。非監(jiān)督算法對(duì)于計(jì)算機(jī)視覺非常有用。


還有一個(gè)很酷的例子是用聚類算法還可以用一張圖片做3D重建

下圖就是用一張平面圖做成了3D世界。

無(wú)監(jiān)督學(xué)習(xí)和聚類算法可以被用在很多不同的問(wèn)題上,比如:計(jì)算機(jī)集群組織、社會(huì)網(wǎng)絡(luò)分析、市場(chǎng)劃分等,假如你是一個(gè)市場(chǎng)營(yíng)銷人員,你可能需要將市場(chǎng)劃分為由不同的消費(fèi)人群組成的市場(chǎng),這些算法還可以用來(lái)進(jìn)行天文數(shù)據(jù)的分析,用來(lái)告訴我們星系的組成情況,

還有一個(gè)不得不提的很酷的例子,稱之為雞尾酒會(huì)問(wèn)題,假設(shè)你參加了一個(gè)有很多人同時(shí)聊天的酒會(huì),我們的問(wèn)題是,在這種情況下,你如何分辨出你心儀女孩的說(shuō)話聲呢?我們可以用無(wú)監(jiān)督算法來(lái)學(xué)習(xí)每個(gè)人聲音的結(jié)構(gòu),然后將你心儀女孩的聲音提取出來(lái)。

這個(gè)只需要一行MATLAB代碼就可以實(shí)現(xiàn)


4 強(qiáng)化學(xué)習(xí)

它可以被用在你不需要進(jìn)行一次決策的情形中,例如:在利用監(jiān)督學(xué)習(xí)進(jìn)行癌癥預(yù)測(cè)的例子中,對(duì)于一個(gè)病人,你要預(yù)測(cè)他的腫瘤是否為惡性。你的預(yù)測(cè),決定了病人的生死,在強(qiáng)化學(xué)習(xí)問(wèn)題中,你通常會(huì)在一個(gè)時(shí)間內(nèi),做出一系列的決策。

我們以一個(gè)直升機(jī)為例,我們可以利用強(qiáng)化學(xué)習(xí)算法讓直升機(jī)飛起來(lái)。如果做出來(lái)了一個(gè)壞的飛行決策,飛機(jī)就不飛,如果做出了好的飛機(jī)決策,飛機(jī)就飛起來(lái)。

強(qiáng)化學(xué)習(xí)的背后有一個(gè)稱為回報(bào)函數(shù)的概念。回報(bào)函數(shù)可以這樣理解,當(dāng)你訓(xùn)練一只狗狗時(shí),如果狗狗按照你的指令做出了正確的動(dòng)作,你就說(shuō),好狗狗!如果狗狗沒有按照你的指令執(zhí)行,你就狠狠的說(shuō),壞狗狗!同樣在訓(xùn)練直升機(jī)時(shí),當(dāng)飛機(jī)執(zhí)行了正確的決策飛起來(lái),你就說(shuō),好飛機(jī)!

第二節(jié)待續(xù)


我的簡(jiǎn)介



插個(gè)小廣告,歡迎想學(xué)Pytorch 的加入我們學(xué)園

圖片發(fā)自簡(jiǎn)書App
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 首頁(yè) 資訊 文章 資源 小組 相親 登錄 注冊(cè) 首頁(yè) 最新文章 IT 職場(chǎng) 前端 后端 移動(dòng)端 數(shù)據(jù)庫(kù) 運(yùn)維 其他...
    Helen_Cat閱讀 4,152評(píng)論 1 10
  • 0.前言## 機(jī)器學(xué)習(xí)[Machine Learning]在當(dāng)今社會(huì)的火熱程度有目共睹,自己也一直想寫一下自己對(duì)M...
    流川楓AI閱讀 2,797評(píng)論 14 99
  • 書名:《丘吉爾自傳》 作者: 溫斯頓·丘吉爾 豆瓣評(píng)分: 7.1 這本書講述了丘吉爾從出生到從軍又到加入英國(guó)政壇早...
    Joyce小熊閱讀 721評(píng)論 0 0
  • 接著來(lái)說(shuō)說(shuō)另外一個(gè)面試吧,其實(shí)也是一個(gè)外包公司,只不過(guò)是駐場(chǎng)的方式。*國(guó)際是一家比較大的外包公司吧,和其他公司都有...
    valiant_xin閱讀 365評(píng)論 0 0
  • “超神”是我的大學(xué)室友也是同班同學(xué),大學(xué)開學(xué)我是最后一個(gè)進(jìn)宿舍的,當(dāng)我拿著行李進(jìn)到宿舍里的時(shí)候其他人全部在里面啦!...
    尚二四閱讀 577評(píng)論 0 11

友情鏈接更多精彩內(nèi)容