接觸機(jī)器學(xué)習(xí)的第一周,我首先學(xué)習(xí)了關(guān)于監(jiān)督學(xué)習(xí)以及非監(jiān)督學(xué)習(xí)的含義。
一、監(jiān)督學(xué)習(xí)
關(guān)于監(jiān)督學(xué)習(xí)supervised learning,我的理解就是,每一個(gè)數(shù)據(jù)都要有一個(gè)對(duì)應(yīng)的值。
監(jiān)督學(xué)習(xí)又可以分為兩種:
1、regression problem回歸類(lèi)問(wèn)題
回歸類(lèi)問(wèn)題的求解對(duì)應(yīng)的是一個(gè)連續(xù)的值
關(guān)于regression problem,吳恩達(dá)老師的舉例是說(shuō)有一堆關(guān)于房子大小的房?jī)r(jià)的數(shù)據(jù),然后你來(lái)預(yù)測(cè)一下你朋友的房子應(yīng)該值多少錢(qián)。下圖就是每個(gè)房子大小對(duì)應(yīng)的房?jī)r(jià)值。

可以看到每一個(gè)房子大小不同都是有一個(gè)對(duì)應(yīng)的房?jī)r(jià)的,這就是監(jiān)督學(xué)習(xí)。而且你要預(yù)測(cè)你朋友的房?jī)r(jià),就是通過(guò)上面那些確切的點(diǎn)來(lái)擬合一條誤差最小的線(xiàn),從而預(yù)測(cè)出你朋友的房?jī)r(jià),很顯然這是一個(gè)回歸類(lèi)問(wèn)題,因?yàn)檫@是一個(gè)連續(xù)的值。
2、classification problem分類(lèi)問(wèn)題
分類(lèi)問(wèn)題的求解對(duì)應(yīng)的是一個(gè)離散的值
關(guān)于classification problem,吳恩達(dá)老師的舉例是有一堆關(guān)于腫瘤大小的數(shù)據(jù),每個(gè)數(shù)據(jù)對(duì)應(yīng)了這個(gè)患者是不是患了癌癥。然后給你一個(gè)腫瘤大小的數(shù)據(jù),你來(lái)預(yù)測(cè)患者是否患了癌癥。

可以看到,每個(gè)腫瘤大小對(duì)應(yīng)了一個(gè)值,這個(gè)直接就是是否患癌癥,這就是監(jiān)督學(xué)習(xí) 。而給你一個(gè)腫瘤大小的數(shù)據(jù)預(yù)測(cè)是否患有癌癥,這就是supervised learning中的classification problem。這里的分類(lèi)就是指是否患有癌癥,而這個(gè)也就是所謂的離散值。
二、非監(jiān)督學(xué)習(xí)
關(guān)于非監(jiān)督學(xué)習(xí)unsupervised learning,我的理解就是,給你一堆數(shù)據(jù),你從其中找出一個(gè)結(jié)構(gòu),一開(kāi)始我并沒(méi)有給這些數(shù)據(jù)打標(biāo)簽,你要自己發(fā)現(xiàn)其中的結(jié)構(gòu)。
非監(jiān)督學(xué)習(xí)又可以分為兩類(lèi):
1、clustering algorithm聚類(lèi)算法
聚類(lèi)顧名思義就是聚集分類(lèi),就是給你的一堆數(shù)據(jù)中,這些數(shù)據(jù)可以聚集分類(lèi)成很多類(lèi)型。如下圖。

2、non-clustering algorithm 非聚類(lèi)算法
顧名思義就是數(shù)據(jù)沒(méi)有聚集分類(lèi),這是一堆雜亂的數(shù)據(jù),而你要在這混亂的環(huán)境中找到一個(gè)結(jié)構(gòu)。
吳恩達(dá)老師的舉例就是一個(gè)雞尾酒宴會(huì)問(wèn)題。"The cocktail party algorithm",在宴會(huì)這個(gè)嘈雜的環(huán)境中,你要能自動(dòng)區(qū)分出其中各自不同的聲音。
第一次筆記就到這,好好總結(jié),好好學(xué)習(xí)。
