1 什么是機(jī)器學(xué)習(xí)
A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.(Tom Mitchell,1998)
一句話概括:計(jì)算機(jī)通過(guò)觀察數(shù)據(jù)從而獲取技巧的過(guò)程。
2 機(jī)器學(xué)習(xí)算法
2.1 監(jiān)督學(xué)習(xí)

數(shù)據(jù)集中的每個(gè)樣本都有相應(yīng)的 “標(biāo)簽”。相當(dāng)于我們知道輸入對(duì)應(yīng)的正確輸出。
監(jiān)督學(xué)習(xí)有兩類問(wèn)題:
- 分類問(wèn)題:其目標(biāo)是預(yù)測(cè)出一組離散的結(jié)果。例如預(yù)測(cè)病人是否患癌癥(0:否, 1:是)
- 回歸問(wèn)題:其目標(biāo)是預(yù)測(cè)出一組連續(xù)的結(jié)果。例如給定房子的面積信息,預(yù)測(cè)出房?jī)r(jià)。
2.2 無(wú)監(jiān)督學(xué)習(xí)

給定的數(shù)據(jù)沒(méi)有任何標(biāo)簽,或者都是相同的標(biāo)簽。無(wú)監(jiān)督的學(xué)習(xí)中,我們很少或根本不知道我們的結(jié)果應(yīng)該是什么樣的。我們可以通過(guò)聚類,推出數(shù)據(jù)中變量之間的聯(lián)系。
比如聚類問(wèn)題:新聞主題分類,社交網(wǎng)絡(luò)分析(朋友分組),市場(chǎng)分類(對(duì)顧客進(jìn)行市場(chǎng)細(xì)分)