Topic: unsupervised learning
回顧監(jiān)督學(xué)習(xí),每一個(gè)training data都被給予了正確或錯(cuò)誤的值。

比如這幾個(gè)數(shù)據(jù)中,每個(gè)數(shù)據(jù)是良性或惡性腫瘤的信息。
但對(duì)于無(wú)監(jiān)督學(xué)習(xí),我們并沒有被給予每個(gè)數(shù)據(jù)具體的值。

形象的說(shuō),我們需要根據(jù)這些數(shù)據(jù)點(diǎn)在幾何空間上的接近程度,來(lái)分辨出哪些點(diǎn)是一類的,這個(gè)操作叫做聚類(Clustering)
實(shí)際上,我們是根據(jù)模型函數(shù)的一些特征,通過(guò)一定的權(quán)重或公式,來(lái)計(jì)算一個(gè)絕對(duì)值差。
一個(gè)具體的例子是Google News對(duì)新聞的分類
Google News會(huì)把同一個(gè)問(wèn)題的各大網(wǎng)站報(bào)道聚集到一個(gè)頁(yè)面下,形成一個(gè)clustering。

另一個(gè)經(jīng)典問(wèn)題 - Cocktail party Problem
雞尾酒會(huì)問(wèn)題:假設(shè)有兩個(gè)演講者同時(shí)持有麥克風(fēng),并且各自的麥克風(fēng)獨(dú)立的起到擴(kuò)音作用.
我們?cè)鯓幽軌蛲ㄟ^(guò)程序,把兩段音頻獨(dú)立的分離出來(lái)呢?

(其實(shí)這個(gè)問(wèn)題在中國(guó)還不如叫ktv唱歌遇到人渣問(wèn)題)
通過(guò)無(wú)監(jiān)督學(xué)習(xí),找到每個(gè)人發(fā)出聲音的特征,進(jìn)行聲紋的聚類,就可以得到兩個(gè)不同的類。

看不懂這個(gè)公式,不求甚解了,實(shí)際遇到再去查
以上是本節(jié)全部?jī)?nèi)容。