機(jī)器學(xué)習(xí) - 吳恩達(dá)版(Stanford)筆記 004

Topic: unsupervised learning

回顧監(jiān)督學(xué)習(xí),每一個(gè)training data都被給予了正確或錯(cuò)誤的值。

比如這幾個(gè)數(shù)據(jù)中,每個(gè)數(shù)據(jù)是良性或惡性腫瘤的信息。

但對(duì)于無(wú)監(jiān)督學(xué)習(xí),我們并沒有被給予每個(gè)數(shù)據(jù)具體的值。

形象的說(shuō),我們需要根據(jù)這些數(shù)據(jù)點(diǎn)在幾何空間上的接近程度,來(lái)分辨出哪些點(diǎn)是一類的,這個(gè)操作叫做聚類(Clustering)

實(shí)際上,我們是根據(jù)模型函數(shù)的一些特征,通過(guò)一定的權(quán)重或公式,來(lái)計(jì)算一個(gè)絕對(duì)值差。

一個(gè)具體的例子是Google News對(duì)新聞的分類

Google News會(huì)把同一個(gè)問(wèn)題的各大網(wǎng)站報(bào)道聚集到一個(gè)頁(yè)面下,形成一個(gè)clustering。

另一個(gè)經(jīng)典問(wèn)題 - Cocktail party Problem

雞尾酒會(huì)問(wèn)題:假設(shè)有兩個(gè)演講者同時(shí)持有麥克風(fēng),并且各自的麥克風(fēng)獨(dú)立的起到擴(kuò)音作用.

我們?cè)鯓幽軌蛲ㄟ^(guò)程序,把兩段音頻獨(dú)立的分離出來(lái)呢?


(其實(shí)這個(gè)問(wèn)題在中國(guó)還不如叫ktv唱歌遇到人渣問(wèn)題)

通過(guò)無(wú)監(jiān)督學(xué)習(xí),找到每個(gè)人發(fā)出聲音的特征,進(jìn)行聲紋的聚類,就可以得到兩個(gè)不同的類。


看不懂這個(gè)公式,不求甚解了,實(shí)際遇到再去查

以上是本節(jié)全部?jī)?nèi)容。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容