機器學習入門(2)--無監(jiān)督學習

申明:此文章內(nèi)容來自于 Doctor AndrewNG的視頻,經(jīng)過編輯而成

定義

監(jiān)督學習中的每一個樣本已經(jīng)被清楚地告知了什么是所謂的正確答案。在非監(jiān)督學中,我們的現(xiàn)有數(shù)據(jù)中并沒有正確答案,我們有的只是特征,因而非監(jiān)督學習要解決問題是發(fā)現(xiàn)這些數(shù)據(jù)是否可以分為不同的組。

直白一點,在無監(jiān)督學習中 我們只有一個數(shù)據(jù)集 沒人告訴我們該怎么做 我們也不知道 每個數(shù)據(jù)點究竟是什么意思 相反 它只告訴我們 現(xiàn)在有一個數(shù)據(jù)集 你能在其中找到某種結(jié)構嗎? 我不知道這個數(shù)據(jù)是什么東東 我不知道里面都有些什么類型 叫什么名字 我甚至不知道都有哪些類型 但是 請問你可以自動的找到這些數(shù)據(jù)中的類型嗎? 然后自動的 按得到的類型把這些個體分類對于給定的數(shù)據(jù)集 無監(jiān)督學習算法可能判定該數(shù)據(jù)集包含兩個不同的聚類,如下圖:

無監(jiān)督學習的無差別數(shù)據(jù)分類示意圖

例子:雞尾酒會問題

一個宴會有一屋子的人 大家都坐在一起 而且在同時說話 有許多聲音混雜在一起 因為每個人都是在同一時間說話的 在這種情況下你很難聽清楚你面前的人說的話。命題是,如果使用一些麥克風錄下房間中的聲音,如何利用非監(jiān)督學習算法來識別房間中某一個人所說的話。為簡化問題,假設兩個人在講話,準備好了兩個麥克風。因為這兩個麥克風距離這兩個人的距離是不同的,每個麥克風都記錄下了來自兩個人的聲音的不同組合利用兩個麥克風錄音,如下圖。也許Speaker#1的聲音 在第一個麥克風里的聲音會響一點 也許Speaker#2的聲音 在第二個麥克風里會比較響一些 因為2個麥克風 的位置相對于 2個說話者的位置是不同的 但每個麥克風都會錄到 來自兩個說話者的重疊部分的聲音。

雞尾酒會簡化模型

所以 你可以看到 像這樣的無監(jiān)督學習算法 也許你想問 要實現(xiàn)這樣的算法 很復雜吧? 看起來 為了 構建這個應用程序 做這個音頻處理 似乎需要寫好多代碼啊 或者需要鏈接到 一堆處理音頻的Java庫 貌似需要一個 非常復雜的程序 分離出音頻等。實際上使用Octave只需要一行代碼就可以了,如下: [W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容