無監(jiān)督和有監(jiān)督的區(qū)別

1、有監(jiān)督學習:通過已有的訓練樣本去訓練得到一個最優(yōu)模型,再利用這個模型將所有的輸入映射為相應的輸出,對輸出進行簡單的判斷從而實現(xiàn)預測和分類的目的,也就具有了對未知數(shù)據(jù)進行預測和分類的能力。就如有標準答案的練習題,然后再去考試,相比沒有答案的練習題然后去考試準確率更高。又如我們小的時候不知道牛和鳥是否屬于一類,但當我們隨著長大各種知識不斷輸入,我們腦中的模型越來越準確,判斷動物也越來越準確。

有監(jiān)督學習可分為回歸和分類

回歸:即給出一堆自變量X和因變量Y,擬合出一個函數(shù),這些自變量X就是特征向量,因變量Y就是標簽。 而且標簽的值連續(xù)的,例LR。

分類:其數(shù)據(jù)集,由特征向量X和它們的標簽Y組成,當你利用數(shù)據(jù)訓練出模型后,給你一個只知道特征向量不知道標簽的數(shù)據(jù),讓你求它的標簽是哪一個?其輸出結(jié)果是離散的。例如logistics、SVM、KNN等。

2、無監(jiān)督學習:我們事先沒有任何訓練樣本,而需要直接對數(shù)據(jù)進行建模。比如我們?nèi)⒂^一個畫展,我們完全對藝術(shù)一無所知,但是欣賞完多幅作品之后,我們也能把它們分成不同的派別。無監(jiān)督學習主要算法是聚類,聚類目的在于把相似的東西聚在一起,主要通過計算樣本間和群體間距離得到,主要算法包括Kmeans、層次聚類、EM算法。

作者:數(shù)據(jù)分析之路

鏈接:http://www.itdecent.cn/p/9b2826ef8a28

先驗概率與后驗概率的區(qū)別: http://www.itdecent.cn/p/caeffd4255aa

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容