4.2.從樸素貝葉斯到主題模型

樸素貝葉斯和主題模型的區(qū)別

樸素貝葉斯可以做垃圾郵件過濾(二分類問題),也可以做文檔的多分類。所以也可以看作是一個(gè)主題模型,樸素貝假設(shè)文檔只有一個(gè)主題,文檔中所有的詞都是從這個(gè)主題產(chǎn)生的。

Paste_Image.png

樸素貝葉斯假設(shè)的是一個(gè)文檔只有一個(gè)主題,而這個(gè)文檔中的單詞是從這個(gè)主題中抽取的。

而在主題模型中(pLSA和LDA),一個(gè)文檔是由多個(gè)主題集合而成的。每個(gè)主題相當(dāng)于一個(gè)樸素貝葉斯的文檔類別,而一個(gè)文檔是由多個(gè)"樸素貝葉斯"文檔的混合。

樸素貝葉斯是監(jiān)督學(xué)習(xí),主題模型是非監(jiān)督學(xué)習(xí)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容