【分類模型學(xué)習(xí)】-樸素貝葉斯

分類問題綜述

分類問題在生活中很常見,我們可以從數(shù)學(xué)角度做如下定義:
已知類別集合C=\left \{ y_{1},y_{2},y_{3},y_{4},,,y_{n} \right \}和待分類項(xiàng)集合I=\left \{ x_{1},x_{2},x_{3},x_{4},,,x_{m} \right \},需要確定出映射規(guī)則y=f(x),使得任意的x_i\subset I有且僅有一個y_i\subset C使得y_i=f(x_i)成立

樸素貝葉斯方法

樸素貝葉斯法(Naive Bayes model)是基于貝葉斯定理與特征條件獨(dú)立假設(shè)的分類方法,樸素貝葉斯的思想基礎(chǔ)是這樣的:對于給出的待分類項(xiàng),求解在此項(xiàng)出現(xiàn)的條件下各個類別出現(xiàn)的概率,哪個最大,就認(rèn)為此待分類項(xiàng)屬于哪個類別。即在{P(y_1|x),P(y_2|x),P(y_3|x),,,P(y_n|x)}中找到最大的P(y_k|x),認(rèn)為x\subset y_k


那么現(xiàn)在的關(guān)鍵就是第三步中{P(y_1|x),P(y_2|x),P(y_3|x),,,P(y_n|x)}如何計(jì)算的問題。
根據(jù)貝葉斯定理
P(y_i|x)=\frac{P(x_i|y)P(y_i)}{P(x)},分母對所有類別為常數(shù),可以省略
又根據(jù)特征屬性相互獨(dú)立可以得到
P(x_i|y)=P(a_1|y_i)P(a_2|y_i)P(a_3|y_i)...P(a_m|y_i)=\prod_{j=1}^{m} P(a_j|y_i)
所以只需要計(jì)算P(y_i)\prod_{j=1}^{m} P(a_j|y_i)來在{P(y_1|x),P(y_2|x),P(y_3|x),,,P(y_n|x)}中得到maxP(y_k|x),就可以確定x的類別y_k

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容