為什么叫樸素貝葉斯分類呢?
1.它用到了貝葉斯定理
2.這種方法的思想真的很樸素??
對(duì)于給出的待分類項(xiàng),求解在此項(xiàng)出現(xiàn)的條件下各個(gè)類別出現(xiàn)的概率,哪個(gè)最大,就認(rèn)為此待分類項(xiàng)屬于哪個(gè)類別。你在街上看到一個(gè)黑人,你很可能會(huì)猜非洲。因?yàn)楹谌酥蟹侵奕说谋嚷首罡?,?dāng)然也不一定對(duì)。但在沒(méi)有其它可用信息下,我們會(huì)選擇條件概率最大的類別,這就是樸素貝葉斯的思想基礎(chǔ)。
舉個(gè)栗子??:
用cu,fe,ca三種元素的含量判斷某人是否患病。
可以先統(tǒng)計(jì)1000人的患病情況,并測(cè)出他們的三種元素含量。
若其中400人患病,那p(患病)=0.4,p(健康)=0.6
患病的400人中:
p(cu>0.1)=0.8,?p(cu<0.1)=0.2,
p(fe>0.1)=0.7, ?p(fe<0.1)=0.3,
p(ca>0.1)=0.6,?p(ca>0.1)=0.4,
健康的600人中:
p(cu>0.1)=0.3,?p(cu<0.1)=0.7,
p(fe>0.1)=0.2, ?p(fe<0.1)=0.8,
p(ca>0.1)=0.1,?p(ca<0.1)=0.9,
那么我們就可以計(jì)算其他人的患病概率了:
加入一個(gè)人cu,fe,ca三種元素含量分別為0.12,0.8,0.7
那他的p(患病)=0.4*0.8*0.3*0.4=0.0384
p(健康)=0.6*0.3*0.8*0.9=0.1296
可以看出,他的p(健康)明顯大于p(患病),所以很可能是健康的