2019-01-26

貝葉斯分類(lèi)器:

1 極大似然估計(jì)? ? ?

a? 類(lèi)條件概率的一種常用策略是先假定其具有某種確定的概率分布形式,再基于訓(xùn)練樣本對(duì)概率分布的參數(shù)進(jìn)行估計(jì),如 具體的,關(guān)于類(lèi)別C 的類(lèi)條件概率為?p(x|c)?---> 假定p(x|c)具有確定的形式并且參數(shù)向量\theta c唯一且確定

b? 令Dc表示訓(xùn)練集D 中 第 c 類(lèi)樣本組成的集合,假定這些樣本獨(dú)立同分布 則參數(shù)\theta c?對(duì)于數(shù)據(jù)集Dc的似然 是

? ? ? ? ? ? ? ? ? ? ? ? ? ? ?P(Dc|\theta c) = \prod_{x\in Dc}^n P(x|\theta c)? ? ? ? ? ? ? ? (1)

? ? ? ? ? ? ? ?對(duì)?\theta c?進(jìn)行極大似然估計(jì) 就是 去尋找能最大化 似然P(Dc|\theta c)?的參數(shù)\theta c? --->? 直觀上看 ,極大似然估計(jì)是試圖在\theta c?的所有可能的取值中,找到一個(gè)能使數(shù)據(jù)出現(xiàn)的 “ 可能性 "最大的值

c? ? 對(duì)于 (1) 連乘 操作 容易出現(xiàn)下溢,通常使用對(duì)數(shù)似然:?

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?LL(\theta c) = log P (Dc|\theta c) = \sum_{x\in Dc}^b logP(x|\theta c)

D? 參數(shù) \theta c的極大似然估計(jì)為 :?\theta c = arg    max LL(\theta c)

E? ?所以 對(duì)于 連續(xù)屬性 情況下 , p(x|c) 服從 分布N(\mu ,\sigma ^2 )---> 該參數(shù)?\mu ,\sigma ?是 該分布的樣本均值和方差

注意 :? 對(duì)于極大似然估計(jì) 局限性 :? 估計(jì)的結(jié)果嚴(yán)重依賴(lài)所假設(shè)的概率分布是否符合潛在的真實(shí)數(shù)據(jù)分布? ?,現(xiàn)實(shí) 中,在一定程度上 會(huì)利用先驗(yàn)知識(shí)?

2? 樸素貝葉斯分類(lèi)器

1? 目的:? ?求? 后驗(yàn)概率: P(c|x)

2? 前提 : 假設(shè) 所有屬性相互獨(dú)立,即 每個(gè)屬性獨(dú)立地對(duì)分類(lèi)結(jié)果發(fā)生影響

3? ? 所以 : p(c|x) =??\frac{p(c)p(x|c)}{p(x)}  =  \frac{p(c)}{p(x)} \prod_{i=1}^dP(xi|c) ? ?(d 為屬性的數(shù)目,xi 為x 在第i 個(gè)屬性上的取值)

4? p(x) 都相同 : 所以樸素貝葉斯分類(lèi)器的表達(dá)式:

? ? ? ? ? ? ? ? ? ??hnb(x) =  argmaxP(c) \prod_{i=1}^dP(xi|c)

5

6? ?拉普拉斯修正

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 以西瓜書(shū)為主線(xiàn),以其他書(shū)籍作為參考進(jìn)行補(bǔ)充,例如《統(tǒng)計(jì)學(xué)習(xí)方法》,《PRML》等 第一章 緒論 1.2 基本術(shù)語(yǔ) ...
    danielAck閱讀 4,888評(píng)論 0 5
  • 考試說(shuō)明 注重基礎(chǔ)知識(shí)和概念的理解,因此解題中的計(jì)算過(guò)程不會(huì)很復(fù)雜,但是會(huì)有推公式的過(guò)程。本課程的重點(diǎn)知識(shí)包括:貝...
    城市中迷途小書(shū)童閱讀 1,275評(píng)論 0 0
  • 考試說(shuō)明 注重基礎(chǔ)知識(shí)和概念的理解,因此解題中的計(jì)算過(guò)程不會(huì)很復(fù)雜,但是會(huì)有推公式的過(guò)程。本課程的重點(diǎn)知識(shí)包括:貝...
    藝術(shù)叔閱讀 3,041評(píng)論 0 3
  • 1. 章節(jié)主要內(nèi)容 貝葉斯分類(lèi)器是機(jī)器學(xué)習(xí)領(lǐng)域應(yīng)用很廣、效果不錯(cuò),且算法相對(duì)通俗易懂的分類(lèi)器,并且章節(jié)中的一些概念...
    閃電隨筆閱讀 4,941評(píng)論 0 12
  • 【與萌共長(zhǎng)】20171021 學(xué)習(xí)力踐行Day 11 今天有萌寶的小姨來(lái)了,萌很高興 1.故事:還是讀《胖國(guó)王》,...
    艷萍和萌寶閱讀 164評(píng)論 0 0

友情鏈接更多精彩內(nèi)容