先驗(yàn)概率, 后驗(yàn)概率, 似然函數(shù), 證據(jù)因子

先驗(yàn)概率, 后驗(yàn)概率, 似然函數(shù), 證據(jù)因子

理論

假設(shè)有變量x?y?, x?表示特征, y?表示我們關(guān)心的變量, 可以是分類變量或者連續(xù)變量. 那么, 關(guān)于y?的先驗(yàn)概率為p(y)?, 關(guān)于y?的后驗(yàn)概率為p(y|x)?, 似然函數(shù)為p(x|y)?, 證據(jù)因子p(x)?, 根據(jù)全概率公式和貝葉斯公式可以得到它們之間的關(guān)系, 預(yù)先假設(shè)y?m?種取值:
\begin{align} p(y_i|x) &= \frac{p(x,y_i)}{p(x)} \\ &= \frac{p(x|y_i)p(y_i)}{p(x)} \\ &= \frac{p(x|y_i)p(y_i)}{\sum_{j=1}^{m}{p(x|y_j)p(y_j)}}, (1 \leq i \leq m) \end{align}
根據(jù)訓(xùn)練樣本(包含特征類別), 無法直接求出后驗(yàn)概率, 后驗(yàn)概率需要通過似然函數(shù)和先驗(yàn)概率間接求得.

注意: 這里的先驗(yàn)概率和后驗(yàn)概率是相對(duì)的, p(x)也可以是先驗(yàn)概率, p(x|y)為后驗(yàn)概率, 只是相對(duì)于x?而已.

例子

假設(shè)x表示特征, 特征取值范圍有: \{陰天, 晴天\}, y表示分類, 取值范圍有: \{下雨, 不下雨\}. 現(xiàn)在我們根據(jù)"是否陰天"這個(gè)隨機(jī)變量x的觀測(cè)樣本數(shù)據(jù)(特征樣本), 來判斷是否會(huì)下雨.

根據(jù)歷史經(jīng)驗(yàn)估計(jì),

  • 下雨的概率為20%, 可得到先驗(yàn)概率p(y=下雨)=0.2

  • 陰天時(shí)下雨的概率為70%, 可得到后驗(yàn)概率為p(y=下雨|x=陰天) = 0.7

根據(jù)現(xiàn)有訓(xùn)練樣本可以求得:

  • 下雨表現(xiàn)為陰天的概率記為p(x=陰天|y=下雨), 可以解釋如下: 下雨表現(xiàn)為陰天的可能性(likelihood)
  • 估計(jì)的先驗(yàn)概率

參考

先驗(yàn)概率、似然函數(shù)、后驗(yàn)概率、貝葉斯公式

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容