先驗(yàn)概率, 后驗(yàn)概率, 似然函數(shù), 證據(jù)因子
理論
假設(shè)有變量和
,
表示特征,
表示我們關(guān)心的變量, 可以是分類變量或者連續(xù)變量. 那么, 關(guān)于
的先驗(yàn)概率為
, 關(guān)于
的后驗(yàn)概率為
, 似然函數(shù)為
, 證據(jù)因子
, 根據(jù)全概率公式和貝葉斯公式可以得到它們之間的關(guān)系, 預(yù)先假設(shè)
有
種取值:
根據(jù)訓(xùn)練樣本(包含特征和類別), 無法直接求出后驗(yàn)概率, 后驗(yàn)概率需要通過似然函數(shù)和先驗(yàn)概率間接求得.
注意: 這里的先驗(yàn)概率和后驗(yàn)概率是相對(duì)的, 也可以是先驗(yàn)概率,
為后驗(yàn)概率, 只是相對(duì)于
而已.
例子
假設(shè)表示特征, 特征取值范圍有:
,
表示分類, 取值范圍有:
. 現(xiàn)在我們根據(jù)"是否陰天"這個(gè)隨機(jī)變量
的觀測(cè)樣本數(shù)據(jù)(特征樣本), 來判斷是否會(huì)下雨.
根據(jù)歷史經(jīng)驗(yàn)估計(jì),
下雨的概率為20%, 可得到先驗(yàn)概率
陰天時(shí)下雨的概率為70%, 可得到后驗(yàn)概率為
根據(jù)現(xiàn)有訓(xùn)練樣本可以求得:
-
下雨表現(xiàn)為陰天的概率記為, 可以解釋如下:
下雨表現(xiàn)為陰天的可能性(likelihood) - 估計(jì)的先驗(yàn)概率