貝葉斯公式的理解

能把P(城市|省份)和P(省份|城市)聯(lián)系起來的公式叫貝葉斯公式。我們來看貝葉斯公式長什么樣子。

用A表示省份,B表示城市,套入公式,即能把P(城市|C)和P(C|城市)聯(lián)系起來??吹侥軌蚵?lián)系起來,上級工作人員很高興,但是這公式有什么意義嗎,是不是隨便編造的一個公式,為何叫貝葉斯公式而不是叫陳佩斯公式?

貝葉斯公式以托馬斯·貝葉斯(Thomas Bayes,1701-1761)命名的,貝葉斯是和牛頓同時代的牧師,同時也是一位業(yè)余數(shù)學(xué)家,和牛頓不同的是,貝葉斯的理論當(dāng)時并未被重視,原因在于貝葉斯在統(tǒng)計當(dāng)中引入了主觀因素,即所謂的先驗(yàn)概率,這對于數(shù)學(xué)來說是大忌,數(shù)學(xué)應(yīng)該是客觀的,怎么能加入主觀因素。因此,直到1950年左右,人們發(fā)現(xiàn)加入先驗(yàn)概率效果更好,貝葉斯的理論才被廣泛接受。



????一個理論能被廣泛接受,一定是因?yàn)槟軌蚪鉀Q很多問題,那貝葉斯理論又解決了什么問題,為什么一個數(shù)學(xué)理論能夠加入主觀因素?

? 如果問拋硬幣正面朝上的概率,很多人會肯定回答說概率是1/2,但這是想當(dāng)然了,對于理想的硬幣,正反面概率是均勻的,但是如果硬幣動了手腳,那就不一定了,這個時候,要怎么去確定概率是多少?有人想到通過做拋硬幣的試驗(yàn)來確定,例如拋5次硬幣,統(tǒng)計正面和反面出現(xiàn)的次數(shù),如果拋5次都是正面向上,我們能說正面向上的概率是100%嗎?有人說,5次太少,那拋5000次以上總能計算概率大小吧,答案是可以,只是這種估計概率的方式成本太高了。事實(shí)上,現(xiàn)實(shí)生活中,有很多類似的例子是不能通過做試驗(yàn)來確定概率的,例如小明預(yù)測明天下雨的概率是30%,他無法重復(fù)過上明天100次,統(tǒng)計下雨的次數(shù)來計算下雨的概率。而貝葉斯理論,可以解決這種在有限信息條件下對概率的一個預(yù)估,貝葉斯理論的思路是,在主觀判斷的基礎(chǔ)上,先估計一個值(先驗(yàn)概率),然后根據(jù)觀察的新信息不斷修正(可能性函數(shù))

我們繼續(xù)來看貝葉斯公式,我們再用省份和城市來理解這個公式有點(diǎn)不太好理解,因?yàn)槟莻€例子看起來我們所有的信息都知道了。這里再舉另外一個例子來理解。

曾經(jīng)有一個大神給我傳授表白理論,他說如果女神從來沒有單獨(dú)出去逛街吃飯,這說明女神根本不喜歡你,表白的成功概率很低的,反之亦然。

我們以這個理論作為概率的例子,首先,分析給定的已知信息和未知信息:

1)要求解的問題:女神喜歡你,記為A事件

2)已知條件:經(jīng)常和女神單獨(dú)出門吃過飯,記為B事件

那么,P(A|B)就是女神經(jīng)常和你單獨(dú)出門吃飯這個事件(B)發(fā)生后,女神喜歡你的概率。把這個套入貝葉斯公式來理解一下。


貝葉斯可以分為三個部分,先驗(yàn)概率、可能性函數(shù)和后驗(yàn)概率。

1)先驗(yàn)概率

我們把P(A)稱為"先驗(yàn)概率"(Prior probability),先驗(yàn)概率是根據(jù)以往經(jīng)驗(yàn)和分析得到的概率。這個例子里就是在不知道女神經(jīng)常和你單獨(dú)出門逛街的前提下,來主觀判斷出女神喜歡你的概率。因?yàn)槭侵饔^判斷,我們可以給任何值,例如高富帥可以把這個概率設(shè)定得很高,為80%,也可以設(shè)定低一點(diǎn),例如50%,這完全是根據(jù)個人經(jīng)驗(yàn)做出的判斷。這也是前面說的貝葉斯公式的主觀因素部分。

2)可能性函數(shù)

P(B|A)/P(B)稱為"似然函數(shù)"(Likelyhood),這是一個調(diào)整因子,即新信息B帶來的調(diào)整,作用是使得先驗(yàn)概率更接近真實(shí)概率。至于新信息帶來的調(diào)整作用大不大,還得看因子的值大不大。

如果"可能性函數(shù)"P(B|A)/P(B)>1,意味著"先驗(yàn)概率"被增強(qiáng),事件A的發(fā)生的可能性變大,例如女神平時很少和別人出門逛街吃飯,那么這個調(diào)整因子特別有用,肯定是大于1的。

如果"可能性函數(shù)"=1,意味著B事件無助于判斷事件A的可能性,例如女神偶爾也和他人出門逛街吃飯,那么和女神出門吃飯沒有我們帶來任何信息,對判斷女神是否喜歡你沒有重大意義;

如果"可能性函數(shù)"<1,意味著"先驗(yàn)概率"被削弱,事件A的可能性變小,例如知道女神實(shí)際上有喜歡的人了,那該信息直接使得女神喜歡你的概率下降很厲害。

至于為什么似然函數(shù)的公式長這樣的,這個留在以后再解釋。

3)后驗(yàn)概率

P(A|B)稱為"后驗(yàn)概率"(Posterior probability),即在B事件發(fā)生之后,我們對A事件概率的重新評估。這個例子里就是在女神跟你出門逛街吃飯這個事件發(fā)生后,對女神喜歡你的概率重新預(yù)測。

通過這個例子,我們理解了貝葉斯公式,也知道了貝葉斯公式能夠通過似然函數(shù)不斷調(diào)整主觀概率得到后驗(yàn)概率,使得預(yù)測更加準(zhǔn)確,這也是為什么帶有主觀因素還能在數(shù)學(xué)界呆著的原因。也正因?yàn)檫@樣,貝葉斯可以出現(xiàn)在所有需要作出概率預(yù)測的地方,例如垃圾郵件過濾,中文分詞,疾病檢查等。特別是在機(jī)器學(xué)習(xí)領(lǐng)域,貝葉斯理論更是一個繞不過去的門檻。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容