可怕的貝葉斯定律

在讀高中之前,覺(jué)得數(shù)學(xué)很好懂啊,加減乘除,應(yīng)用題從來(lái)就沒(méi)算錯(cuò)過(guò)。上了高中,突然覺(jué)得腦子一下子銹住了,完全搞不懂函數(shù)……

后來(lái)工作,發(fā)現(xiàn)不懂?dāng)?shù)學(xué)也沒(méi)毛關(guān)系,反正算數(shù)有財(cái)務(wù),實(shí)在不行,還有表格計(jì)算公式,都很好搞定嘛。

再后來(lái)發(fā)現(xiàn),數(shù)學(xué)不只是計(jì)算工具,還是推理工具。特別是貝葉斯定理,對(duì)于投資決策的意義非常巨大,必須得學(xué)。

對(duì)于跟我一樣的數(shù)學(xué)白癡,怎么理解貝葉斯定理呢?

眾所周知,貝葉斯定理是一種在已知其他概率的情況下求概率的方法:

貝葉斯定理公式

那我們?cè)趺慈ダ斫膺@個(gè)傳說(shuō)中不黃但是非常暴力的貝葉斯定理呢,貝葉斯定理是如何暴力狂虐數(shù)學(xué)界的?

首先,對(duì)于貝葉斯定理,還是要先了解各個(gè)概率所對(duì)應(yīng)的事件。

P(A|B) 是在 B 發(fā)生的情況下 A 發(fā)生的概率;

P(A) 是 A 發(fā)生的概率;

P(B|A) 是在 A 發(fā)生的情況下 B 發(fā)生的概率;

P(B) 是 B 發(fā)生的概率。

舉的是真的栗子

還沒(méi)看懂。。。那還是再舉個(gè)栗子吧。

京西大旅館為了慶祝開業(yè)三周年的好日子,老板劉強(qiáng)西準(zhǔn)備帶著實(shí)習(xí)生小天去郊外旅游,不過(guò)一大早天空多云:

糟了!50%的雨天的早上是多云的!

但多云的早上其實(shí)挺多的(大約40%的日子早上是多云的)!

這個(gè)月干旱為主(平均30天里一般只有3天會(huì)下雨,10%)!

劉強(qiáng)西45°角仰望天空,想著要不要去郊游。。。

作為聰明的實(shí)習(xí)生,小天立馬拿出他的小本子:

此時(shí),我們用"雨"來(lái)代表今天下雨,"云"來(lái)代表早上多云。

當(dāng)早上多云時(shí),當(dāng)天會(huì)下雨的可能性是 P(雨|云)。

P(雨|云) = P(雨)·P(云|雨) /P(云)

P(雨) 是今天下雨的概率 = 10%

P(云|雨) 是在下雨天早上有云的概率 = 50%

P(云) 早上多云的概率 = 40%

基本的概率情況已經(jīng)確定,那就簡(jiǎn)單了

P(雨|云) =0.1×0.5/0.4=0.125

小天:劉老板,不用看天氣了,今天下午的概率只有12.5%,可以去郊游的。

劉強(qiáng)西聽完后:行,那趕緊上車!

然而,“小天”算不如天算,你看,天就下雨了。。。

小天尷尬ing

故事到這里還沒(méi)結(jié)束,學(xué)習(xí)貝葉斯定理的時(shí)候,時(shí)常會(huì)記不住到底是B在前,還是A在前,公式該怎么寫。

直到有一次,小天(這個(gè)小天是我家小天,不是劉強(qiáng)西的小天)說(shuō)出:AB AB AB。

所以對(duì)于貝葉斯公式,記住AB AB AB,然后再做分組:"AB = A×BA/B"。

別急,假如“A”還有兩個(gè)可能

你們聽說(shuō)“假陽(yáng)性”、“假陰性”這兩個(gè)詞嗎?

是的,沒(méi)錯(cuò),就是某些疾病檢測(cè)一般喜歡用名詞,醫(yī)學(xué)院的同學(xué)趕緊拿好小板凳,接下來(lái)就是考試重點(diǎn)了。

貝葉斯定理雖然只是一個(gè)概率計(jì)算公式,但其最著名的一個(gè)用途便是“假陽(yáng)性”和“假陰性”檢測(cè)。

雖然很像一坨屎,但真的是栗子

再丟個(gè)栗子。。。

上次沒(méi)出成郊游,劉強(qiáng)西卻在路邊撿了一只小流浪貓回京西大旅館,每天就顧著擼貓。。。

哎呀,好癢

兩天過(guò)后,劉強(qiáng)西突然渾身發(fā)癢,小天就想起來(lái)是不是劉強(qiáng)西對(duì)貓過(guò)敏,于是劉強(qiáng)西就做了一個(gè)簡(jiǎn)單的過(guò)敏檢測(cè):

對(duì)于真的有這種過(guò)敏的人,檢測(cè)有 80% 的機(jī)會(huì)給回 "有" 的結(jié)果;

對(duì)于沒(méi)有這種過(guò)敏的人,檢測(cè)有 10% 的機(jī)會(huì)給回 "有" 的結(jié)果(而這種情況,稱之為"假陽(yáng)性")。

從實(shí)際情況看,京西大旅館的村子有 1% 的人有這種過(guò)敏,而劉強(qiáng)西的檢測(cè)結(jié)果是 "有",那么劉強(qiáng)西真的有這種過(guò)敏的可能性有多大?

P(過(guò)敏) 是有這種過(guò)敏的概率 = 1%

P(有|過(guò)敏) 是對(duì)于真的有這種過(guò)敏的人,檢測(cè)的結(jié)果是 "有" = 80%

P(有) 是對(duì)于任何人,檢測(cè)的結(jié)果是 "有" = ??%

糟糕!我們并不知道檢測(cè)結(jié)果是 "有" 的一般可能性是多少……

不過(guò)我們可以把有這種過(guò)敏和沒(méi)有這種過(guò)敏的概率相加來(lái)求這個(gè)一般概率:

1% 的人有這種過(guò)敏,檢測(cè)對(duì) 80% 的這些人說(shuō) "有"

99% 的人沒(méi)有這種過(guò)敏,檢測(cè)對(duì) 10% 的這些人說(shuō) "有"

把概率加起來(lái):

P(有) = 1% × 80% + 99% × 10% = 10.7%

就是說(shuō)大約 10.7% 的人會(huì)得到 "有" 的檢測(cè)結(jié)果。

那此時(shí)我們就可以計(jì)算出,劉強(qiáng)西真正對(duì)貓過(guò)敏的概率為

P(過(guò)敏|有) = 1% × 80%/10.7%= 7.48%

所以此時(shí)也就有了貝葉斯定理特別版:

最后說(shuō)多兩句:

貝葉斯統(tǒng)計(jì)作為常用的基礎(chǔ)算法,不要小看其作用,其在機(jī)器學(xué)習(xí)中是占據(jù)重要的一席之地。尤其是在數(shù)據(jù)處理方面,針對(duì)事件發(fā)生的概率以及事件可信度分析上具有良好的分類效果。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容