在讀高中之前,覺(jué)得數(shù)學(xué)很好懂啊,加減乘除,應(yīng)用題從來(lái)就沒(méi)算錯(cuò)過(guò)。上了高中,突然覺(jué)得腦子一下子銹住了,完全搞不懂函數(shù)……
后來(lái)工作,發(fā)現(xiàn)不懂?dāng)?shù)學(xué)也沒(méi)毛關(guān)系,反正算數(shù)有財(cái)務(wù),實(shí)在不行,還有表格計(jì)算公式,都很好搞定嘛。
再后來(lái)發(fā)現(xiàn),數(shù)學(xué)不只是計(jì)算工具,還是推理工具。特別是貝葉斯定理,對(duì)于投資決策的意義非常巨大,必須得學(xué)。
對(duì)于跟我一樣的數(shù)學(xué)白癡,怎么理解貝葉斯定理呢?
眾所周知,貝葉斯定理是一種在已知其他概率的情況下求概率的方法:
那我們?cè)趺慈ダ斫膺@個(gè)傳說(shuō)中不黃但是非常暴力的貝葉斯定理呢,貝葉斯定理是如何暴力狂虐數(shù)學(xué)界的?
首先,對(duì)于貝葉斯定理,還是要先了解各個(gè)概率所對(duì)應(yīng)的事件。
P(A|B) 是在 B 發(fā)生的情況下 A 發(fā)生的概率;
P(A) 是 A 發(fā)生的概率;
P(B|A) 是在 A 發(fā)生的情況下 B 發(fā)生的概率;
P(B) 是 B 發(fā)生的概率。

還沒(méi)看懂。。。那還是再舉個(gè)栗子吧。
京西大旅館為了慶祝開業(yè)三周年的好日子,老板劉強(qiáng)西準(zhǔn)備帶著實(shí)習(xí)生小天去郊外旅游,不過(guò)一大早天空多云:
糟了!50%的雨天的早上是多云的!
但多云的早上其實(shí)挺多的(大約40%的日子早上是多云的)!
這個(gè)月干旱為主(平均30天里一般只有3天會(huì)下雨,10%)!
劉強(qiáng)西45°角仰望天空,想著要不要去郊游。。。
作為聰明的實(shí)習(xí)生,小天立馬拿出他的小本子:
此時(shí),我們用"雨"來(lái)代表今天下雨,"云"來(lái)代表早上多云。
當(dāng)早上多云時(shí),當(dāng)天會(huì)下雨的可能性是 P(雨|云)。
P(雨|云) = P(雨)·P(云|雨) /P(云)
P(雨) 是今天下雨的概率 = 10%
P(云|雨) 是在下雨天早上有云的概率 = 50%
P(云) 早上多云的概率 = 40%
基本的概率情況已經(jīng)確定,那就簡(jiǎn)單了
P(雨|云) =0.1×0.5/0.4=0.125
小天:劉老板,不用看天氣了,今天下午的概率只有12.5%,可以去郊游的。
劉強(qiáng)西聽完后:行,那趕緊上車!
然而,“小天”算不如天算,你看,天就下雨了。。。

故事到這里還沒(méi)結(jié)束,學(xué)習(xí)貝葉斯定理的時(shí)候,時(shí)常會(huì)記不住到底是B在前,還是A在前,公式該怎么寫。
直到有一次,小天(這個(gè)小天是我家小天,不是劉強(qiáng)西的小天)說(shuō)出:AB AB AB。
所以對(duì)于貝葉斯公式,記住AB AB AB,然后再做分組:"AB = A×BA/B"。
別急,假如“A”還有兩個(gè)可能
你們聽說(shuō)“假陽(yáng)性”、“假陰性”這兩個(gè)詞嗎?
是的,沒(méi)錯(cuò),就是某些疾病檢測(cè)一般喜歡用名詞,醫(yī)學(xué)院的同學(xué)趕緊拿好小板凳,接下來(lái)就是考試重點(diǎn)了。
貝葉斯定理雖然只是一個(gè)概率計(jì)算公式,但其最著名的一個(gè)用途便是“假陽(yáng)性”和“假陰性”檢測(cè)。
再丟個(gè)栗子。。。
上次沒(méi)出成郊游,劉強(qiáng)西卻在路邊撿了一只小流浪貓回京西大旅館,每天就顧著擼貓。。。

兩天過(guò)后,劉強(qiáng)西突然渾身發(fā)癢,小天就想起來(lái)是不是劉強(qiáng)西對(duì)貓過(guò)敏,于是劉強(qiáng)西就做了一個(gè)簡(jiǎn)單的過(guò)敏檢測(cè):
對(duì)于真的有這種過(guò)敏的人,檢測(cè)有 80% 的機(jī)會(huì)給回 "有" 的結(jié)果;
對(duì)于沒(méi)有這種過(guò)敏的人,檢測(cè)有 10% 的機(jī)會(huì)給回 "有" 的結(jié)果(而這種情況,稱之為"假陽(yáng)性")。
從實(shí)際情況看,京西大旅館的村子有 1% 的人有這種過(guò)敏,而劉強(qiáng)西的檢測(cè)結(jié)果是 "有",那么劉強(qiáng)西真的有這種過(guò)敏的可能性有多大?
P(過(guò)敏) 是有這種過(guò)敏的概率 = 1%
P(有|過(guò)敏) 是對(duì)于真的有這種過(guò)敏的人,檢測(cè)的結(jié)果是 "有" = 80%
P(有) 是對(duì)于任何人,檢測(cè)的結(jié)果是 "有" = ??%
糟糕!我們并不知道檢測(cè)結(jié)果是 "有" 的一般可能性是多少……
不過(guò)我們可以把有這種過(guò)敏和沒(méi)有這種過(guò)敏的概率相加來(lái)求這個(gè)一般概率:
1% 的人有這種過(guò)敏,檢測(cè)對(duì) 80% 的這些人說(shuō) "有"
99% 的人沒(méi)有這種過(guò)敏,檢測(cè)對(duì) 10% 的這些人說(shuō) "有"
把概率加起來(lái):
P(有) = 1% × 80% + 99% × 10% = 10.7%
就是說(shuō)大約 10.7% 的人會(huì)得到 "有" 的檢測(cè)結(jié)果。
那此時(shí)我們就可以計(jì)算出,劉強(qiáng)西真正對(duì)貓過(guò)敏的概率為
P(過(guò)敏|有) = 1% × 80%/10.7%= 7.48%
所以此時(shí)也就有了貝葉斯定理特別版:
最后說(shuō)多兩句:
貝葉斯統(tǒng)計(jì)作為常用的基礎(chǔ)算法,不要小看其作用,其在機(jī)器學(xué)習(xí)中是占據(jù)重要的一席之地。尤其是在數(shù)據(jù)處理方面,針對(duì)事件發(fā)生的概率以及事件可信度分析上具有良好的分類效果。