接part1部分的內(nèi)容,繼續(xù)歸納整理:
六.貝葉斯概率
1.知識(shí)點(diǎn):貝葉斯定理:
--概念解釋:是關(guān)于隨機(jī)事件A和B的條件概率(條件概率是以一件事情發(fā)生的前提另一件事情發(fā)生的概率)。如求解P(A|B),即在條件B的情況下,事件A發(fā)生的概率
--應(yīng)用理解:貝葉斯定理在實(shí)際的生活案例中運(yùn)用也算比較廣泛,貝葉斯定理通常是求解逆向概率,即基于現(xiàn)有的已知條件,預(yù)測(cè)某事件的概率。如:天氣預(yù)報(bào)說(shuō)明天降雨的概率是60%,那么我們可以利用貝葉斯定理來(lái)預(yù)測(cè)明天下雨的概率。
--公式定理:
貝葉斯公式1:
解釋說(shuō)明:
P(A|B):在條件B的情況下,事件A發(fā)生的概率
P(A):事件A發(fā)生的概率。在實(shí)際的生活中,在某些情況下P(A)的概率無(wú)法獲取,可能會(huì)主觀預(yù)測(cè)P(A)的概率。
P(B):事件B發(fā)生的概率
P(-A):在事件-A發(fā)生的概率
P(B |A):在條件A的情況下,事件B發(fā)生的概率
P(B |-A):在條件-A的情況下,事件B發(fā)生的概率
貝葉斯公式2:
貝葉斯公式2是根據(jù)全概率和條件概率的理論推導(dǎo)出來(lái)的,具體如下:
1.條件概率描述的是事件 A 在另一個(gè)事件 B 已經(jīng)發(fā)生條件下的概率,記做P(A|B),A 和 B 可能是相互獨(dú)立的兩個(gè)事件,也可能不是。(如果A、B是兩個(gè)獨(dú)立事件,運(yùn)用公式推導(dǎo)證明了如果 A 和 B 是相互獨(dú)立的事件,那么事件 A 發(fā)生的概率與 B 無(wú)關(guān)。,如下圖)
條件概率
2.全概率公式如下圖所示,指的是當(dāng)兩個(gè)事件為互補(bǔ)關(guān)系(非此即彼)時(shí),P(B)+P(-B)=1時(shí),可以應(yīng)用下方公式:
條件概率和全概率公式可以通過(guò)韋恩圖形象地表示出來(lái):
韋恩圖
2.應(yīng)用案例一:根據(jù)檢測(cè)結(jié)果陽(yáng)性,預(yù)測(cè)得甲流感的概率
--已知條件:根據(jù)書中案例得出以下條件:某人患有甲流感,試驗(yàn)結(jié)果為陽(yáng)性的概率為90%;某人未患有甲流感,試驗(yàn)結(jié)果為陽(yáng)性的概率為9%,研究表明總?cè)丝谥谢加屑琢鞯挠?%
--定義事件:A表示患甲流,B表示甲流檢測(cè)結(jié)果為陽(yáng)性,-A表示未患甲流,-B表示甲流檢測(cè)結(jié)果為陰性
--已知概率:
P(A)=1%,檢測(cè)者患病的概率
P(-A)=99%,檢測(cè)者未患病的概率
P(B|A)=90%,已知患病情況下,檢測(cè)結(jié)果為陽(yáng)性的概率
P(B|-A)=9%,已知未患病情況下,檢測(cè)結(jié)果為陽(yáng)性的概率
--計(jì)算P(A|B),檢測(cè)結(jié)果為陽(yáng)性患病的概率:
根據(jù)計(jì)算結(jié)果,我們得出檢測(cè)結(jié)果為陽(yáng)性,某人患甲流的概率為9%,患病概率不高
3.應(yīng)用案例二:如果檢測(cè)結(jié)果為陽(yáng)性,第二次檢測(cè)結(jié)果仍為陽(yáng)性,此時(shí)得甲流感的概率
--已知條件:某人患甲流和未患甲流測(cè)試結(jié)果為陽(yáng)性的概率都未發(fā)生變化
--定義事件:A表示患甲流,B表示甲流檢測(cè)結(jié)果為陽(yáng)性,-A表示未患甲流,-B表示甲流檢測(cè)結(jié)果為陰性
因案例一得出:檢測(cè)結(jié)果為陽(yáng)性,患甲流的概率約為9%,所以在本例中患病P(A)的概率應(yīng)為9%,基礎(chǔ)概率此時(shí)發(fā)生變化了。
--已知概率:
P(A)=9%,檢測(cè)者患病的概率
P(-A)=91%,檢測(cè)者未患病的概率
P(B|A)=90%,已知患病情況下,檢測(cè)結(jié)果為陽(yáng)性的概率
P(B|-A)=9%,已知未患病情況下,檢測(cè)結(jié)果為陽(yáng)性的概率
--計(jì)算P(A|B),檢測(cè)結(jié)果為陽(yáng)性患病的概率:
根據(jù)計(jì)算結(jié)果,我們得出第二次檢測(cè)結(jié)果仍為陽(yáng)性,某人患甲流的概率為52%,患病概率明顯提升了
4.應(yīng)用練習(xí):用貝葉斯來(lái)預(yù)測(cè)明天實(shí)際下雨的概率
--假設(shè)地區(qū)每天下雨的概率是0.8,天氣預(yù)報(bào)準(zhǔn)確性為0.8,天氣預(yù)報(bào)說(shuō)明天會(huì)下雨。求明天下雨概率?
定義事件:A表示明天是下雨天氣,B表示天氣預(yù)報(bào)準(zhǔn)確性
P(A)=0.8,表示明天下雨的概率
P(-A)=0.2,表示明天未下雨的概率
P(B|A)=0.8,表示下雨時(shí)準(zhǔn)確預(yù)報(bào)下雨的概率
P(B|-A)=0.8,表示沒(méi)下雨時(shí)預(yù)報(bào)下雨的概率
利用貝葉斯計(jì)算出:P(A|B)=0.941
-在實(shí)際生活中,貝葉斯可以基于某些事情來(lái)預(yù)測(cè)另外一件事發(fā)生的概率,這個(gè)在數(shù)據(jù)分析中依據(jù)某些用戶的行為來(lái)預(yù)測(cè)她的想法,比如女神對(duì)你笑,猜測(cè)她喜歡你等。在實(shí)際的生活中應(yīng)用貝葉斯,有時(shí)候可以把P(A)當(dāng)成主觀判斷,P(B|A)/P(B),當(dāng)成是客觀證據(jù),從而用在生活中預(yù)測(cè)事情
七.主觀概率
1.知識(shí)點(diǎn):抽象的主觀態(tài)度如何轉(zhuǎn)化為具體的數(shù)據(jù)指標(biāo)
--方法:將語(yǔ)言中描述概率的詞匯,如“可能”,“很可能”,“應(yīng)該可能”等文字轉(zhuǎn)換為數(shù)學(xué)符號(hào),如“50%”,“80%”等。
--主觀概率:用一個(gè)數(shù)字形式的概率來(lái)表示自己對(duì)某事的確認(rèn)程度。主觀概率是根據(jù)規(guī)律進(jìn)行分析的巧妙方法,尤其在預(yù)測(cè)孤立事件卻缺乏從前相同條件下發(fā)生過(guò)的事件的可靠數(shù)據(jù)的情況。
--案例:如本書中背水投資公司經(jīng)濟(jì)分析師對(duì)“俄羅斯石油的政策”的投資意見(jiàn)

2.知識(shí)點(diǎn):標(biāo)準(zhǔn)差評(píng)估數(shù)據(jù)分布
--標(biāo)準(zhǔn)差:度量分析點(diǎn)與分析數(shù)據(jù)均值的差距。標(biāo)準(zhǔn)差越大,說(shuō)明數(shù)據(jù)分布越不均勻。
--應(yīng)用:如上圖案例中,經(jīng)濟(jì)師對(duì)statement1的看法一致,分歧較小。
--計(jì)算方法:可以應(yīng)用excel-STDEV來(lái)計(jì)算標(biāo)準(zhǔn)差,round來(lái)進(jìn)行四舍五入的控制
3.知識(shí)點(diǎn):貝葉斯在主觀概率上的應(yīng)用
--貝葉斯新應(yīng)用:可以將新證據(jù)融合到主觀概率中,計(jì)算出‘較為客觀’的主觀概率
--案例更新:背水公司收到“俄羅斯會(huì)出售所有油田,稱其對(duì)商業(yè)失去信心”的新聞,針對(duì)這一新聞,再次來(lái)評(píng)估背水公司分析師對(duì)“俄羅斯石油政策”的看法
--事件定義:
S1:表示俄羅斯將繼續(xù)支持石油業(yè)
~S1:表示俄羅斯將不支持石油業(yè)
E:表示新證據(jù)“俄羅斯宣布將會(huì)出售所有油田”的政策
P(S1):表示俄羅斯將繼續(xù)支持石油業(yè)的概率
P(~S1):表示俄羅斯將不支持石油業(yè)的概率
P(E|S1):表示假設(shè)在俄羅斯將繼續(xù)支持石油業(yè)條件下,背水公司經(jīng)濟(jì)師對(duì)新證據(jù)“俄羅斯宣布將會(huì)出售所有油田”的主觀概率
P(E|~S1):表示假設(shè)在俄羅斯將不支持支持石油業(yè)條件下,背水公司經(jīng)濟(jì)師對(duì)新證據(jù)“俄羅斯宣布將會(huì)出售所有油田”的主觀概率
--計(jì)算結(jié)果:在excel中運(yùn)用【P(E|S1)P(S1)/(P(E|S1)P(S1)+P(E|S1)*P(S1))】計(jì)算P(S1|E)結(jié)果如下:

--在散點(diǎn)圖中可以看出,在新證據(jù)條件下,大部分經(jīng)濟(jì)師仍覺(jué)得俄羅斯將繼續(xù)支持石油業(yè)

4.附錄:書籍中的分析數(shù)據(jù)可在如下地址:下載地址

