60貝葉斯法則

在日常生活中,當(dāng)面臨不確定時(shí),我們對(duì)某事件發(fā)生的可能性有一個(gè)判斷,然后,會(huì)根據(jù)新的信息來修正這個(gè)判斷。
統(tǒng)計(jì)學(xué)上,修正之前的判斷稱為“先驗(yàn)概率”。修正后的判斷稱為“后驗(yàn)概率”。
貝葉斯法則就是人們根據(jù)新的信息從先驗(yàn)概率得到后驗(yàn)概率的基本方法。
貝葉斯法則
人:好人(GP),壞人(BP)
事:好事(GT),壞事(BT)
一個(gè)人干好事的概率等于他是好人的概率p(GP)乘以好人干好事的概率p(GT|GP),加上他是壞人的概率p(BP)乘以壞人干好事的概率p(GT|BP):
Prob{GT}=p(GT|GP)*p(GP)+p(GT|BP)*p(BP)
假定觀測到一個(gè)人干了一件好事,那么這個(gè)人是好人的后驗(yàn)概率是:Prob{GP|GT}=p(GT|GP)p(GP)/Prob{GT}
假定我們認(rèn)為這個(gè)人是好人的先驗(yàn)概率是1/2,觀測到他干了好事之后如何修正他的先驗(yàn)概率依賴于他干的好事好到什么程度:
1、是一件非常好的好事,壞人絕對(duì)不可能干,則p(GT|GP)=1/2p(GT|BP)=1/2
2、這是一個(gè)非常一般的好事,好人會(huì)干,壞人也會(huì)干:p(GT|GP)=1p(GT|BP)=1
3、介于上述兩種情況之間:好人肯定會(huì)干,但壞人可能會(huì)干也可能不會(huì)干:p(GT|GP)=1/2p(GT|BP)=1/2。
假定我們觀測到他干了一件壞事,我們相信,好人絕對(duì)不會(huì)干壞事,那么可以肯定他絕對(duì)不是一個(gè)好人。p(GT|GP)=1/2p(GT|BP)=1/2,假定我們?cè)瓉碚J(rèn)為他是個(gè)好人,也突然發(fā)現(xiàn)他干了一件好事,我們?nèi)绾慰创??p(GT|GP)=1p(GT|BP)=1
61精煉貝葉斯納什均衡
混同均衡,因?yàn)閮深愒谖徽哌x擇同樣的價(jià)格,直觀地講,因?yàn)閤<1/2,如果進(jìn)入者不能從在位者的價(jià)格選擇中得到新的信息,她選擇不進(jìn)入。
因此,高成本在位者可以通過選擇與低成本在位者相同的價(jià)格隱藏自己是高成本的事實(shí),低成本在位者也沒有必要批露自己是低成本的事實(shí)。
分離均衡,因?yàn)椴煌愋偷脑谖徽哌x擇了不同的價(jià)格。低成本在位者選擇了非單階段最優(yōu)價(jià)格p=4;高成本在位者選擇了單階段最優(yōu)壟斷價(jià)格p=6。
如果低成本在位者選擇p=5,無法將自己與高成本在位者分開,進(jìn)入者將進(jìn)入,但如果他選擇p=4,高成本在位者不會(huì)模仿,進(jìn)入者不進(jìn)入,因此低成本在位者寧愿放棄3單位的現(xiàn)期利潤換取4單位的下期利潤。
高成本在位者之所以不選擇p=4,是因?yàn)槌杀咎?,下階段的4單位例如不足以彌補(bǔ)現(xiàn)期5單位的損失。不完全信息帶來的唯一后果是,低成本在位者損失3單位的利潤,這也可以說是他為了證明自己是低成本而支付的“認(rèn)證”費(fèi)用。
啤酒-蛋糕博弈,參與人1是一個(gè)善于打架的強(qiáng)者的概率是0.9,是一個(gè)不善于打架的弱者的概率是0.1,但是,即使參與人1知道自己能打贏,也不想和別人打架。如果參與人1是弱者,參與人2就想和他打架。
參與人2不知道參與人1的類型,但他能夠觀察參與人1早餐吃什么,如。參與人2知道若者喜歡以蛋糕為早餐,而強(qiáng)者喜歡以啤酒為早餐。
兩個(gè)均衡:無論參與人1是什么類型,都選擇啤酒做早餐,參與人2選擇不打架;無論參與人是什么類型,都選擇蛋糕作為早餐,參與人2選擇不打架。——被排除
62信號(hào)傳遞博弈及其應(yīng)用舉例
信號(hào)傳遞博弈是一種比較簡單的但有廣泛應(yīng)用意義的不完全信息動(dòng)態(tài)博弈。
參與人:兩個(gè),信號(hào)發(fā)送者1和信號(hào)接收者2;1的類型是私人信息,2的類型是公共信息(即只有一個(gè)類型)。
博弈順序:1、“自然”首先選擇參與人1的類型,參與人1知道,但參與人2不知道。只知道1屬于該類型x的先驗(yàn)概率。
2、參與人1觀測到類型x后發(fā)出信號(hào)。
3、參與人2觀測到參與人1發(fā)出的信號(hào),使用貝葉斯法則從先驗(yàn)概率得到后驗(yàn)概率,然后選擇行動(dòng)。
信號(hào)傳遞博弈的所有可能的精練貝葉斯均衡可以劃分為3類:
分離均衡:不同類型的發(fā)送者(參與人1)以1的概率選擇不同的信號(hào),或者說,沒有任何類型選擇與其他類型相同的信號(hào)在分離均衡下,信號(hào)準(zhǔn)確地揭示出類型。
混同均衡:不同類型的發(fā)送者選擇相同的信號(hào),或者說,沒有任何類型選擇與其他類型不同的信號(hào),因此,接收者不修正先驗(yàn)概率。
準(zhǔn)分離均衡:一些類型的發(fā)送者隨機(jī)地選擇信號(hào),另一些類型的發(fā)送者選擇特定的信號(hào)。
強(qiáng)盜分金——子博弈精練納什均衡((U,U’),L).U’和L分別是參與人1和參與人2在非均衡路徑上的選擇。
逆向歸納法求解子博弈精練納什均衡的過程,實(shí)質(zhì)上是重復(fù)剔除劣戰(zhàn)略的過程:從最后一個(gè)決策結(jié)依次剔除每個(gè)子博弈的劣戰(zhàn)略,最后生存下來的戰(zhàn)略構(gòu)成精練納什均衡。
貝葉斯納什均衡:n人不完全信息靜態(tài)博弈的純戰(zhàn)略均衡是一個(gè)類型依存戰(zhàn)略組合,其中每個(gè)參與人i在給定自己的類型θi和其他參與人類型依存戰(zhàn)略的情況下,最大化自己的期望效用。
精練貝葉斯均衡是貝葉斯均衡、子博弈精練均衡和貝葉斯推斷的結(jié)合。它要求:
1、在每個(gè)信息集上,決策者必須有一個(gè)定義在屬于該信息集的所有決策結(jié)上的一個(gè)概率分布(信念);
2、給定該信息集上的概率分布和其他參與人的后續(xù)戰(zhàn)略,參與人的行動(dòng)必須是最優(yōu)的;
3、每一個(gè)參與人根據(jù)貝葉斯法則和均衡戰(zhàn)略修正后驗(yàn)概率。