博弈論沉思13貝葉斯法則

60貝葉斯法則

在日常生活中,當(dāng)面臨不確定時(shí),我們對(duì)某事件發(fā)生的可能性有一個(gè)判斷,然后,會(huì)根據(jù)新的信息來修正這個(gè)判斷。

統(tǒng)計(jì)學(xué)上,修正之前的判斷稱為“先驗(yàn)概率”。修正后的判斷稱為“后驗(yàn)概率”。

貝葉斯法則就是人們根據(jù)新的信息從先驗(yàn)概率得到后驗(yàn)概率的基本方法。

貝葉斯法則

人:好人(GP),壞人(BP)

事:好事(GT),壞事(BT)

一個(gè)人干好事的概率等于他是好人的概率p(GP)乘以好人干好事的概率p(GT|GP),加上他是壞人的概率p(BP)乘以壞人干好事的概率p(GT|BP):

Prob{GT}=p(GT|GP)*p(GP)+p(GT|BP)*p(BP)

假定觀測到一個(gè)人干了一件好事,那么這個(gè)人是好人的后驗(yàn)概率是:Prob{GP|GT}=p(GT|GP)p(GP)/Prob{GT}

假定我們認(rèn)為這個(gè)人是好人的先驗(yàn)概率是1/2,觀測到他干了好事之后如何修正他的先驗(yàn)概率依賴于他干的好事好到什么程度:

1、是一件非常好的好事,壞人絕對(duì)不可能干,則p(GT|GP)=1/2p(GT|BP)=1/2

2、這是一個(gè)非常一般的好事,好人會(huì)干,壞人也會(huì)干:p(GT|GP)=1p(GT|BP)=1

3、介于上述兩種情況之間:好人肯定會(huì)干,但壞人可能會(huì)干也可能不會(huì)干:p(GT|GP)=1/2p(GT|BP)=1/2。

假定我們觀測到他干了一件壞事,我們相信,好人絕對(duì)不會(huì)干壞事,那么可以肯定他絕對(duì)不是一個(gè)好人。p(GT|GP)=1/2p(GT|BP)=1/2,假定我們?cè)瓉碚J(rèn)為他是個(gè)好人,也突然發(fā)現(xiàn)他干了一件好事,我們?nèi)绾慰创??p(GT|GP)=1p(GT|BP)=1

61精煉貝葉斯納什均衡

混同均衡,因?yàn)閮深愒谖徽哌x擇同樣的價(jià)格,直觀地講,因?yàn)閤<1/2,如果進(jìn)入者不能從在位者的價(jià)格選擇中得到新的信息,她選擇不進(jìn)入。

因此,高成本在位者可以通過選擇與低成本在位者相同的價(jià)格隱藏自己是高成本的事實(shí),低成本在位者也沒有必要批露自己是低成本的事實(shí)。

分離均衡,因?yàn)椴煌愋偷脑谖徽哌x擇了不同的價(jià)格。低成本在位者選擇了非單階段最優(yōu)價(jià)格p=4;高成本在位者選擇了單階段最優(yōu)壟斷價(jià)格p=6。

如果低成本在位者選擇p=5,無法將自己與高成本在位者分開,進(jìn)入者將進(jìn)入,但如果他選擇p=4,高成本在位者不會(huì)模仿,進(jìn)入者不進(jìn)入,因此低成本在位者寧愿放棄3單位的現(xiàn)期利潤換取4單位的下期利潤。

高成本在位者之所以不選擇p=4,是因?yàn)槌杀咎?,下階段的4單位例如不足以彌補(bǔ)現(xiàn)期5單位的損失。不完全信息帶來的唯一后果是,低成本在位者損失3單位的利潤,這也可以說是他為了證明自己是低成本而支付的“認(rèn)證”費(fèi)用。

啤酒-蛋糕博弈,參與人1是一個(gè)善于打架的強(qiáng)者的概率是0.9,是一個(gè)不善于打架的弱者的概率是0.1,但是,即使參與人1知道自己能打贏,也不想和別人打架。如果參與人1是弱者,參與人2就想和他打架。

參與人2不知道參與人1的類型,但他能夠觀察參與人1早餐吃什么,如。參與人2知道若者喜歡以蛋糕為早餐,而強(qiáng)者喜歡以啤酒為早餐。

兩個(gè)均衡:無論參與人1是什么類型,都選擇啤酒做早餐,參與人2選擇不打架;無論參與人是什么類型,都選擇蛋糕作為早餐,參與人2選擇不打架。——被排除

62信號(hào)傳遞博弈及其應(yīng)用舉例

信號(hào)傳遞博弈是一種比較簡單的但有廣泛應(yīng)用意義的不完全信息動(dòng)態(tài)博弈。

參與人:兩個(gè),信號(hào)發(fā)送者1和信號(hào)接收者2;1的類型是私人信息,2的類型是公共信息(即只有一個(gè)類型)。

博弈順序:1、“自然”首先選擇參與人1的類型,參與人1知道,但參與人2不知道。只知道1屬于該類型x的先驗(yàn)概率。

2、參與人1觀測到類型x后發(fā)出信號(hào)。

3、參與人2觀測到參與人1發(fā)出的信號(hào),使用貝葉斯法則從先驗(yàn)概率得到后驗(yàn)概率,然后選擇行動(dòng)。

信號(hào)傳遞博弈的所有可能的精練貝葉斯均衡可以劃分為3類:

分離均衡:不同類型的發(fā)送者(參與人1)以1的概率選擇不同的信號(hào),或者說,沒有任何類型選擇與其他類型相同的信號(hào)在分離均衡下,信號(hào)準(zhǔn)確地揭示出類型。

混同均衡:不同類型的發(fā)送者選擇相同的信號(hào),或者說,沒有任何類型選擇與其他類型不同的信號(hào),因此,接收者不修正先驗(yàn)概率。

準(zhǔn)分離均衡:一些類型的發(fā)送者隨機(jī)地選擇信號(hào),另一些類型的發(fā)送者選擇特定的信號(hào)。

強(qiáng)盜分金——子博弈精練納什均衡((U,U’),L).U’和L分別是參與人1和參與人2在非均衡路徑上的選擇。

逆向歸納法求解子博弈精練納什均衡的過程,實(shí)質(zhì)上是重復(fù)剔除劣戰(zhàn)略的過程:從最后一個(gè)決策結(jié)依次剔除每個(gè)子博弈的劣戰(zhàn)略,最后生存下來的戰(zhàn)略構(gòu)成精練納什均衡。

貝葉斯納什均衡:n人不完全信息靜態(tài)博弈的純戰(zhàn)略均衡是一個(gè)類型依存戰(zhàn)略組合,其中每個(gè)參與人i在給定自己的類型θi和其他參與人類型依存戰(zhàn)略的情況下,最大化自己的期望效用。

精練貝葉斯均衡是貝葉斯均衡、子博弈精練均衡和貝葉斯推斷的結(jié)合。它要求:

1、在每個(gè)信息集上,決策者必須有一個(gè)定義在屬于該信息集的所有決策結(jié)上的一個(gè)概率分布(信念);

2、給定該信息集上的概率分布和其他參與人的后續(xù)戰(zhàn)略,參與人的行動(dòng)必須是最優(yōu)的;

3、每一個(gè)參與人根據(jù)貝葉斯法則和均衡戰(zhàn)略修正后驗(yàn)概率。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 53不完全信息靜態(tài)博弈——貝葉斯納什均衡 在不完全信息靜態(tài)博弈中,所有參與人同時(shí)行動(dòng),其戰(zhàn)略空間等于行動(dòng)空間,但是...
    玩哲閱讀 7,848評(píng)論 4 69
  • 49不完全信息博弈 我們不可能料事如神,也無法掌握所有變因,更無力預(yù)測未來,不確定性就象繳稅一樣不可避免。 這里主...
    玩哲閱讀 6,546評(píng)論 5 69
  • 大家早安、午安、晚安,今天我先從機(jī)器學(xué)習(xí)的學(xué)習(xí)中休息一下,來了解一些常見的博弈論模型,然后繼續(xù)學(xué)習(xí)機(jī)器學(xué)習(xí)等。以下...
    keepStriving閱讀 47,698評(píng)論 3 72
  • 價(jià)值投資已經(jīng)被越來越多的人所推崇,通過價(jià)值投資獲得的回報(bào)率會(huì)更加穩(wěn)定,而將這一理論真正發(fā)揚(yáng)光大的正是偉大的股神巴菲...
    觴詠閱讀 457評(píng)論 1 2
  • 5月20日,他給他暗戀了許久的女生發(fā)了個(gè)紅包。 女生回復(fù):什么呀?簡直是受寵若驚!心意收到啦,紅包...
    寒塘1840閱讀 234評(píng)論 0 1

友情鏈接更多精彩內(nèi)容