2019-01-09 博弈論小結(jié)

本文總結(jié)了非合作博弈論的一小部分內(nèi)容,主要分為核心概念、概念間的關(guān)系、經(jīng)典案例三部分,其中第一、三部分只是羅列概念和案例名稱,不會(huì)對(duì)內(nèi)容進(jìn)行闡述,第二部分才是文章核心。文章中的所有概念及案例均來自Steven Tadelis的著作《Game Theory: An Introduction》.

Game Theory An Introduction

核心概念:

第一章

靜態(tài)博弈的兩步(static game)
完全信息的含義(complete information)
公共知識(shí)的意思(common knowledge)
規(guī)范式博弈的3個(gè)要素以及矩陣表示(Normal-form game)
帕累托占優(yōu)與帕累托最優(yōu)(Pareto dominated& Pareto optimal)

第二章

嚴(yán)格被占優(yōu)策略(strictly dominated strategy)
嚴(yán)格優(yōu)勢策略均衡(strictly dominant equilibrium)
IESDS方法(迭代刪除嚴(yán)格被占優(yōu)策略Iterated elimination of strictly dominated strategy)
最優(yōu)應(yīng)對(duì)(Best respons)
信念(Belief)
最優(yōu)應(yīng)對(duì)對(duì)應(yīng)(best response correspondence)
可理性化策略(rationalizable strategy)

第三章

納什均衡(帶信念的定義和不帶信念的定義)
矩陣中如何找納什均衡

第四章

擴(kuò)展式博弈的要素(extensive-form game)
擴(kuò)展式博弈的博弈樹表示(game tree)
信息集(information set)
完美信息與完美信息博弈(perfect information)
擴(kuò)展式博弈的純策略(pure strategies in extensive-form games)
擴(kuò)展式博弈的規(guī)范式表示(Normal-form representation of extensive-form games) 以及該表示下如何找Nash均衡

第五章

序貫理性(sequentially rational)
逆向歸納(backward induction)
適當(dāng)?shù)淖硬┺?proper subgame)
子博弈納什均衡(subgame-perfect Nash equilibrium)

第六章

不完全信息(incomplete information)的三個(gè)組成部分
不完全信息下的靜態(tài)貝葉斯博弈(static Bayesian game of incomplete information)
貝葉斯博弈的純策略(pure strategy)與混合策略(mixed strategy) (考慮到自己不同類型上的行為)
純策略的貝葉斯納什均衡(pure-strategy Basyesian Nash equilibrium)
閾值法則(threshold rule)

概念關(guān)系:

我理解博弈論就是對(duì)不同博弈進(jìn)行分類、表示和對(duì)的研究的學(xué)科。

分類

根據(jù)參與者是同時(shí)行動(dòng)還是有先后順序,分成靜態(tài)博弈動(dòng)態(tài)博弈;例如兩個(gè)人玩石頭剪刀布就屬于靜態(tài)博弈,因?yàn)閮蓚€(gè)人是同時(shí)出拳(自己的行動(dòng))的;而棋牌類游戲基本上都是動(dòng)態(tài)博弈。
根據(jù)博弈中參與者的行為、結(jié)果和收益函數(shù)是否是共同知識(shí),分為完全信息博弈非完全信息博弈;由于這兩個(gè)方面是獨(dú)立的,因此就有完全信息的靜態(tài)博弈(前三章)、完全信息的動(dòng)態(tài)/擴(kuò)展式博弈(第四、五章)、不完全信息的靜態(tài)博弈(第六章)。(暫不考慮不完全信息的動(dòng)態(tài)/擴(kuò)展式博弈)
其中,動(dòng)態(tài)博弈還存在完美信息非完美信息的區(qū)別,這主要取決于后做決策的參與者能否知道前面做決策的參與者做的決策(用嚴(yán)格的話說就是信息集是否都是單點(diǎn)集)

完全信息 不完全信息
靜態(tài)博弈 完全信息下的靜態(tài)博弈 不完全信息下的靜態(tài)博弈
動(dòng)態(tài)博弈 完全信息下的動(dòng)態(tài)博弈 不完全信息下的動(dòng)態(tài)博弈
表示

主要學(xué)了規(guī)范式表示(對(duì)于二人博弈來說就是矩陣表示)和擴(kuò)展式表示博弈樹表示)。對(duì)于完全信息的靜態(tài)博弈,明顯更適合規(guī)范式表示;對(duì)于完全信息的擴(kuò)展式博弈,明顯更適合擴(kuò)展式表示,但是也可以用規(guī)范式表示。
還有一個(gè)至關(guān)重要的定義,就是在不同類型博弈下,對(duì)博弈策略的定義。我們只討論純策略。在完全信息靜態(tài)博弈下,一個(gè)純策略是一個(gè)確定的行動(dòng);在完全信息的擴(kuò)展式博弈下,參與者的一個(gè)純策略是一個(gè)映射,從他的信息集映射到行為集上,通俗地說,參與者的一個(gè)純策略是在博弈前就確定好他在所有信息集上采取的行為;在靜態(tài)的貝葉斯博弈中,參與者的一個(gè)純策略也是一個(gè)映射,從他的類型集映射到行為集上,通俗地說,在參與者知曉自己的類型前,在所有可能的類型上選擇采取的行為。

求解

同樣的一種博弈類型,可以有不同的定義解的方法,我們從存在性(existence)、唯一性(uniqueness)及不變性(invariance)來評(píng)價(jià)不同解。
完全信息的靜態(tài)博弈,可以用IESDS方法,也可以找納什均衡。IESDS方法求得的解更強(qiáng),但是博弈不一定有唯一的IESDS解。此外還可以求嚴(yán)格優(yōu)勢策略均衡可理性化策略均衡。
完全信息的擴(kuò)展式博弈,可以用規(guī)范式表達(dá)找到納什均衡,但這些納什均衡有的不合理,這時(shí)候就要引入序貫理性的概念,并且用逆向歸納法求出所有更加合理的納什均衡;對(duì)于非完美信息下的完全信息的擴(kuò)展式博弈,就不適合使用逆向歸納法,但是要是還想讓它滿足序貫理性,我們就引入了適當(dāng)?shù)?真子博弈(proper subgame),并求得子博弈完美納什均衡
對(duì)于不完全信息下的靜態(tài)博弈/貝葉斯博弈,我們定義了它的納什均衡,也就是純策略的貝葉斯納什均衡

完全信息下的靜態(tài)博弈 完全信息下的動(dòng)態(tài)博弈 不完全信息下的靜態(tài)博弈
嚴(yán)格優(yōu)勢策略均衡 純策略納什均衡 純策略貝葉斯納什均衡
IESDS策略均衡 序貫理性策略均衡
可理性化策略均衡 子博弈完美納什均衡
純策略納什均衡

經(jīng)典案例:

第一章

囚徒困境(prisoners' dilemma)
投票表決(voting on new agenda)
石頭剪刀布(Rock-paper-scissors)
性別之戰(zhàn)(battle of the sexes)

第二章

廣告博弈(advertising game)
選美比賽(p-beauty contest)

第三章

膽小鬼博弈(game of chickens)
獵鹿博弈(stag hunt game)
公共品悲劇(tragedy of the commons)
選舉競爭(electoral competition)

第四章

有順序的性別之戰(zhàn)(sequential-move battle of the sexes)

第五章

自愿的性別之戰(zhàn)(the voluntary battle of the sexes)
卡片博弈(a game of cards)
蜈蚣博弈(centipede game)
斯塔克伯格博弈(Stackelberg Competition)

第六章

不完全信息下的進(jìn)入博弈(incomplete-information entry game)
不完全信息下的膽小鬼博弈(game of chicken)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 大家早安、午安、晚安,今天我先從機(jī)器學(xué)習(xí)的學(xué)習(xí)中休息一下,來了解一些常見的博弈論模型,然后繼續(xù)學(xué)習(xí)機(jī)器學(xué)習(xí)等。以下...
    keepStriving閱讀 47,713評(píng)論 3 72
  • 36博弈的基本概念 行動(dòng):參與人在某個(gè)時(shí)點(diǎn)的決策變量,Ai表示第i個(gè)參與人的一個(gè)特定行動(dòng),Ai={ai}表示可供i...
    玩哲閱讀 9,834評(píng)論 6 70
  • 首先對(duì)博弈與博弈論有個(gè)了解 博弈概念: 什么是博弈 博弈是指在一定的游戲規(guī)則約束下,基于直接相互作用的環(huán)境條件,...
    葵和海閱讀 3,889評(píng)論 0 15

友情鏈接更多精彩內(nèi)容