博弈論-信息集和子博弈完美

  • 本節(jié)主要內(nèi)容:分析同時(shí)存在同步競價(jià)和貫序博弈的場景,擴(kuò)展逆行歸納法的應(yīng)用

游戲:

  • 假設(shè):在這個(gè)游戲中參與人2無法分辨上和中,也就是說如果參與人1選擇上和中,那么參與人2只知道參與人選了上或中
  • 在假設(shè)下,參與人1可能不會(huì)選擇下,因?yàn)檫x擇下時(shí),參與人2可以知道參與人1的準(zhǔn)確選擇,而這里參與人1可能會(huì)隨機(jī)選擇上和中

  • 定義:參與者i(2)的信息集合,是一系列參與人i(2) 無法識(shí)別的參與人i的節(jié)點(diǎn)

    • 不允許下面的情況存在,因?yàn)槿绻腥齻€(gè)選擇就意味著,參與人1選擇了M
    • 不允許下面情況存在,因?yàn)槿绻麉⑴c人1在第二次博弈的時(shí)候可以根據(jù)所在節(jié)點(diǎn)知道參與人二的選擇
  • 完美信息定義:樹圖上所有的信息集合只包含一個(gè)節(jié)點(diǎn)博弈,也就是沒有豎線的存在,即每個(gè)參與人都知道之前的行動(dòng)

  • 非完美信息定義:在樹圖中存在豎線的博弈,即存在信息集合包括不少于兩個(gè)節(jié)點(diǎn)

  • 信息集合加上樹圖可以表示同步博弈

  • 純策略:參與人i的純策略是一個(gè)完全行動(dòng)計(jì)劃,他告訴參與人在他的每一個(gè)信息集合一定要怎么做

  • 例子:

    • 樹圖1
    • 樹圖2
    • 參與人1有UD兩種策略,參與人2有LMR三種策略

    • 結(jié)論:樹圖1、2擁有相同的收益矩陣說明時(shí)序在這里不是主要影響博弈結(jié)果的因素

    • 收益矩陣:
      策略 | L|M|R
      ---|---|---|---
      U | a1,a2|b1,b2|c1,c2
      D | d1,d2|e1,e2|f1,f2

游戲:三個(gè)參與人

  • 樹圖(參與人3處存在一條豎線,即信息集合)


  • 收益矩陣:

參與人執(zhí)行策略A時(shí)2,3收益矩陣:

策略 l r
U 1,0,0 1,0,0
D 1,0,0 1,0,0

參與人執(zhí)行策略B時(shí)2,3收益矩陣:

策略 l r
U 0,1,1 0,0,2
D 0,0,-1 2,1,0
  • (A,u,l)是納什均衡,但不是可信納什均衡,因?yàn)槿绻麉⑴c人1由A策略變成B策略,那么2,3存在一個(gè)子博弈,而且由下表可以看出,子博弈只存在一個(gè)納什均衡(D,r),從這里看出如果進(jìn)入子博弈,那么無法達(dá)到(A,U,l)這個(gè)納什均衡,所以它不是SPE
  • 子博弈矩陣如下:
策略 l r
U 1,1 0,2
D 0,-1 1,0
  • 定義:子博弈是博弈中的一部分,他有三個(gè)性質(zhì),即滿足以下三個(gè)條件:
    • 子博弈必須從單個(gè)節(jié)點(diǎn)開始
    • 子博弈包括該節(jié)點(diǎn)的所有后代節(jié)點(diǎn)
    • 子博弈不能破壞任何信息集合,即不能只把信息集合中的一個(gè)節(jié)點(diǎn)放入子博弈中而必須把所有節(jié)點(diǎn)放入子博弈中
      定義:如果納什均衡能在任一子博弈中達(dá)到納什均衡,那他就是一個(gè)子博弈完美均衡(SPE)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容