19 博弈論的基本概念

村子里有兩戶富戶,他們是鄰居,墻倒了,有兩種可能:一家修,另一家就不修;一家不修,另一家就得修。
冷戰(zhàn)期間,美蘇搶占地盤(pán):一方搶占一塊地盤(pán),另一方就占另一塊。
夫妻吵架,一方厲害,另一方就出去躲躲。
注意,此處在混合戰(zhàn)略納什均衡條件下,也可能是兩敗俱傷。
因此,博弈論的基本概念包括:
參與人:博弈論中選擇行動(dòng)以最大化自己效用的決策主體。
行動(dòng):參與人的決策變量。
戰(zhàn)略:參與人的選擇行動(dòng)的規(guī)則。
信息:參與人的博弈中的知識(shí),特別是有關(guān)其他參與人的特征和行動(dòng)的知識(shí)。
支付函數(shù):參與人從博弈中要獲得的效用水平。
結(jié)果:博弈分析真正感興趣的要素的集合。
均衡:所有參與人的最優(yōu)戰(zhàn)略的組合。
20占優(yōu)戰(zhàn)略均衡
歷史故事,黔之驢——驢虎博弈
作者,唐柳宗元。
黔無(wú)驢,有好事者船載以入。至則無(wú)可用,放之山下。虎見(jiàn)之,龐然大物也,以為神,蔽林間窺之。稍出近之,慭慭然,莫相知。
他日,驢一鳴,虎大駭,遠(yuǎn)遁;以為且噬己也,甚恐。然往來(lái)視之,覺(jué)無(wú)異能者;益習(xí)其聲,又近出前后,終不敢搏。稍近,益狎,蕩倚沖冒。驢不勝怒,蹄之?;⒁蛳?,計(jì)之曰:“技止此耳!”因跳踉大?,斷其喉,盡其肉,乃去。
噫!形之龐也類有德,聲之宏也類有能。向不出其技,虎雖猛,疑畏,卒不敢取。今若是焉,悲夫!
占優(yōu)戰(zhàn)略均衡:不論其他人選擇什么戰(zhàn)略,參與人的最優(yōu)戰(zhàn)略是唯一的,這樣的最優(yōu)戰(zhàn)略稱為“占優(yōu)戰(zhàn)略“(dominant strategy)。
注意:如果所有人都有(嚴(yán)格)占優(yōu)戰(zhàn)略的存在,那么,占優(yōu)戰(zhàn)略均衡就是可以預(yù)測(cè)的唯一均衡。
占優(yōu)戰(zhàn)略只要求每個(gè)參與人是理性的,而不要求每個(gè)人參與人知道其他參與人是理性的(也就是說(shuō),不要求理性是共同知識(shí)),為什么?
21重復(fù)剔除的占優(yōu)均衡
思路是,首先找到某個(gè)參與人的劣戰(zhàn)略(假定存在),把這個(gè)劣戰(zhàn)略剔除掉,重新構(gòu)造一個(gè)不包含剔除戰(zhàn)略的新的博弈,然后再剔除這個(gè)新的博弈中的某個(gè)參與人的劣戰(zhàn)略,一直重復(fù)這個(gè)過(guò)程,直到只剩下唯一的戰(zhàn)略組合為止。
這個(gè)唯一剩下的戰(zhàn)備組合就是這個(gè)博弈的均衡解,稱為“重復(fù)剔除的占優(yōu)均衡”。
如果這種唯一戰(zhàn)略組合是存在的,我們就說(shuō)該博弈是重復(fù)剔除占優(yōu)可解。注意,如果重復(fù)剔除后的戰(zhàn)略組合不唯一,該博弈就不是重復(fù)剔除占優(yōu)可解的。
例如,卑斯麥之戰(zhàn)。
卑斯麥之戰(zhàn)發(fā)生在1943年的南太平洋上,日本海軍上將木村受命將日本陸軍運(yùn)抵新幾內(nèi)亞,其間要穿越卑斯麥海。
而美國(guó)上將肯尼欲對(duì)日軍運(yùn)輸船進(jìn)行轟炸,穿越卑斯麥之戰(zhàn)海通往新幾內(nèi)亞的有兩條航線,木村必須從中選擇一條,而肯尼則必須決定將其飛機(jī)派往何處去搜索日軍,如果肯尼將他的飛機(jī)派到了錯(cuò)誤的航線上,他雖可以召回它們,但可供轟炸的天數(shù)將減少。
結(jié)果是,俾斯麥海之戰(zhàn)預(yù)示的情形已經(jīng)顯露無(wú)疑:盟國(guó)陸基航空兵完全封鎖了新幾內(nèi)亞的日軍和外界的一切聯(lián)系和交通。美國(guó)陸航和澳大利亞皇家空軍在新幾內(nèi)亞作戰(zhàn)的勝利,成為往后各國(guó)陸基航空兵實(shí)施對(duì)海作戰(zhàn)所借鑒的經(jīng)典戰(zhàn)例。
這是一個(gè)重復(fù)剔除的占優(yōu)均衡,這是有兩點(diǎn)決定的。
一個(gè)是,重復(fù)剔除的占優(yōu)均衡結(jié)果與劣戰(zhàn)略的剔除順序是否有關(guān),這取決于剔除的是否是嚴(yán)格劣戰(zhàn)略。
另一個(gè)是,重復(fù)剔除的占優(yōu)均衡,要求每個(gè)人參與人是理性的,而且要求“理性”是參與人的共同知識(shí)。也即是說(shuō),所有參與人知道所有參與是理性的,所有參與人知道所有參與人知道所有參與是理性。
22什么是納什均衡
納什均衡的定義:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略組合(s1*,…,sn*)中,任一博弈方i的策略si*,都是對(duì)其余博弈方策略的組合(s1*,…s*i-1,s*i+1,…,sn*)的最佳對(duì)策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)對(duì)任意sij∈Si都成立,則稱(s1*,…,sn*)為G的一個(gè)納什均衡。
假設(shè)N個(gè)參與人在博弈之前達(dá)成一個(gè)協(xié)議,規(guī)定每一個(gè)參與人選擇一個(gè)特定的戰(zhàn)略,令s*=( s1*,…,sn*),代表這個(gè)協(xié)議,在沒(méi)有外在強(qiáng)制力的情況下,如果沒(méi)有任何人有積極性破壞這個(gè)協(xié)議,則這個(gè)協(xié)議是自動(dòng)實(shí)施的,這個(gè)協(xié)議就構(gòu)成了納什均衡。
一群賭徒圍成一圈賭博,每個(gè)人將自己的錢(qián)放在身邊的地上(每個(gè)人都知道自己有多少錢(qián)),來(lái)了一陣風(fēng)吹,把所有的錢(qián)混在一起,使他們無(wú)法分辨哪些錢(qián)是自己的,他們?yōu)榇硕l(fā)生爭(zhēng)執(zhí),后來(lái)請(qǐng)了律師。
納什均衡為什么能解決這個(gè)問(wèn)題呢?
律師說(shuō):每個(gè)人把自己的錢(qián)寫(xiě)在紙條上,然后交給律師;如果所有人要求的加總不大于錢(qián)的總數(shù),每個(gè)人得到自己要求的部分(如果有剩余的話,剩余部分歸律師);如果所有人要求的加總大于錢(qián)的總數(shù),所有的錢(qián)都?xì)w律師所有。
這是一個(gè)很經(jīng)典的窮途困境模型,律師把所有賭徒全部置于了窮途,設(shè)想一下,如果每個(gè)賭徒都是理智的話,肯定都想要占便宜,但如果要求總數(shù)超過(guò)了總數(shù),錢(qián)將都屬于律師,那么這明顯是最不智慧的選擇,所以這里所有賭徒都只有唯一一個(gè)選擇就是寫(xiě)出自己真實(shí)的數(shù)字,然后拿回自己的那份錢(qián),這就是最后的納什均衡。
這也說(shuō)明,納什均衡與占優(yōu)戰(zhàn)略均衡及重復(fù)剔除的占優(yōu)均衡。
第一種情況是,每一個(gè)占優(yōu)戰(zhàn)略均衡及重復(fù)剔除的占優(yōu)均衡一定是納什均衡,但并非每一個(gè)納什均衡都是占優(yōu)戰(zhàn)略均衡或重復(fù)剔除的占優(yōu)均衡。
第二個(gè)是,納什均衡一定是在重復(fù)剔除嚴(yán)格劣勢(shì)戰(zhàn)略過(guò)程中沒(méi)有被剔除掉的戰(zhàn)略組合,但沒(méi)有被剔除掉的組合不一定是納什均衡,除非它是唯一的(不適用于嚴(yán)格弱劣戰(zhàn)略的情況)。
