博弈論——拋硬幣

你正在圖書館枯坐,一位陌生美女主動過來和你搭訕,并要求和你一起玩?zhèn)€數(shù)學(xué)游戲。美女提議:“讓我們各自亮出硬幣的一面,或正或反。如果我們都是正面,那么我給你3元,如果我們都是反面,我給你1元,剩下的情況你給我2元就可以了。”那么該不該和這位姑娘玩這個游戲呢?

每一種游戲依具其規(guī)則的不同會存在兩種納什均衡,一種是純策略納什均衡,也就是說玩家都能夠采取固定的策略(比如一直出正面或者一直出反面),使得每人都賺得最多或虧得最少;或者是混合策略納什均衡,而在這個游戲中,便應(yīng)該采用混合策略納什均衡。


損益表

假設(shè)我們出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。為了使利益最大化,應(yīng)該在對手出正面或反面的時候我們的收益都相等,由此列出方程就是

3x + (-2)(1-x) = (-2) * x + 1*( 1-x )——解方程得x=3/8;

同樣,美女的收益,列方程-3y + 2( 1-y) = 2y+ (-1) * ( 1-y)——解得y也等于3/8。

于是,我們就可以算美女每次的期望收益是:(1-y)(2x-(1-x)) + y(-3x+2(1-x)) = 1/8元,也就是說,雙方都采取最優(yōu)策略的情況下,平均每次美女贏1/8元。

計算解釋:

1.(1-y)(2x-(1-x)) 代表著:美女出反面時,獲得的收益 = 你出正面*美女的損益 + 你出反面*美女的損益

2.y(-3x+2(1-x)) 代表著:美女出正面時,獲得的收益 = 你出正面*美女的損益 + 你出反面*美女的損益


其實只要美女采取了(3/8,5/8)這個方案,不論你再采用什么方案,都是不能改變局面的。

如果你全部出正面,你每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;

如果你全部出反面,你每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。

如果你用完全隨機? (1/2, 1/2)? 策略,你的收益是 1/2 * (3/8 * 3 + 5/8 * (-2)) + 1/2 * (3/8 * (-2) + 5/8 * 1) = -1/8;

計算解釋:

1.1/2 * (3/8 * 3 + 5/8 * (-2)) 代表著:當(dāng)你有1/2的概率出正面的時候,你的收益為:美女出正面的概率*你的損益 + 美女出反面的概率*你的損益

2.1/2 * (3/8 * (-2) + 5/8 * 1) 代表著:當(dāng)你有1/2的概率出反面的時候,你的收益為:美女出正面的概率*你的損益 + 美女出反面的概率*你的損益

實際上,不論你用什么策略,你的收益都是 -1/8,也就是說,隨便玩一種策略,你都是在納什均衡狀態(tài)中的,所以,這個把戲你隨便怎么玩,都是虧的。

這個例子中是沒有純戰(zhàn)略納什均衡的,因為只出一種策略,肯定有一方要虧錢,所以并不是其均衡狀態(tài)(明明只要換一邊就可以賺錢了,所以不是最佳策略);而混合納什均衡是純在的,事實上,Nash告訴我們“每個參與者都只有有限種策略選擇、并允許混合策略的前提下,納什均衡一定存在”,如果美女出(3/8,5/8)這個方案,另一邊任何玩法都是期望收益一樣的,也就滿足了納什均衡的條件。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容