你正在圖書館枯坐,一位陌生美女主動過來和你搭訕,并要求和你一起玩?zhèn)€數(shù)學(xué)游戲。美女提議:“讓我們各自亮出硬幣的一面,或正或反。如果我們都是正面,那么我給你3元,如果我們都是反面,我給你1元,剩下的情況你給我2元就可以了。”那么該不該和這位姑娘玩這個游戲呢?
每一種游戲依具其規(guī)則的不同會存在兩種納什均衡,一種是純策略納什均衡,也就是說玩家都能夠采取固定的策略(比如一直出正面或者一直出反面),使得每人都賺得最多或虧得最少;或者是混合策略納什均衡,而在這個游戲中,便應(yīng)該采用混合策略納什均衡。

假設(shè)我們出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。為了使利益最大化,應(yīng)該在對手出正面或反面的時候我們的收益都相等,由此列出方程就是
3x + (-2)(1-x) = (-2) * x + 1*( 1-x )——解方程得x=3/8;
同樣,美女的收益,列方程-3y + 2( 1-y) = 2y+ (-1) * ( 1-y)——解得y也等于3/8。
于是,我們就可以算美女每次的期望收益是:(1-y)(2x-(1-x)) + y(-3x+2(1-x)) = 1/8元,也就是說,雙方都采取最優(yōu)策略的情況下,平均每次美女贏1/8元。
計算解釋:
1.(1-y)(2x-(1-x)) 代表著:美女出反面時,獲得的收益 = 你出正面*美女的損益 + 你出反面*美女的損益
2.y(-3x+2(1-x)) 代表著:美女出正面時,獲得的收益 = 你出正面*美女的損益 + 你出反面*美女的損益
其實只要美女采取了(3/8,5/8)這個方案,不論你再采用什么方案,都是不能改變局面的。
如果你全部出正面,你每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;
如果你全部出反面,你每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。
如果你用完全隨機? (1/2, 1/2)? 策略,你的收益是 1/2 * (3/8 * 3 + 5/8 * (-2)) + 1/2 * (3/8 * (-2) + 5/8 * 1) = -1/8;
計算解釋:
1.1/2 * (3/8 * 3 + 5/8 * (-2)) 代表著:當(dāng)你有1/2的概率出正面的時候,你的收益為:美女出正面的概率*你的損益 + 美女出反面的概率*你的損益
2.1/2 * (3/8 * (-2) + 5/8 * 1) 代表著:當(dāng)你有1/2的概率出反面的時候,你的收益為:美女出正面的概率*你的損益 + 美女出反面的概率*你的損益
實際上,不論你用什么策略,你的收益都是 -1/8,也就是說,隨便玩一種策略,你都是在納什均衡狀態(tài)中的,所以,這個把戲你隨便怎么玩,都是虧的。
這個例子中是沒有純戰(zhàn)略納什均衡的,因為只出一種策略,肯定有一方要虧錢,所以并不是其均衡狀態(tài)(明明只要換一邊就可以賺錢了,所以不是最佳策略);而混合納什均衡是純在的,事實上,Nash告訴我們“每個參與者都只有有限種策略選擇、并允許混合策略的前提下,納什均衡一定存在”,如果美女出(3/8,5/8)這個方案,另一邊任何玩法都是期望收益一樣的,也就滿足了納什均衡的條件。