D1 打卡《博弈論》
先來講講博弈論中經(jīng)典的個(gè)人最優(yōu)選擇并非團(tuán)體最優(yōu)選擇的例子—囚徒困境。
囚徒困境
一天,警局接到報(bào)案,一位富翁被殺死在自己的別墅中,家中的財(cái)物也被洗劫一空。經(jīng)過多方調(diào)查,警方最終將嫌疑人鎖定在杰克和亞當(dāng)身上。因?yàn)橛心繐粽呤掳l(fā)時(shí)看到他們兩個(gè)從富翁家中倉皇逃離。
但是到了拘留所里面,兩人都矢口否認(rèn)自己殺過人,他們辯稱自己只是路過那里,想進(jìn)去偷點(diǎn)東西,結(jié)果進(jìn)去的時(shí)候發(fā)現(xiàn)主人已經(jīng)被人殺死了,于是他們便隨便拿了點(diǎn)東西就走了。這樣的解釋不能讓人信服,再說,誰都知道在判刑方面殺人要比盜竊嚴(yán)重得多。警察決定將兩人隔離審訊。
隔離審訊的時(shí)候,警察告訴杰克:“盡管你們不承認(rèn),但是我知道人就是你們兩個(gè)殺的,事情早晚會(huì)水落石出的。現(xiàn)在我給你一個(gè)坦白的機(jī)會(huì),如果你坦白了,亞當(dāng)拒不承認(rèn),那你就是主動(dòng)自首,同時(shí)協(xié)助警方破案,你將被立即釋放,亞當(dāng)則要坐10年牢;如果你們都坦白了,每人坐8年牢;都不坦白的話,可能以入室盜竊罪判你們每人1年,如何選擇你自己想一想吧?!蓖瑯拥脑挘煲舱f給了亞當(dāng)。
一般人可能認(rèn)為杰克和亞當(dāng)都會(huì)選擇不坦白,這樣他們只能以入室盜竊的罪名被判刑,每人只需坐1年牢。這對(duì)于兩人來說是最好的一種結(jié)局??山Y(jié)果會(huì)是這樣的嗎?答案是否定的,兩人都選擇了招供,結(jié)果各被判了8年。
事情為什么會(huì)這樣呢?杰克和亞當(dāng)為什么會(huì)做出這樣“不理智”的選擇呢?其實(shí)這種結(jié)果正是兩人的理智造成的。
當(dāng)警察把坦白與否的后果告訴杰克的時(shí)候,杰克心中就會(huì)開始盤算坦白對(duì)自己有利,還是不坦白對(duì)自己有利。杰克會(huì)想,如果選擇坦白,要么當(dāng)即釋放,要么同亞當(dāng)一起坐8年牢;要是選擇不坦白,雖然可能只坐1年牢,但也可能坐10年牢。雖然(1,1)對(duì)兩人而言是最好的一種結(jié)局,但是由于是被分開審訊,信息不通,所以誰也沒法保證對(duì)方是否會(huì)選擇坦白。選擇坦白的結(jié)局是8年或者0年,選擇不坦白的結(jié)局是10年或者1年,在不知道對(duì)方選擇的情況下,選擇坦白對(duì)自己來說是一種優(yōu)勢(shì)策略。于是,杰克會(huì)選擇坦白。同時(shí),亞當(dāng)也會(huì)這樣想。最終的結(jié)局便是兩個(gè)人都選擇坦白,每人都要坐8年牢。
上面這個(gè)案例就是著名的“囚徒困境”模式,是博弈論中最出名的一個(gè)模式。可以看出,兩人都選擇了對(duì)自己最有利的選項(xiàng),可是雙雙都得到了差的結(jié)果。
雖然這是個(gè)二者博弈的例子,但是“納什平衡”提到了N方博弈均衡的概念。這讓我聯(lián)想到了些什么。
前段時(shí)間劉瑜《我的孩子正勢(shì)不可擋地成長為一個(gè)普通人》引發(fā)爭議,在集體教育軍備競賽中,每個(gè)家長的個(gè)人選擇和大環(huán)境下其他人的選擇也是一種N方博弈。家長的選擇跟老師,學(xué)校,補(bǔ)習(xí)機(jī)構(gòu)也是N方博弈。這種動(dòng)態(tài)的N方博弈如同“納什均衡”一樣,必須在各自利益都穩(wěn)定而不能更改的時(shí)候達(dá)到均衡穩(wěn)定,不然就是無休止的N層博弈,沒有贏家。
很多家長估計(jì)還來不及老鷹保護(hù)小雞,就妥協(xié)給了學(xué)校或者是培訓(xùn)機(jī)構(gòu)?,F(xiàn)實(shí)就是目前的這種教育現(xiàn)狀就是“負(fù)和博弈”。
雖然博弈論在經(jīng)濟(jì)學(xué)領(lǐng)域廣泛運(yùn)用,但細(xì)心留意的話,就會(huì)發(fā)現(xiàn)其實(shí)我們周圍無處不在。了解一些博弈論的原理,幫助我們做好日常決策。