囚徒困境里講到一個(gè)很經(jīng)典的案例,兩個(gè)嫌疑犯作案后被警察抓住,分別關(guān)在不同的屋子里接受審訊。警察知道兩人有罪,但缺乏足夠的證據(jù)。警察告訴每個(gè)人:如果兩人都抵賴(lài),各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個(gè)坦白而另一個(gè)抵賴(lài),坦白的放出去,抵賴(lài)的判十年。于是,每個(gè)囚徒都面臨兩種選擇:坦白或抵賴(lài)。然而,不管同伙選擇什么,每個(gè)囚徒的最優(yōu)選擇是坦白:如果同伙抵賴(lài)、自己坦白的話(huà)放出去,不坦白的話(huà)判一年,坦白比不坦白好;如果同伙坦白、自己坦白的話(huà)判八年,不坦白的話(huà)判十年,坦白還是比不坦白好。結(jié)果,兩個(gè)嫌疑犯都選擇坦白,各判刑八年。如果兩人都抵賴(lài),各判一年,顯然這個(gè)結(jié)果好。但這個(gè)現(xiàn)實(shí)生活中很難做到,因?yàn)樗荒軡M(mǎn)足人類(lèi)的理性要求。
大家都想達(dá)到共贏的局面,但是后來(lái)還是選擇了“損人不利己”的策略,原因在于,萬(wàn)一我坦白了,他不坦白,我就會(huì)受到更大的損失。大家都不相信對(duì)方,最終都被判了八年。人類(lèi)的個(gè)人理性有時(shí)能導(dǎo)致集體的非理性——聰明的人類(lèi)會(huì)因自己的聰明而作繭自縛。
在生意的戰(zhàn)場(chǎng)上也是一樣,比如Mobike和OFO,如果他們都不減價(jià)騎行或者免費(fèi)騎行的話(huà),對(duì)他們來(lái)說(shuō)大家收益最大??墒谴蠹叶紴榱苏碱I(lǐng)市場(chǎng),成為這個(gè)領(lǐng)域的寡頭,然后就開(kāi)始打價(jià)格戰(zhàn),各種免費(fèi)加補(bǔ)貼。到最后大家都覺(jué)得不能再這么燒錢(qián)了,于是大家一起找一個(gè)和事佬,一起坐下來(lái)談?wù)劊炓粋€(gè)協(xié)議,大家都不能太大的補(bǔ)貼等細(xì)則,如果誰(shuí)違反了,就給對(duì)方一筆賠償金。這個(gè)時(shí)候有了約束,最終選擇好的“納什均衡”。攜程和同程,大眾點(diǎn)評(píng)和百度外賣(mài)等都是這么干的。
所謂納什均衡,指的是參與人的這樣一種策略組合,在該策略組合上,任何參與人單獨(dú)改變策略都不會(huì)得到好處。
在博弈論里的共贏需要建立一定的制度和協(xié)議,并且雙方都要放棄一部分的安全感,才能實(shí)現(xiàn)“共贏”。
