囚徒困境1

關(guān)于囚徒困境的思考。博弈論是大學(xué)曾經(jīng)學(xué)過的學(xué)科,例如零和博弈,智豬博弈,囚徒困境等等。我們平時玩的游戲,大多數(shù)是零和博弈,我的勝利需要以對手的失敗為代價,你多拿一些我就少拿一些,因為總數(shù)的固定的。這種情況常見于同一行業(yè)內(nèi)的競爭,搶占市場占有率,吞并一個競爭對手,就少一個??蓪嶋H上這種情況還是少數(shù),囚徒困境在日常生活中更為常見。

囚徒困境的模型很簡單,有兩個對策者,他們都可以有兩個選擇,合作或背叛。每個人都在對方不知情的情況下做出選擇。不論對方選擇什么,選擇背叛總能比選擇合作有較高的收益。而所謂困境是指,如果雙方都選擇背叛,其結(jié)果比雙方合作要糟糕。簡單用錢來解釋收益,如果A選擇合作而B選擇背叛,那么B得5元,即背叛的誘惑為5元,A得0元,即給笨蛋的報酬;如果A選擇合作而B選擇合作,那雙方都得3元,即對雙方合作的獎勵;如果A和B都選擇背叛,那么雙方都得到1元,即對雙方背叛的懲罰。這個困境在于,假設(shè)對方選擇合作,那我背叛可以得5元而合作只能得3元;假設(shè)對方背叛,那我合作只能得0元,而背叛可以得1元。好像最聰明的做法就是選擇背叛。如果游戲只進(jìn)行一場,其實并沒有討論的必要,直接背叛就好了。

而當(dāng)游戲的次數(shù)逐漸增加,甚至引入極限的概念,把有限游戲(即零和博弈,以一方勝利一方失敗為結(jié)束)變?yōu)闊o限游戲(通過彼此探索和拓展游戲邊界而使游戲無限的進(jìn)行下去),那么就會產(chǎn)生游戲策略問題。

如果這場游戲的場次增多,始終選擇背叛肯定不是最佳的策略,因為雙方在背叛的情況下所得收益僅為都合作時候的三分之一。如果可以站在上帝視角,我們可以簡單推算最優(yōu)方案,即如果雙方始終合作進(jìn)行10場,那么雙方所得分別為30元。如果一方合作一方背叛,然后一方背叛一方合作,循環(huán)5個周期,那么10場游戲,每人得25元。也就是說當(dāng)【合作的獎勵>(背叛的誘惑+笨蛋的報酬)/2】,那么雙方選擇合作為最佳策略。而當(dāng)【合作的獎勵<(背叛的誘惑+笨蛋的報酬)/2】那么輪流背叛為最佳策略。實際上,游戲的雙方不可能擁有上帝視角,所以無法做出上述推斷。

事實上,我們在此基礎(chǔ)上再增加一些個體,即游戲不只是雙方進(jìn)行,而變?yōu)槎喾竭M(jìn)行,為了便于思考,仍然取極限把多方直接拓展為無數(shù)方。

到目前為止,這場博弈已經(jīng)可以與實際生活產(chǎn)生聯(lián)系了。實際上,我們每一個人作為一個個體,在我們漫長的一生中會遇到無數(shù)的人,也許這個數(shù)量根據(jù)我們生命的長度以及活動范圍的局限是有上限的,只不過上限比較大,思維上可以設(shè)想為無窮。

我們遇到的每一個人都可以當(dāng)做博弈的雙方,只不過這場游戲的目的不是勝過對方,因為在漫長的一生之中,勝過一個人對整個人生的發(fā)展起不到任何作用。我們站在這個角度上思考,如何制定策略才能實現(xiàn)我們?nèi)松淖畲笫找妫?/p>

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容