博弈論

千呼萬喚始出來,終于要寫我心心念念的博弈論了。說到博弈論大家心里肯都有兩個(gè)問題,

1、博弈論是什么?
2、學(xué)習(xí)博弈論有什么用?
博弈論是多個(gè)個(gè)體或群體在特定條件制約下,利用相關(guān)方的策略,而實(shí)施自身對應(yīng)策略的學(xué)科。就好比下棋,敵我對弈,為獲得勝利,如何見招拆招。
那有什么用呢?生活中充滿著博弈,理解其中隱藏的規(guī)律,才能為我所用。通過對博弈論的學(xué)習(xí),我得到一個(gè)結(jié)論,在現(xiàn)實(shí)生活中 多次重復(fù)博弈的前提下,“一報(bào)還一報(bào)”是最優(yōu)策略!
善意為先,以直報(bào)怨,以德報(bào)德。

640.webp.jpg

好了,寫到這我覺得自己已經(jīng)把博弈論中學(xué)到的對自己有用的結(jié)論寫來了,而且我將堅(jiān)定的按照這個(gè)規(guī)則執(zhí)行。

如果有興趣進(jìn)一步了解博弈論,例如 博弈論是怎么產(chǎn)生的?經(jīng)歷了哪些發(fā)展過程?現(xiàn)代的博弈論是什么?還有剛剛我說的“一報(bào)還一報(bào)”是如何被實(shí)驗(yàn)證實(shí)的?那就隨我繼續(xù)往下看。

博弈論的產(chǎn)生

(為什么要談博弈論的產(chǎn)生呢,所有的知識或理論,總有它開始的地方,如果想抓住其本質(zhì),就要從這里開始)

說到博弈論的產(chǎn)生不得不提一位大神,馮諾依曼,他可能是一個(gè)比愛因斯坦還要聰明的人!很小就精通多國語言,可以同聲傳譯,在數(shù)學(xué)、醫(yī)學(xué)、經(jīng)濟(jì)學(xué)、計(jì)算機(jī)科學(xué)等多門學(xué)科都有所建樹。他一生對很多領(lǐng)域都有強(qiáng)烈的探索的興趣。博弈論就產(chǎn)生于他的一個(gè)偶然的興趣,有一天他想打撲克有沒有穩(wěn)贏不輸?shù)姆椒??于是出了《博弈論與經(jīng)濟(jì)行為》一書,宣布了博弈論的誕生。

舉個(gè)簡單的栗子,梭哈(也就是比大?。?br> 游戲規(guī)則:2-5個(gè)人圍在一起比大小,支付賭本后,每人一張底牌,底牌在對決時(shí)才可翻開。從發(fā)第二張拍,每發(fā)一張牌,以牌面者為先,進(jìn)行下注。 有人下注,想繼續(xù)玩下去的人,選擇跟,跟注后會(huì)下注到和上家相同的籌碼,或可選擇加注,各家如果覺得自己的牌況不妙,不想繼續(xù),可以選擇放棄,認(rèn)賠等待牌局結(jié)束,先前跟過的籌碼,亦無法取回。

最后一輪下注是比賽的關(guān)鍵,在這一輪中,玩家可以進(jìn)行梭哈,所謂梭哈是押上所有未放棄的玩家所能夠跟的最大籌碼。等到下注的人都對下注進(jìn)行表態(tài)后,便掀開底牌一決勝負(fù)。這時(shí),牌面最大的人可贏得桌面所有的籌碼。

這個(gè)時(shí)候應(yīng)該怎么玩?手里拿到了大,中,小 牌時(shí)應(yīng)如何應(yīng)對?
1、拿到大牌時(shí),一定想辦法贏得更多,誘敵深入,加注;
2、拿到中牌時(shí), 直接翻牌,勝面不大的前提下,無論輸贏,降低風(fēng)險(xiǎn);
3、拿到小牌時(shí), 必須加注!為什么呢?從兩方面來看。一方面,不加注,必輸,加注可能贏;另一方面,要讓對方搞不清自我的套路,兵者詭道也,讓對方猜不出我是大牌加注還小牌加注。
這是博弈論在比大小中迎面比較大的策略。

至此我才知道,原來聲名赫赫的博弈論最初是從游戲中發(fā)展而來的,是在既定的規(guī)則下,雙方心理和智力的比拼。

博弈論中有意思的模型

囚徒困境

故事內(nèi)容是,兩個(gè)嫌疑犯(A和B)作案后被警察抓住,隔離審訊;警方的政策是“坦白從寬,抗拒從嚴(yán)”,如果兩人都坦白則各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白則因證據(jù)不足各判1年。

· 若對方沉默,坦白會(huì)讓我獲釋,所以會(huì)選擇坦白。
· 若對方坦白指控我,我也要指控對方才能得到較低的刑期,所以也是會(huì)選擇坦白。

這就是著名的囚徒困境,這個(gè)故事反映個(gè)人最佳選擇并非團(tuán)體最佳選擇。

知道囚徒困境有什么用呢?如何破解囚徒困境?
囚徒困境用數(shù)學(xué)語言描述就是兩個(gè)條件:
1、背叛誘惑>合作報(bào)酬。在這里,合作報(bào)酬是判刑1年,而背叛誘惑卻是立即釋放。
2、受騙支付>背叛懲罰。在這里,背叛懲罰是判刑8年,而受騙支付卻是判刑15年。

看到這里,破解之法就顯而易見了,我們只要讓“背叛誘惑<合作報(bào)酬,受騙支付<背叛懲罰”就可以了。

背叛誘惑<合作報(bào)酬。即你幫大哥頂罪,家里的妻兒老小大哥都會(huì)幫你照顧,而且等你出來還會(huì)給你一筆錢;
受騙支付<背叛懲罰。即如果你敢揭發(fā)大哥,小心你全家性命。
納什平衡

是指在一個(gè)博弈過程中,無論對方采用什么策略,我都會(huì)選擇某個(gè)確定的最優(yōu)策略,在這個(gè)博弈中誰單方改變策略,誰就會(huì)損失,納什平衡就是這種博弈的穩(wěn)定結(jié)果。

囚徒困境就是一個(gè)很好的例證,它是一個(gè)壞的納什均衡。

學(xué)習(xí)納什平衡有什么用呢?如何破解壞的納什平衡呢?

還是以囚徒困境為例,如果兩個(gè)嫌疑犯事先有約定,都不坦白,如果有人背叛,則外面的其他兄弟會(huì)懲罰他。
即用制度去制約壞的納什平衡,讓其向好的方向發(fā)展。生活中的商業(yè)戰(zhàn)爭也是一樣,要善用協(xié)議約束,避免壞的納什平衡,實(shí)現(xiàn)共同利益最大化。
智豬博弈

兩頭豬,一頭大豬,一頭小豬,在一個(gè)狹長的豬圈中,踏板和食槽在兩端,踩下踏板食槽供食,一只豬踩踏板另一只豬就能坐享其成先吃,而踩踏板需要消耗能量。

具體情況如下:
如果兩只豬同時(shí)踩踏板,同時(shí)跑向食槽,大豬吃進(jìn)7份,得益5份,小豬吃進(jìn)3份,實(shí)得1份;
如果大豬踩踏板后跑向食槽,這時(shí)小豬搶先,吃進(jìn)4份,實(shí)得4份,大豬吃進(jìn)6份,付出2份,得益4份;
如果大豬等待,小豬踩踏板,大豬先吃,吃進(jìn)9份,得益9份,小豬吃進(jìn)1份,但是付出了2份,實(shí)得-1份;
如果雙方都懶得動(dòng),所得都是0。

這里的納什平衡是:大豬踩踏板,小豬不動(dòng)。明顯是個(gè)小豬占優(yōu)的策略。

了解智豬博弈有什么用呢?這個(gè)故事給了我們什么啟示?

如果把大豬比作大企業(yè),小豬比作小企業(yè),小企業(yè)要懂得合理搭便車,實(shí)施“占優(yōu)策略”分得市場。大企業(yè)要懂得利用專利保護(hù)等制度設(shè)計(jì),制約小企業(yè)占便宜。
公地悲劇

什么是公地悲?。?br> 在公共草原上,每個(gè)理性的牧羊人都追求個(gè)人利益最大化。但多放牧?xí)韮蓚€(gè)結(jié)果,一是增加單只羊的收益,二是增加草原的負(fù)擔(dān),可能導(dǎo)致過度放牧。但因?yàn)椴菰枪驳?,每個(gè)牧羊人無法限制其他牧羊人的放牧,自己不放牧資源也會(huì)被其他人占用,每個(gè)人都追求個(gè)人利益最大化,導(dǎo)致過度放牧,草原退化,這就是公地悲劇。

了解公地悲劇有什么用?如何破解公地悲劇呢?

了解公地悲劇的根本原因是公共資源不占用就吃虧的感覺,每個(gè)人都想占便宜,這種撈一把的心態(tài)導(dǎo)致了公地悲劇。
用兩個(gè)方法去破解,一是公地私有化,就像小崗村,分田到戶。公地私有化后人們就失去了撈一把的心態(tài);另一個(gè)是強(qiáng)監(jiān)管,通過公共資源有償使用、許可證使用來管制,避免公地悲劇。
重復(fù)博弈

是指同樣結(jié)構(gòu)的博弈重復(fù)許多次,它可以是對稱信息的博弈,也可以是不對稱信息的博弈;

了解重復(fù)博弈有什么用?

理解了重復(fù)博弈,才不會(huì)在意一城一池的得失,用時(shí)間的維度的丈量成敗。誠信是一種與這個(gè)世界重復(fù)博弈的心態(tài)。
當(dāng)雙方是一錘子買賣時(shí),很可能宰你沒商量。但如果把一次博弈變成重復(fù)博弈,總體利益就能抵抗住短期誘惑,大家就會(huì)更講誠信。
不完全信息博弈

區(qū)別于囚徒困境、納什平衡、智豬博弈、公地悲劇這些完全信息博弈,現(xiàn)實(shí)生活中很多博弈是不清楚對手的信息和策略的,像這種不了解對象特征、規(guī)則、策略等信息的博弈稱為不完全信息博弈。

了解不完全信息博弈有什么用?

在我們了解對方特性、游戲規(guī)則和常用策略的情況下,我們會(huì)如何博弈,當(dāng)沒有這些信息,或者彼此不清楚對方是否知道這些信息的時(shí)候,如何博弈?

了解不完全信息博弈,可以通過制造信息不對稱,獲得策略優(yōu)勢,例如“空城計(jì)”。也可以通過特定方法,刺探對方軍情,打破信息不對稱,為我方爭取策略優(yōu)勢,如“木馬計(jì)”
維護(hù)和打破信息不對稱,是雙方的重要策略。
拍賣博弈

一架滿載飛機(jī),有幾位重要旅客急需搭乘,如何用最少的代價(jià),讓其他旅客讓出座位呢?
用拍賣博弈的策略,由低到高叫價(jià),先叫先得。由于旅客彼此不知愿意下飛機(jī)的代價(jià)是多少錢,害怕錯(cuò)失機(jī)會(huì),都會(huì)搶先同意舉手。于是這種策略付出的代價(jià)最小。

拍賣博弈有什么用?

善用這種“不完全信息博弈”,激發(fā)博弈者們“自相殘殺”,讓時(shí)間最不值錢的旅客下飛機(jī),獲得最高收益。
零和博弈

是指參與博弈的雙方在嚴(yán)格競爭的環(huán)境下,一方獲益必然導(dǎo)致另一方損失,獲益和損失之和永遠(yuǎn)為零。雙方不存在合作可能。

學(xué)習(xí)零和博弈有什么用?如何避免零和博弈?

零和博弈會(huì)導(dǎo)致你死我活的內(nèi)部競爭,但往博弈中加入增量,零和博弈就會(huì)變成正和博弈。先確定“存量分配規(guī)則”、“利益分配機(jī)制”,不容博弈發(fā)生,打開封閉系統(tǒng),注入新的元素,這樣創(chuàng)業(yè)公司才不會(huì)只盯著已經(jīng)賺得的錢如何分,而是在既定利益分配機(jī)制的前提下,想如何擴(kuò)大盤子賺更多的錢。
一報(bào)還一報(bào)

美國密西根大學(xué)教授羅伯特·阿克塞爾羅德做了一個(gè)博弈實(shí)驗(yàn),他寫信給不同背景的學(xué)者,請他們把應(yīng)對“囚徒困境”的策略寫成程序,讓這些程序捉對廝殺,經(jīng)過十幾萬次的重復(fù)博弈,最終“一報(bào)還一報(bào)”的策略獲得了勝利。

這個(gè)實(shí)驗(yàn)讓我更加堅(jiān)定,在生活中要秉持善行,用懲罰回報(bào)惡行,用善行回報(bào)善行;
在沒有被欺騙之前永遠(yuǎn)不要主動(dòng)欺騙他人。如果對手選擇背叛,立刻反擊。如果對手補(bǔ)償,不計(jì)前嫌繼續(xù)合作。這樣的清晰規(guī)則會(huì)激發(fā)對手的合作動(dòng)機(jī)。是長期博弈最有利的策略。

寫在最后,最近寫作的過程中我的觀念又發(fā)生了些變化,是受我的 parter 黃sir 的影響(哈哈,我自己偷偷給她取的外號)。我一直喜歡寫大而全的東西,但這種東西真的不好寫,容易鋪的太廣而寫不透,而且很燒腦。

她是每天堅(jiān)持寫作,而且最近看她的文章寫的越來越好,我們都訂閱了老師的專欄,而我可能聽聽就過了,她會(huì)聽完記下來,而且結(jié)合到自己生活中的小事,寫出感想。這點(diǎn)觸動(dòng)了我。所以我想試試,從一個(gè)個(gè)小靈感小啟發(fā)開始寫,積累一個(gè)個(gè)小故事,一次只說清楚一件事。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 大家早安、午安、晚安,今天我先從機(jī)器學(xué)習(xí)的學(xué)習(xí)中休息一下,來了解一些常見的博弈論模型,然后繼續(xù)學(xué)習(xí)機(jī)器學(xué)習(xí)等。以下...
    keepStriving閱讀 47,640評論 3 72
  • 博弈論是二人或多人在平等的對局中,各自利用對方的策略變換自己的對抗策略,達(dá)到取勝的目的。有以下幾個(gè)模型: 囚徒困境...
    微芳閱讀 1,815評論 0 4
  • 文/土豆書生 晨陽起了 我在地平線等你 夕陽墜了 我在月影里等你 秋葉落了 我在滿地的金黃里 想象你...
    牧馬天山閱讀 287評論 0 1
  • 孩子別怕,這世界還有愛 文 / 涼爽 “志愿者官網(wǎng)”微信公眾號發(fā)布了一篇文章,《又現(xiàn)虐童視頻,跪求轉(zhuǎn)發(fā)找到受虐女孩...
    楊靖心理閱讀 601評論 0 0
  • 雨,自清晨始就未停歇。時(shí)大時(shí)小,忽急忽緩。 銀川的初夏仍然躑躅在暮春的節(jié)奏里,陰雨綿綿中依舊延續(xù)著春寒料峭的感覺。...
    介山散人閱讀 287評論 0 0

友情鏈接更多精彩內(nèi)容