千呼萬喚始出來,終于要寫我心心念念的博弈論了。說到博弈論大家心里肯都有兩個(gè)問題,
1、博弈論是什么?
2、學(xué)習(xí)博弈論有什么用?
博弈論是多個(gè)個(gè)體或群體在特定條件制約下,利用相關(guān)方的策略,而實(shí)施自身對應(yīng)策略的學(xué)科。就好比下棋,敵我對弈,為獲得勝利,如何見招拆招。
那有什么用呢?生活中充滿著博弈,理解其中隱藏的規(guī)律,才能為我所用。通過對博弈論的學(xué)習(xí),我得到一個(gè)結(jié)論,在現(xiàn)實(shí)生活中 多次重復(fù)博弈的前提下,“一報(bào)還一報(bào)”是最優(yōu)策略!
善意為先,以直報(bào)怨,以德報(bào)德。

好了,寫到這我覺得自己已經(jīng)把博弈論中學(xué)到的對自己有用的結(jié)論寫來了,而且我將堅(jiān)定的按照這個(gè)規(guī)則執(zhí)行。
如果有興趣進(jìn)一步了解博弈論,例如 博弈論是怎么產(chǎn)生的?經(jīng)歷了哪些發(fā)展過程?現(xiàn)代的博弈論是什么?還有剛剛我說的“一報(bào)還一報(bào)”是如何被實(shí)驗(yàn)證實(shí)的?那就隨我繼續(xù)往下看。
博弈論的產(chǎn)生
(為什么要談博弈論的產(chǎn)生呢,所有的知識或理論,總有它開始的地方,如果想抓住其本質(zhì),就要從這里開始)
說到博弈論的產(chǎn)生不得不提一位大神,馮諾依曼,他可能是一個(gè)比愛因斯坦還要聰明的人!很小就精通多國語言,可以同聲傳譯,在數(shù)學(xué)、醫(yī)學(xué)、經(jīng)濟(jì)學(xué)、計(jì)算機(jī)科學(xué)等多門學(xué)科都有所建樹。他一生對很多領(lǐng)域都有強(qiáng)烈的探索的興趣。博弈論就產(chǎn)生于他的一個(gè)偶然的興趣,有一天他想打撲克有沒有穩(wěn)贏不輸?shù)姆椒??于是出了《博弈論與經(jīng)濟(jì)行為》一書,宣布了博弈論的誕生。
舉個(gè)簡單的栗子,梭哈(也就是比大?。?br> 游戲規(guī)則:2-5個(gè)人圍在一起比大小,支付賭本后,每人一張底牌,底牌在對決時(shí)才可翻開。從發(fā)第二張拍,每發(fā)一張牌,以牌面者為先,進(jìn)行下注。 有人下注,想繼續(xù)玩下去的人,選擇跟,跟注后會(huì)下注到和上家相同的籌碼,或可選擇加注,各家如果覺得自己的牌況不妙,不想繼續(xù),可以選擇放棄,認(rèn)賠等待牌局結(jié)束,先前跟過的籌碼,亦無法取回。
最后一輪下注是比賽的關(guān)鍵,在這一輪中,玩家可以進(jìn)行梭哈,所謂梭哈是押上所有未放棄的玩家所能夠跟的最大籌碼。等到下注的人都對下注進(jìn)行表態(tài)后,便掀開底牌一決勝負(fù)。這時(shí),牌面最大的人可贏得桌面所有的籌碼。
這個(gè)時(shí)候應(yīng)該怎么玩?手里拿到了大,中,小 牌時(shí)應(yīng)如何應(yīng)對?
1、拿到大牌時(shí),一定想辦法贏得更多,誘敵深入,加注;
2、拿到中牌時(shí), 直接翻牌,勝面不大的前提下,無論輸贏,降低風(fēng)險(xiǎn);
3、拿到小牌時(shí), 必須加注!為什么呢?從兩方面來看。一方面,不加注,必輸,加注可能贏;另一方面,要讓對方搞不清自我的套路,兵者詭道也,讓對方猜不出我是大牌加注還小牌加注。
這是博弈論在比大小中迎面比較大的策略。
至此我才知道,原來聲名赫赫的博弈論最初是從游戲中發(fā)展而來的,是在既定的規(guī)則下,雙方心理和智力的比拼。
博弈論中有意思的模型
囚徒困境
故事內(nèi)容是,兩個(gè)嫌疑犯(A和B)作案后被警察抓住,隔離審訊;警方的政策是“坦白從寬,抗拒從嚴(yán)”,如果兩人都坦白則各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白則因證據(jù)不足各判1年。
· 若對方沉默,坦白會(huì)讓我獲釋,所以會(huì)選擇坦白。
· 若對方坦白指控我,我也要指控對方才能得到較低的刑期,所以也是會(huì)選擇坦白。
這就是著名的囚徒困境,這個(gè)故事反映個(gè)人最佳選擇并非團(tuán)體最佳選擇。
知道囚徒困境有什么用呢?如何破解囚徒困境?
囚徒困境用數(shù)學(xué)語言描述就是兩個(gè)條件:
1、背叛誘惑>合作報(bào)酬。在這里,合作報(bào)酬是判刑1年,而背叛誘惑卻是立即釋放。
2、受騙支付>背叛懲罰。在這里,背叛懲罰是判刑8年,而受騙支付卻是判刑15年。
看到這里,破解之法就顯而易見了,我們只要讓“背叛誘惑<合作報(bào)酬,受騙支付<背叛懲罰”就可以了。
背叛誘惑<合作報(bào)酬。即你幫大哥頂罪,家里的妻兒老小大哥都會(huì)幫你照顧,而且等你出來還會(huì)給你一筆錢;
受騙支付<背叛懲罰。即如果你敢揭發(fā)大哥,小心你全家性命。
納什平衡
是指在一個(gè)博弈過程中,無論對方采用什么策略,我都會(huì)選擇某個(gè)確定的最優(yōu)策略,在這個(gè)博弈中誰單方改變策略,誰就會(huì)損失,納什平衡就是這種博弈的穩(wěn)定結(jié)果。
囚徒困境就是一個(gè)很好的例證,它是一個(gè)壞的納什均衡。
學(xué)習(xí)納什平衡有什么用呢?如何破解壞的納什平衡呢?
還是以囚徒困境為例,如果兩個(gè)嫌疑犯事先有約定,都不坦白,如果有人背叛,則外面的其他兄弟會(huì)懲罰他。
即用制度去制約壞的納什平衡,讓其向好的方向發(fā)展。生活中的商業(yè)戰(zhàn)爭也是一樣,要善用協(xié)議約束,避免壞的納什平衡,實(shí)現(xiàn)共同利益最大化。
智豬博弈
兩頭豬,一頭大豬,一頭小豬,在一個(gè)狹長的豬圈中,踏板和食槽在兩端,踩下踏板食槽供食,一只豬踩踏板另一只豬就能坐享其成先吃,而踩踏板需要消耗能量。
具體情況如下:
如果兩只豬同時(shí)踩踏板,同時(shí)跑向食槽,大豬吃進(jìn)7份,得益5份,小豬吃進(jìn)3份,實(shí)得1份;
如果大豬踩踏板后跑向食槽,這時(shí)小豬搶先,吃進(jìn)4份,實(shí)得4份,大豬吃進(jìn)6份,付出2份,得益4份;
如果大豬等待,小豬踩踏板,大豬先吃,吃進(jìn)9份,得益9份,小豬吃進(jìn)1份,但是付出了2份,實(shí)得-1份;
如果雙方都懶得動(dòng),所得都是0。
這里的納什平衡是:大豬踩踏板,小豬不動(dòng)。明顯是個(gè)小豬占優(yōu)的策略。
了解智豬博弈有什么用呢?這個(gè)故事給了我們什么啟示?
如果把大豬比作大企業(yè),小豬比作小企業(yè),小企業(yè)要懂得合理搭便車,實(shí)施“占優(yōu)策略”分得市場。大企業(yè)要懂得利用專利保護(hù)等制度設(shè)計(jì),制約小企業(yè)占便宜。
公地悲劇
什么是公地悲?。?br> 在公共草原上,每個(gè)理性的牧羊人都追求個(gè)人利益最大化。但多放牧?xí)韮蓚€(gè)結(jié)果,一是增加單只羊的收益,二是增加草原的負(fù)擔(dān),可能導(dǎo)致過度放牧。但因?yàn)椴菰枪驳?,每個(gè)牧羊人無法限制其他牧羊人的放牧,自己不放牧資源也會(huì)被其他人占用,每個(gè)人都追求個(gè)人利益最大化,導(dǎo)致過度放牧,草原退化,這就是公地悲劇。
了解公地悲劇有什么用?如何破解公地悲劇呢?
了解公地悲劇的根本原因是公共資源不占用就吃虧的感覺,每個(gè)人都想占便宜,這種撈一把的心態(tài)導(dǎo)致了公地悲劇。
用兩個(gè)方法去破解,一是公地私有化,就像小崗村,分田到戶。公地私有化后人們就失去了撈一把的心態(tài);另一個(gè)是強(qiáng)監(jiān)管,通過公共資源有償使用、許可證使用來管制,避免公地悲劇。
重復(fù)博弈
是指同樣結(jié)構(gòu)的博弈重復(fù)許多次,它可以是對稱信息的博弈,也可以是不對稱信息的博弈;
了解重復(fù)博弈有什么用?
理解了重復(fù)博弈,才不會(huì)在意一城一池的得失,用時(shí)間的維度的丈量成敗。誠信是一種與這個(gè)世界重復(fù)博弈的心態(tài)。
當(dāng)雙方是一錘子買賣時(shí),很可能宰你沒商量。但如果把一次博弈變成重復(fù)博弈,總體利益就能抵抗住短期誘惑,大家就會(huì)更講誠信。
不完全信息博弈
區(qū)別于囚徒困境、納什平衡、智豬博弈、公地悲劇這些完全信息博弈,現(xiàn)實(shí)生活中很多博弈是不清楚對手的信息和策略的,像這種不了解對象特征、規(guī)則、策略等信息的博弈稱為不完全信息博弈。
了解不完全信息博弈有什么用?
在我們了解對方特性、游戲規(guī)則和常用策略的情況下,我們會(huì)如何博弈,當(dāng)沒有這些信息,或者彼此不清楚對方是否知道這些信息的時(shí)候,如何博弈?
了解不完全信息博弈,可以通過制造信息不對稱,獲得策略優(yōu)勢,例如“空城計(jì)”。也可以通過特定方法,刺探對方軍情,打破信息不對稱,為我方爭取策略優(yōu)勢,如“木馬計(jì)”
維護(hù)和打破信息不對稱,是雙方的重要策略。
拍賣博弈
一架滿載飛機(jī),有幾位重要旅客急需搭乘,如何用最少的代價(jià),讓其他旅客讓出座位呢?
用拍賣博弈的策略,由低到高叫價(jià),先叫先得。由于旅客彼此不知愿意下飛機(jī)的代價(jià)是多少錢,害怕錯(cuò)失機(jī)會(huì),都會(huì)搶先同意舉手。于是這種策略付出的代價(jià)最小。
拍賣博弈有什么用?
善用這種“不完全信息博弈”,激發(fā)博弈者們“自相殘殺”,讓時(shí)間最不值錢的旅客下飛機(jī),獲得最高收益。
零和博弈
是指參與博弈的雙方在嚴(yán)格競爭的環(huán)境下,一方獲益必然導(dǎo)致另一方損失,獲益和損失之和永遠(yuǎn)為零。雙方不存在合作可能。
學(xué)習(xí)零和博弈有什么用?如何避免零和博弈?
零和博弈會(huì)導(dǎo)致你死我活的內(nèi)部競爭,但往博弈中加入增量,零和博弈就會(huì)變成正和博弈。先確定“存量分配規(guī)則”、“利益分配機(jī)制”,不容博弈發(fā)生,打開封閉系統(tǒng),注入新的元素,這樣創(chuàng)業(yè)公司才不會(huì)只盯著已經(jīng)賺得的錢如何分,而是在既定利益分配機(jī)制的前提下,想如何擴(kuò)大盤子賺更多的錢。
一報(bào)還一報(bào)
美國密西根大學(xué)教授羅伯特·阿克塞爾羅德做了一個(gè)博弈實(shí)驗(yàn),他寫信給不同背景的學(xué)者,請他們把應(yīng)對“囚徒困境”的策略寫成程序,讓這些程序捉對廝殺,經(jīng)過十幾萬次的重復(fù)博弈,最終“一報(bào)還一報(bào)”的策略獲得了勝利。
這個(gè)實(shí)驗(yàn)讓我更加堅(jiān)定,在生活中要秉持善行,用懲罰回報(bào)惡行,用善行回報(bào)善行;
在沒有被欺騙之前永遠(yuǎn)不要主動(dòng)欺騙他人。如果對手選擇背叛,立刻反擊。如果對手補(bǔ)償,不計(jì)前嫌繼續(xù)合作。這樣的清晰規(guī)則會(huì)激發(fā)對手的合作動(dòng)機(jī)。是長期博弈最有利的策略。
寫在最后,最近寫作的過程中我的觀念又發(fā)生了些變化,是受我的 parter 黃sir 的影響(哈哈,我自己偷偷給她取的外號)。我一直喜歡寫大而全的東西,但這種東西真的不好寫,容易鋪的太廣而寫不透,而且很燒腦。
她是每天堅(jiān)持寫作,而且最近看她的文章寫的越來越好,我們都訂閱了老師的專欄,而我可能聽聽就過了,她會(huì)聽完記下來,而且結(jié)合到自己生活中的小事,寫出感想。這點(diǎn)觸動(dòng)了我。所以我想試試,從一個(gè)個(gè)小靈感小啟發(fā)開始寫,積累一個(gè)個(gè)小故事,一次只說清楚一件事。