作者:HaigLee
地址:http://www.itdecent.cn/u/67ec21fb270d
本文由 @HaigLee 發(fā)布。未經(jīng)許可,禁止轉(zhuǎn)載
1.什么是博弈論?
- 博弈論,又叫對策論,是研究兩人或多人之間競爭合作關(guān)系的一門學(xué)科。
- 博弈論是指某個(gè)人或是組織,在一定的環(huán)境條件和規(guī)則約束下,依靠所掌握的信息選擇并實(shí)施各自所傾向的行為或是策略,從中取得相應(yīng)結(jié)果或收益的過程。
2.博弈的三要素
任何一局博弈都至少包含以下三個(gè)基本要素:
2.1.決策主體
???????決策主體,又譯為參與者、局中人或博弈者。在一場競賽或一局博弈中,每一個(gè)有決策權(quán)的參與者都構(gòu)成一個(gè)決策主體。
???????決策主體的目的是通過選擇行動(dòng)方案或者戰(zhàn)略以使自己的效用水平最大化。只有兩個(gè)決策主體的博弈稱為兩人博弈,多于兩個(gè)決策主體的博弈稱為多人博弈。一局博弈中的決策主體可以是自然人,也可以是團(tuán)體:如企業(yè)、國家等。
2.2. 策略
???????策略,又譯為戰(zhàn)略,即決策主體在給定信息的情況下的行動(dòng)規(guī)則,它規(guī)定了決策主體在什么時(shí)候采取什么行動(dòng)。
???????一局博弈中,每個(gè)決策主體都會(huì)選擇實(shí)際可行的、完整的行動(dòng)方案。一個(gè)可行的自始至終對全局進(jìn)行籌劃的行動(dòng)方案,稱為這個(gè)決策主體的一個(gè)策略。如果在一局博弈中決策主體的策略是有限的,就稱為有限博弈,相反則稱為無限博弈。
2.3.效用
???????效用,又叫支付,是指在一個(gè)特定的策略組合下,決策主體得到的確定效用水平,或者說是期望效用水平。簡單來說,效用就是指進(jìn)行博弈后的收益。
???????效用是所有決策主體真正關(guān)心的東西,每個(gè)決策主體在一局博弈結(jié)束時(shí)得到的效用,不僅與該決策主體自身所選擇的策略有關(guān),而且與全部決策主體所制定的一組策略有關(guān)。一局博弈結(jié)束時(shí)每個(gè)決策主體得到的效用是全體決策主體所取定的一組策略的函數(shù),通常稱為支付函數(shù)。
3. 博弈的分類
???????博弈可以從多個(gè)角度進(jìn)行分類。
3.1. 按照博弈各方是否同時(shí)決策,博弈可以分為靜態(tài)博弈和動(dòng)態(tài)博弈。
3.1.1.靜態(tài)博弈
???????靜態(tài)博弈是指在博弈過程中,參與者同時(shí)決策或同時(shí)行動(dòng),或者盡管決策或行動(dòng)有先后順序,但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體的決策或行動(dòng)。
3.1.2. 動(dòng)態(tài)博弈
???????動(dòng)態(tài)博弈是指在博弈過程中,參與者的行動(dòng)有先后順序,并且后行動(dòng)者可以觀察到先行動(dòng)者所采取的行動(dòng)。
3.2. 按照參與者對其他參與者的了解程度,博弈可以分為完全信息博弈和不完全信息博弈。
3.2.1. 完全信息博弈
???????完全信息博弈是指在博弈過程中,每一位參與者對其他參與者的策略空間、策略組合及收益信息有完全的了解。
3.2.2. 不完全信息博弈
???????如果參與者對其他參與者的策略空間、策略組合及收益信息了解得不夠確切,或者說并沒有掌握所有參與者的策略空間、策略組合及收益信息,在此種情況下進(jìn)行的博弈就是不完全信息博弈。此時(shí),參與者所能做的就是努力使自己的期望支付或期望效用最大化。
3.3. 按照參與者能否達(dá)成約束性的協(xié)議以便集體行動(dòng),博弈可以分為合作博弈和非合作博弈。
3.3.1. 合作博弈
???????合作博弈是指所有參與者都從利己的角度出發(fā),與其他參與者進(jìn)行談判并達(dá)成具有約束力的協(xié)議或形成聯(lián)盟,參與者在協(xié)議范圍內(nèi)進(jìn)行博弈,其結(jié)果對聯(lián)盟各方均有利。合作博弈主要研究人們達(dá)成協(xié)議時(shí),如何分配合作得到的收益,即收益分配問題。
合作博弈強(qiáng)調(diào)團(tuán)體的理性、效率、公平和公正。典型的合作博弈是某一行業(yè)的寡頭企業(yè)之間的串謀行為,即企業(yè)之間通過公開或者私下簽訂協(xié)議,對各自的價(jià)格或產(chǎn)量進(jìn)行限制,以達(dá)到獲取更多壟斷利潤的目的。
3.3.2. 非合作博弈
???????反之,不能使其他參與者遵守某一協(xié)議,各參與者只能選擇自己的最優(yōu)戰(zhàn)略的行為,則屬于非合作博弈。非合作博弈主要研究人們在利益相互影響的局勢中如何選擇、決策,使自己的收益最大,即策略選擇問題。
???????非合作博弈強(qiáng)調(diào)個(gè)人理性、個(gè)人最優(yōu)決策。下面將要講到的囚徒困境就是典型的非合作博弈。因?yàn)榉呛献魇钱?dāng)今社會(huì)中利益博弈的常態(tài),所以非合作博弈是博弈論探討的主要內(nèi)容。
???????非合作博弈按照參與者對其他參與者的信息掌握程度和博弈各方采取行動(dòng)是否有先后順序,可以分為四種不同的類型,即完全信息靜態(tài)博弈、完全信息動(dòng)態(tài)博弈、不完全信息靜態(tài)博弈、不完全信息動(dòng)態(tài)博弈。這四類博弈一個(gè)比一個(gè)精彩,也一個(gè)比一個(gè)難。
3.3.3. 完全信息靜態(tài)博弈
???????完全信息靜態(tài)博弈——是指在博弈過程中,所有參與者事先達(dá)成一項(xiàng)具有約束力的協(xié)議,制定每個(gè)決策主體的行為規(guī)則。如果在沒有外在強(qiáng)制性約束的情況下,各參與者自覺遵守該協(xié)議,沒有人違反協(xié)議規(guī)則,就構(gòu)成一個(gè)納什均衡(概念見第二章)。只要有一個(gè)參與者違背協(xié)議規(guī)定,則此協(xié)議就構(gòu)不成納什均衡,就不可能自動(dòng)實(shí)施,不滿足納什均衡要求的協(xié)議是沒有任何意義的。
3.3.4. 完全信息動(dòng)態(tài)博弈
???????完全信息動(dòng)態(tài)博弈——?jiǎng)討B(tài)是世間萬物的基本特征,而靜態(tài)只是一種獨(dú)特的理想狀態(tài)。在現(xiàn)實(shí)生活中,當(dāng)一個(gè)參與者后采取行動(dòng)時(shí),自然會(huì)根據(jù)先前參與者的選擇而適時(shí)調(diào)整自己的決策,而先采取行動(dòng)的參與者也會(huì)理性地預(yù)料到這一點(diǎn),所以也會(huì)考慮自己的選擇對其他后行動(dòng)參與者的影響。
???????不完全信息靜態(tài)博弈——是指參與者同時(shí)采取決策或者說決策雖然有先后順序,但后行動(dòng)者并不知道先行動(dòng)者的決策,也沒有機(jī)會(huì)觀察先行動(dòng)者的選擇以調(diào)整自己的決策。
3.3.5. 不完全信息動(dòng)態(tài)博弈
???????不完全信息動(dòng)態(tài)博弈——是指各個(gè)參與者采取的決策有先后順序,且后行動(dòng)者掌握了前者的選擇,獲得了其偏好、策略空間及策略組合等信息,并依此修正自己的決策;而先行動(dòng)的參與者也知道自己行為的效用對后行動(dòng)者的影響,也會(huì)有意識(shí)地選擇某種行動(dòng)來掩蓋自己決策的真實(shí)目的。
3.3.6. 總結(jié)
???????博弈論是一門現(xiàn)實(shí)中非常有趣、理論上又頗有深度的學(xué)問??梢院敛豢鋸埖卣f,掌握博弈論知識(shí)對每一個(gè)現(xiàn)代人來說實(shí)在是太重要了。因?yàn)樵诂F(xiàn)實(shí)社會(huì)中,每個(gè)人都在試圖使自己的利益最大化,而在取得利益的過程中,往往會(huì)產(chǎn)生矛盾與沖突。利益均衡的實(shí)現(xiàn)主要取決于各自的策略選擇,而策略選擇問題實(shí)際上就是博弈論的本質(zhì)所在。
作者:HaigLee
地址:http://www.itdecent.cn/u/67ec21fb270d
本文由 @HaigLee 發(fā)布。未經(jīng)許可,禁止轉(zhuǎn)載