K7 D2/15《博弈論》警察與小偷的博弈

在一個(gè)小鎮(zhèn)上,警察隨機(jī)在A處或者B進(jìn)行巡邏,小偷在并不知道警察的選擇的情況下要去A處或B處偷竊,這便是警察和小偷之間的博弈。

在此博弈中,博弈者雙方的選擇都是隨機(jī)的,并且不一定存在最優(yōu)策略。

在我們此前介紹的最典型的囚徒博弈中,雖然同樣是不知道對(duì)方的決定,但對(duì)其中一方來(lái)說(shuō)是可以制定最優(yōu)策略——坦白,盡管在雙方的最優(yōu)策略下形成的是一個(gè)差的納什平衡。但在警察和小偷的博弈中,假設(shè)雙方去A、B處的幾率一樣,那么當(dāng)一方去A處,另一方去去A處則小偷被抓,去B處則小偷不會(huì)被抓,反之亦然。也就是不論對(duì)方的選擇為何,博弈者都有可能獲得好的結(jié)果和壞的結(jié)果。

因?yàn)椴┺恼咧g的利益是沖突的,所以不存在雙贏和雙輸?shù)木置?。為了使自身獲得高利益的可能性不被降低,博弈者應(yīng)該:

不要讓對(duì)方知道自己的決定。如果小偷知道警察在哪處巡邏便會(huì)避開(kāi)這個(gè)地方讓警察撲空,而警察如果事先知道小偷的目標(biāo)就可以提前布局、甕中捉鱉。所以一旦決定被對(duì)方知曉,博弈者就會(huì)處于不利地位。

在此重復(fù)性的博弈中,制定混合策略,隨機(jī)選擇,讓對(duì)方捉摸不透。重復(fù)性博弈的情境是大致一樣的,如果博弈者的決策有規(guī)律可循,對(duì)可根據(jù)以往的信息推斷其本次最有可能的策略,從而對(duì)此制定相應(yīng)的最優(yōu)策略以達(dá)到他的最大化利益。當(dāng)然,這也有可能只是一個(gè)陷阱。只有讓對(duì)方無(wú)法知曉或者錯(cuò)判我們的策略,使其做出錯(cuò)誤的決定,才能使我們更可能獲得利益。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 大家早安、午安、晚安,今天我先從機(jī)器學(xué)習(xí)的學(xué)習(xí)中休息一下,來(lái)了解一些常見(jiàn)的博弈論模型,然后繼續(xù)學(xué)習(xí)機(jī)器學(xué)習(xí)等。以下...
    keepStriving閱讀 47,704評(píng)論 3 72
  • 這篇比較難寫(xiě)。因?yàn)槲覍?shí)在是不知道這個(gè)漫畫(huà)除了肉還有什么可寫(xiě)的。拋開(kāi)各種福利鏡頭的安排,這個(gè)就是個(gè)平凡的不能再平凡的...
    伊蒂雅閱讀 1,425評(píng)論 0 3

友情鏈接更多精彩內(nèi)容