在一個(gè)小鎮(zhèn)上,警察隨機(jī)在A處或者B進(jìn)行巡邏,小偷在并不知道警察的選擇的情況下要去A處或B處偷竊,這便是警察和小偷之間的博弈。
在此博弈中,博弈者雙方的選擇都是隨機(jī)的,并且不一定存在最優(yōu)策略。
在我們此前介紹的最典型的囚徒博弈中,雖然同樣是不知道對(duì)方的決定,但對(duì)其中一方來(lái)說(shuō)是可以制定最優(yōu)策略——坦白,盡管在雙方的最優(yōu)策略下形成的是一個(gè)差的納什平衡。但在警察和小偷的博弈中,假設(shè)雙方去A、B處的幾率一樣,那么當(dāng)一方去A處,另一方去去A處則小偷被抓,去B處則小偷不會(huì)被抓,反之亦然。也就是不論對(duì)方的選擇為何,博弈者都有可能獲得好的結(jié)果和壞的結(jié)果。
因?yàn)椴┺恼咧g的利益是沖突的,所以不存在雙贏和雙輸?shù)木置?。為了使自身獲得高利益的可能性不被降低,博弈者應(yīng)該:
不要讓對(duì)方知道自己的決定。如果小偷知道警察在哪處巡邏便會(huì)避開(kāi)這個(gè)地方讓警察撲空,而警察如果事先知道小偷的目標(biāo)就可以提前布局、甕中捉鱉。所以一旦決定被對(duì)方知曉,博弈者就會(huì)處于不利地位。
在此重復(fù)性的博弈中,制定混合策略,隨機(jī)選擇,讓對(duì)方捉摸不透。重復(fù)性博弈的情境是大致一樣的,如果博弈者的決策有規(guī)律可循,對(duì)可根據(jù)以往的信息推斷其本次最有可能的策略,從而對(duì)此制定相應(yīng)的最優(yōu)策略以達(dá)到他的最大化利益。當(dāng)然,這也有可能只是一個(gè)陷阱。只有讓對(duì)方無(wú)法知曉或者錯(cuò)判我們的策略,使其做出錯(cuò)誤的決定,才能使我們更可能獲得利益。