讓我們?cè)賮砜紤]另一個(gè)叫“愧疚探測器”(Renwrseful Prober)的策略。這個(gè)策略有點(diǎn)類似于“老實(shí)人探測器”,但它還加以主動(dòng)終止循環(huán)于雙方間的交互背叛。這便需要一種比“針鋒相對(duì)”或“老實(shí)人探測器”更長的記憶?!袄⒕翁綔y器”能記住自己是否剛剛主動(dòng)“背叛”,或者只是為了報(bào)復(fù)。如果是后者,它便“愧疚地”讓對(duì)手得到一次反擊的機(jī)會(huì),而不加以報(bào)復(fù)。這便將此循環(huán)報(bào)復(fù)行為終結(jié)在萌芽狀態(tài)。如果你在想象中旁觀“愧疚探測器”與“針鋒相對(duì)”的博弈,你會(huì)發(fā)現(xiàn)可能的循環(huán)報(bào)復(fù)行動(dòng)不攻自破。博弈中大部分時(shí)間都采取互相合作,使得雙方都能獲得相應(yīng)的高分。在與“針鋒相對(duì)”的博弈中,“愧疚探測器”能獲得比“老實(shí)人探測器”更高的分?jǐn)?shù),但依然沒有“針鋒相對(duì)”與自己對(duì)弈的分?jǐn)?shù)高。
阿克塞爾羅德的競賽里還有一些比“老實(shí)人探測器”與“愧疚探測器”更為復(fù)雜的策略,但它們平均分都比“針鋒相對(duì)”低。事實(shí)上最失敗的策略(除了隨機(jī))是最復(fù)雜的那一個(gè),作者為“匿名”。這個(gè)作者引發(fā)了一些饒有興趣的猜測:五角大樓的高層?中央情報(bào)局的首腦?國務(wù)卿基辛格?阿克塞爾羅德自己?我們也許永遠(yuǎn)也不會(huì)知道。
不是每個(gè)策略的細(xì)節(jié)都值得研究,這本書也不談?dòng)?jì)算機(jī)程序員的創(chuàng)造力。但我們可以給這些策略歸類,并檢驗(yàn)這些類別的成功率。阿克塞爾羅德認(rèn)為,最重要的類別是“善良”?!吧屏肌鳖悇e指的是那些從不率先背叛的策略?!搬樹h相對(duì)”便是其中一個(gè)例子。它雖然也采取“背叛”的行動(dòng),但它只在報(bào)復(fù)中這么做?!袄蠈?shí)人探測器”與“愧疚探測器”也偶爾采取“背叛”,但這種行為是主動(dòng)起意挑釁的,屬于惡意的策略。這場競賽中的15個(gè)策略中,有8個(gè)屬于“善良”策略。令人吃驚的是,策略中的前8名也是這8個(gè)善意的策略?!搬樹h相對(duì)”的平均分504.5分,是我們600分基準(zhǔn)分中的84%,一個(gè)很好的分?jǐn)?shù)。其他“善良”策略所得分?jǐn)?shù)要比“針鋒相對(duì)”少一些,從83.4%到78.6%不等。排名中接下來的分?jǐn)?shù)則是由格雷斯卡普(Graaskamp)所獲得的66.8%,與高分們有很大差距,而這已經(jīng)是所有惡意策略中的最高分了。令人信服的結(jié)果表明,好人在這個(gè)博弈中可以勝出。
阿克塞爾羅德的另一個(gè)術(shù)語則是“寬容”。一個(gè)寬容的策略只有短期記憶。雖然它也采取報(bào)復(fù)行為,但它會(huì)很快遺忘對(duì)手的劣跡?!搬樹h相對(duì)”便是一個(gè)寬容的策略,面對(duì)背叛時(shí)它毫不手軟,但之后則“過去的讓它過去”。第十章中的“斤斤計(jì)較者”則是一個(gè)完全相反的例子。它的記憶持續(xù)了整個(gè)博弈,永不寬恕曾經(jīng)背叛過它的對(duì)手。在阿克塞爾羅德的競賽中,有一個(gè)策略與“斤斤計(jì)較者”完全相同,由一位名叫弗里德曼(Friedman)的選手提供。這一個(gè)“善良”而絕不寬恕的策略結(jié)果并不算佳,成績?cè)谒小吧屏肌辈呗岳锱诺箶?shù)第二。即便對(duì)手已經(jīng)有悔改之意,它不愿意打破相互背叛的惡性循環(huán),因此無法取得很高的分?jǐn)?shù)。
“針鋒相對(duì)”并不是最寬容的策略。我們還可以設(shè)計(jì)一個(gè)“兩報(bào)還一報(bào)”(Tit for Two Tats)的策略,允許對(duì)手連續(xù)兩次背叛后才開始報(bào)復(fù),這似乎顯得過分大度坦蕩了。阿克塞爾羅德算出,只要在競賽中有“兩報(bào)還一報(bào)”策略的存在,它便一定會(huì)獲得冠軍,因?yàn)樗梢杂行П苊忾L期的互相傷害。
于是,我們算出了贏家策略的兩個(gè)特點(diǎn):善良與寬容。這幾乎是一個(gè)烏托邦式的結(jié)論:善良與寬容能得到好報(bào)。許多專家曾試圖在惡意策略里耍點(diǎn)兒花招,認(rèn)為這可能得到高分。即使那些提交“善良”策略的專家,也未曾敢如“針鋒相對(duì)”一般寬容。所有人都對(duì)這個(gè)結(jié)論十分驚訝。
阿克塞爾羅德又舉辦了第二次競賽。這次他收到了62個(gè)策略,再加上隨機(jī)策略,總共便有了63個(gè)策略。這一次,博弈中的回合數(shù)不再固定為200,而改為開放式的不定數(shù)(我之后會(huì)解釋這么做的理由)。我們依然將得分評(píng)判為基準(zhǔn)分“永遠(yuǎn)合作”分?jǐn)?shù)的百分比,不過現(xiàn)在基準(zhǔn)分需要更為復(fù)雜的計(jì)算,并不再是固定的600分。
第二次競賽的程序員們都得到了第一次競賽的結(jié)果,還收到了阿克塞爾羅德對(duì)“針鋒相對(duì)”與善良與寬容策略獲勝的分析。這么做是為了讓參賽者們能從某種方向上了解比賽的背景信息,來權(quán)衡自己的判斷。事實(shí)上,這些參賽者分成兩種思路。第一種參賽者認(rèn)為,已經(jīng)有足夠證據(jù)證明善良與寬容確實(shí)是獲勝因素,他們便隨即提交了善良與寬容的策略。一位參賽者約翰·梅納德·史密斯(John Maynard Smith)提交了一個(gè)最為寬容的“三報(bào)還一報(bào)”(Tit for Three Tats)的策略。另一組參賽者則認(rèn)為,既然對(duì)手們已經(jīng)讀過了阿克塞爾羅德的分析,估計(jì)都會(huì)提交善良寬容的策略。他們于是便提交了惡意的策略,以期在善意對(duì)手中占到便宜。
然而,惡意再一次沒有得到好報(bào)。阿納托爾提交的“針鋒相對(duì)”策略再一次成為贏家,獲得了滿分的96%。而善意策略又再一次贏了惡意策略。前15名中只有一個(gè)策略是惡意策略,而倒數(shù)15名中只有一個(gè)是善意策略。然而,最為寬容的、可以在第一次競賽中勝出的“兩報(bào)還一報(bào)”策略,這次卻沒有成功。這是因?yàn)楸敬胃傎愔杏辛艘恍└鼮榻苹膼阂獠呗?,它們善于偽裝自己,無情地拋棄那些善良的人們。這揭曉了這些競賽中非常重要的一點(diǎn):成功的策略取決于你的對(duì)手的策略。這是唯一能解釋兩次競賽中的不同結(jié)果的理由。然而,就像我之前說過的那樣。這本書并不是關(guān)于計(jì)算機(jī)程序員的創(chuàng)造力的,那么,是否有一個(gè)廣泛客觀的標(biāo)準(zhǔn)來讓我們判斷,哪些是真正好的策略?前幾章的讀者們估計(jì)已經(jīng)開始準(zhǔn)備從生物進(jìn)化穩(wěn)定策略理論中尋找答案了。
當(dāng)時(shí)的我也是阿克塞爾羅德傳播早期結(jié)果的小圈子中的一員,我也被邀請(qǐng)?jiān)诘诙胃傎愔刑峤徊呗?。我并沒有參賽,但我給阿克塞爾羅德提了一個(gè)建議。阿克塞爾羅德已經(jīng)開始考慮“進(jìn)化穩(wěn)定策略”(EES)這個(gè)理論了。但我覺得這個(gè)想法太重要了,于是寫信給他建議,讓他與漢密爾頓(W.D.Hamilton)聯(lián)系一下。雖然當(dāng)時(shí)阿克塞爾羅德并不認(rèn)識(shí)漢密爾頓,但漢密爾頓正與阿克塞爾羅德在同一所大學(xué)——密歇根大學(xué)的另一個(gè)系里。阿克塞爾羅德迅速聯(lián)系了漢密爾頓。最終,他們合作的結(jié)果是一篇卓越的論文,發(fā)表在1981年的《科學(xué)》雜志上,也獲得了美國科學(xué)促進(jìn)會(huì)(AAAS)的紐科姆·克里夫蘭獎(jiǎng)(Newcomb Cleveland Prize)。阿克塞爾羅德和漢密爾頓除了討論重復(fù)“囚徒困境”在生物學(xué)上有趣的例子外,我還覺得他們給予了進(jìn)化穩(wěn)定策略方法應(yīng)有的認(rèn)可。
讓我們來比較一下進(jìn)化穩(wěn)定策略與阿克塞爾羅德兩次競賽中的“循環(huán)賽”機(jī)制。循環(huán)賽好比足球聯(lián)盟中的比賽。每一個(gè)策略都與其他策略對(duì)戰(zhàn)同等次數(shù)。策略的最后得分則是它與所有其他策略對(duì)弈后的所得總分。如果一個(gè)策略想要在競爭中成功,它必須在所有提交的策略中都富有競爭力。阿克塞爾羅德給勝出其他對(duì)手的策略定義為“強(qiáng)勁”。“針鋒相對(duì)”便是一個(gè)強(qiáng)勁的策略。但參與競賽的策略對(duì)手們則相當(dāng)主觀,只取決于參賽者所提交的策略水平。這一點(diǎn)使我們相當(dāng)頭疼。阿克塞爾羅德的第一個(gè)競賽里,剛好參賽的策略基本都是善意策略,所以“針鋒相對(duì)”贏得了競賽,而如果“兩報(bào)還一報(bào)”參賽了,則會(huì)贏了“針鋒相對(duì)”。但如果幾乎所有參賽策略都為惡意策略,情況就不同了。這個(gè)假設(shè)發(fā)生的概率還是很大的,畢竟所提交的14個(gè)策略中有6個(gè)是惡意策略。假如13個(gè)策略全為惡意策略,“針鋒相對(duì)”則不可能成功,因?yàn)椤碍h(huán)境”太差了。提交策略的不同,決定了策略所贏得的金錢和它們的排名位置。也就是說,競賽結(jié)果將取決于參賽者的心血來潮。那么,我們?nèi)绾螠p少競賽的主觀性呢?答案是:進(jìn)化穩(wěn)定策略。
你也許還記得,進(jìn)化穩(wěn)定策略在眾多的種群策略中占有許多席位,也一直得到不錯(cuò)的結(jié)果。如果說“針鋒相對(duì)”是一種進(jìn)化穩(wěn)定策略,這便是說,“針鋒相對(duì)”策略在充滿“針鋒相對(duì)”策略的大環(huán)境下能得到不錯(cuò)的結(jié)果。這便是一種特殊的“強(qiáng)勁”。作為進(jìn)化論者,我們一直很想找到一種唯一的、可以直接決定結(jié)果的“強(qiáng)勁”。為什么這很重要呢?因?yàn)樵谶_(dá)爾文主義的世界里,成功并不是贏得金錢,而是獲得后裔。對(duì)于一個(gè)達(dá)爾文主義者,一個(gè)成功的策略將是一個(gè)在種群策略中數(shù)量眾多的策略。如果這個(gè)策略要保持成功,它必須在同類眾多時(shí)——也就是充滿了自身復(fù)制的大環(huán)境中得到特別好的結(jié)果。
阿克塞爾羅德又模仿自然選擇,進(jìn)行了第三場競賽來尋找進(jìn)化穩(wěn)定策略。事實(shí)上,他并沒有稱之為第三次競賽,因?yàn)樗]有邀請(qǐng)新的參賽者,而只是使用了第二次競賽中的63個(gè)策略。但我覺得稱它為第三次競賽比較合適,它和前兩次“循環(huán)賽”有根本性的不同。
阿克塞爾羅德將這63個(gè)策略再次丟給計(jì)算機(jī),來制造進(jìn)化演替的“第一代”。 “第一代”的大環(huán)境中由這63個(gè)策略組成。結(jié)束后,贏家不再得到“金錢”或者“分?jǐn)?shù)”,而是與其完全相同的“后代”。世世代代如此傳遞,一些策略逐漸變得數(shù)目稀少,甚至完全絕跡,另一些策略則數(shù)目眾多。當(dāng)環(huán)境中策略的比例變化,博弈中策略的出牌也在隨之變化。
最終在1 000代之后,種群不再變化,環(huán)境也沒有再改變,穩(wěn)定的狀態(tài)已經(jīng)形成。在此之前,各種策略的命運(yùn)起伏不定,正如我模擬的“騙子”、“傻瓜”和“斤斤計(jì)較者”的命運(yùn)一樣。一些策略在博弈開始便已經(jīng)滅絕,大多數(shù)則在200代之后徹底滅絕。在那些惡意策略中,有一兩個(gè)一開始蓬勃發(fā)展,但它們的繁榮正如我的模擬預(yù)測一樣,只是曇花一現(xiàn)。唯一活過200代的一個(gè)策略叫做“哈靈頓”(Harrington)。它的數(shù)目在前150代中直線上升,而后逐漸減少,在1 000代之后終于完全滅絕。“哈靈頓”短期繁榮的原因跟我的“騙子”是一樣的。當(dāng)那些如“兩報(bào)還一報(bào)”之類的老實(shí)人(過于寬容)還在世時(shí),它欺負(fù)它們以獲得發(fā)展。但當(dāng)這些老實(shí)人已經(jīng)消失之后,“哈靈頓”失去了獵物,也跟隨著它們的命運(yùn)而滅絕。剩下的策略都類似于“針鋒相對(duì)”,既善良又容易被煽動(dòng)報(bào)復(fù)。
“針鋒相對(duì)”本身在第三輪競賽中,6次中有5次得了第一,重復(fù)其在第一、二次競賽時(shí)的好運(yùn)。另外5個(gè)雖善良但容易報(bào)復(fù)的策略則幾乎和“針鋒相對(duì)”一樣成功(在種群數(shù)目上),還有一個(gè)策略甚至贏了第6次博弈。當(dāng)所有惡意策略都滅絕后,所有的善良策略與“針鋒相對(duì)”都無法辨認(rèn)彼此了,因?yàn)樗鼈兌己苌屏?,只是簡單與所有對(duì)手“合作”到底。
這種“無法辨認(rèn)”情況使得“針鋒相對(duì)”在嚴(yán)格意義上不是一個(gè)真正的進(jìn)化穩(wěn)定策略,即使它看起來確實(shí)很像。一個(gè)策略要成為進(jìn)化穩(wěn)定策略,當(dāng)它是常見策略時(shí),它不可被少數(shù)變異策略所同化。雖然“針鋒相對(duì)”不會(huì)被任何惡意策略同化,但另一個(gè)善良策略則可能做到。正如我們所看到的,在善意策略的群體里,它們面目模糊,行為相同,始終合作。因此,有一些其他善良策略,比如“永遠(yuǎn)合作”這種選擇優(yōu)勢不如“針鋒相對(duì)”的策略,也可以溜進(jìn)種群里而不被發(fā)現(xiàn)。所以嚴(yán)格地說,“針鋒相對(duì)”并不是進(jìn)化穩(wěn)定策略。
你也許會(huì)認(rèn)為,如果世界充滿善良,我們便可以認(rèn)為“針鋒相對(duì)”是一個(gè)進(jìn)化穩(wěn)定策略了。但即使如此,你可以看到接下來的故事?!坝肋h(yuǎn)合作”與“針鋒相對(duì)”不同,它并不能抵擋一些惡意策略的入侵。比如,“永遠(yuǎn)背叛”的攻擊便可以打敗“永遠(yuǎn)合作”,它可以每次都得到“背叛誘惑”的最高分。類似“永遠(yuǎn)背叛”這樣的惡意策略會(huì)減少過分善良策略的數(shù)目,比如“永遠(yuǎn)合作”。
雖然嚴(yán)格來說,“針鋒相對(duì)”并不是一個(gè)真正的進(jìn)化穩(wěn)定策略,但在實(shí)際操作中,將這一類基本善意又寬容、與“針鋒相對(duì)”類似的策略近似看做進(jìn)化穩(wěn)定策略,也是可行的。這一類策略里甚至可以包括一小部分惡意策略。阿克塞爾羅德的研究后繼有人,羅伯特·博伊德與杰弗里·洛伯鮑姆則是在這些后續(xù)研究者中得出最為有趣的成果。他們將“兩報(bào)還一報(bào)”與另一個(gè)“針鋒相對(duì)多疑版”(Suspicious Tit for Tat)的策略組合到一塊兒。“針鋒相對(duì)多疑版”近似于“針鋒相對(duì)”,但本質(zhì)上是一個(gè)惡意策略,雖然惡意程度不高。它只在第一回合采取“背叛”行動(dòng),之后的所有出牌與“針鋒相對(duì)”完全相同。在一個(gè)“針鋒相對(duì)”占主要地位的環(huán)境中,“針鋒相對(duì)多疑版”并不走運(yùn),因?yàn)樗南刃斜撑褜?dǎo)致了系列互相背叛的惡性循環(huán)。但當(dāng)它遇上了“兩報(bào)還一報(bào)”時(shí),這場冤冤相報(bào)則由對(duì)方的慈愛寬恕而化解了,雙方都能至少得到滿分,而“針鋒相對(duì)多疑版”還會(huì)因?yàn)槠渥畛醯谋撑讯@得更高的分?jǐn)?shù)。博伊德和洛伯鮑姆的結(jié)果表明,“針鋒相對(duì)”的群體可以被“兩報(bào)還一報(bào)”與“針鋒相對(duì)多疑版”的組合入侵影響。從進(jìn)化論角度上說,則是“兩報(bào)還一報(bào)”與“針鋒相對(duì)多疑版”共生繁榮,進(jìn)而影響了“針鋒相對(duì)”的種群。這種組合幾乎可以肯定不會(huì)消亡,而是以這種方式入侵相對(duì)穩(wěn)定的種群。事實(shí)上,也許還有很多其他由稍微惡意與極度圣潔策略的組合可以入侵種群。有人也許可以從這里看到人類生活的對(duì)照。
阿克塞爾羅德意識(shí)到“針鋒相對(duì)”并不是嚴(yán)格意義上的進(jìn)化穩(wěn)定策略。他于是又創(chuàng)造了一個(gè)術(shù)語:集體穩(wěn)定策略。由于在真正的進(jìn)化穩(wěn)定策略中,可以有不止一個(gè)策略同時(shí)達(dá)成集體穩(wěn)定。另一方面,決定一個(gè)策略是否可以控制種群,更取決于其運(yùn)氣?!坝肋h(yuǎn)背叛”的策略也可以和“針鋒相對(duì)”一樣穩(wěn)定。在一個(gè)被“永遠(yuǎn)背叛”控制了的種群中,沒有任何其他策略可以取勝。我們也可以將這種系統(tǒng)稱為“雙穩(wěn)態(tài)”,而將“永遠(yuǎn)背叛”作為其中一個(gè)穩(wěn)定點(diǎn),“針鋒相對(duì)”(或者其他最善良寬容策略的組合)為另一個(gè)穩(wěn)定點(diǎn)。無論哪一方首先在種群中達(dá)到數(shù)量優(yōu)勢,則將繼續(xù)保持穩(wěn)定。
然而,這個(gè)數(shù)量優(yōu)勢如何量化?一個(gè)群體中,究竟需要多少“針鋒相對(duì)”來保證其戰(zhàn)勝“永遠(yuǎn)背叛”?這取決于銀行家愿意在這場博弈中付出的具體數(shù)額。我們可以將此概括為一個(gè)決勝點(diǎn)。如果“針鋒相對(duì)”可以超過這個(gè)決勝點(diǎn),自然選擇便會(huì)愈加偏愛“針鋒相對(duì)”。另一方面,如果“永遠(yuǎn)背叛”超出了這個(gè)決勝點(diǎn),自然選擇則會(huì)更加偏愛它。你也許還記得,我們?cè)诘谑轮薪锝镉?jì)較者與騙子的故事里,也曾與這個(gè)決勝點(diǎn)相遇過。
于是,獲勝的關(guān)鍵顯然取決于哪一方首先超過決勝點(diǎn)。而且我們還需要知道,有時(shí)主導(dǎo)種群還會(huì)變化,從一方變成另一方。我們假設(shè)現(xiàn)有的種群已經(jīng)由“永遠(yuǎn)背叛”作為主導(dǎo)了。少數(shù)派的“針鋒相對(duì)”難以互相碰面從而得到共享利益。自然選擇于是將該種群推向了“永遠(yuǎn)背叛”的極致。只有該種群通過隨機(jī)轉(zhuǎn)換,使主導(dǎo)的一方變?yōu)椤搬樹h相對(duì)”,它才能繼續(xù)推進(jìn)“針鋒相對(duì)”的發(fā)展,使得所有人都能從銀行家(或者自然)處得到利益。然而,種群沒有集體意愿,也沒有集體意識(shí)或目的。他們不能控制發(fā)展走向。主導(dǎo)方的轉(zhuǎn)換只能發(fā)生在自然界間接力量的作用下。
這種情況如何發(fā)生呢?一種回答是“運(yùn)氣”。但這個(gè)單詞只能顯示無知。它表示“由一些尚未知道、未能分辨的方式來決定”。我們可以比“運(yùn)氣”做得更好一些。我們可以想象少數(shù)派的“針鋒相對(duì)”個(gè)體如何從一個(gè)實(shí)際方法來增加其關(guān)鍵數(shù)目,探索“針鋒相對(duì)”個(gè)體如何集合成足夠的數(shù)量,使它們都可以從銀行家處得到回報(bào)。
這種想法貌似可行,但實(shí)際上機(jī)會(huì)渺茫。這些相似的個(gè)體如何在一個(gè)小范圍內(nèi)集合到一起?在自然界中,最明顯的方式是由基因關(guān)系——親屬而集合。大多數(shù)動(dòng)物喜歡同自己的兄弟姐妹與表親們,而不是種群中其他成員居住在一起。這并不一定是出于選擇,而是自動(dòng)跟隨種群中的“黏性”。這里的“黏性”指的是任何使個(gè)體持續(xù)居住于出生地的趨勢。比如在人類歷史上,大部分地區(qū)的人們都只居住在出生地以外幾英里的地方(雖然現(xiàn)代社會(huì)已經(jīng)不再如此)。因此,親屬的小團(tuán)體們逐漸形成。我曾經(jīng)到訪過愛爾蘭西海岸一個(gè)偏遠(yuǎn)的島,令我吃驚的是,那里幾乎所有人都擁有巨大的耳朵。其中的原因很難解釋為大耳朵適應(yīng)當(dāng)?shù)靥鞖猓抢锇哆叺娘L(fēng)特別大)。這只能是因?yàn)閸u上大多數(shù)居民都是親緣相近的親屬。
基因相近的親屬們不僅在面部特征上相似,其他方面也有相近之處。比如,他們會(huì)因其基因趨勢而互相模仿著采用(或不采用)“針鋒相對(duì)”。于是,即使“針鋒相對(duì)”在種群整體里已經(jīng)稀少,它依然可能在局部中廣泛使用。在這個(gè)小圈子里,“針鋒相對(duì)”的個(gè)體可以互相博弈,采取互相合作的方式來達(dá)到數(shù)目繁榮,即使在總體計(jì)算里它們依然處于弱勢地位。由此,最初僅占領(lǐng)小片地區(qū)的“針鋒相對(duì)”個(gè)體,將隨著小團(tuán)體的逐漸擴(kuò)大,逐漸向其他地區(qū)分散,甚至包括“永遠(yuǎn)背叛”群體占主導(dǎo)的地區(qū)。如果用區(qū)域地理的方式思考,我舉的愛爾蘭島的例子則有些誤導(dǎo),因?yàn)槟抢锏娜藗儽蛔匀坏乩砀艚^了。想象另一個(gè)例子:一個(gè)遷移不多的人群中,即使這片地區(qū)的人們已經(jīng)有了廣泛持續(xù)的親緣關(guān)系,所有人也只復(fù)制近鄰(而不是遠(yuǎn)鄰)的行為。
回頭看看,“針鋒相對(duì)”是可以超越?jīng)Q勝點(diǎn)的,它所需的只是這些個(gè)體的聚合,這一點(diǎn)在自然選擇里可以很自然地發(fā)生。這個(gè)與生俱來的優(yōu)點(diǎn)使得“針鋒相對(duì)”即使在數(shù)目稀少的時(shí)候,還可以成功跨越?jīng)Q勝點(diǎn)而獲得成功。但這個(gè)跨越只是單向的?!坝肋h(yuǎn)背叛”作為一個(gè)真正的進(jìn)化穩(wěn)定策略,并不可以使用個(gè)體聚合來跨越?jīng)Q勝點(diǎn)。相反的是,“永遠(yuǎn)背叛”個(gè)體的聚合,不僅不能彼此互助而獲得群體繁榮,還會(huì)使各自的生存環(huán)境更加惡劣。它們無法暗自幫助對(duì)方獲得銀行家的獎(jiǎng)賞,而只能把對(duì)方也拖下水。于是與“針鋒相對(duì)”相反,“永遠(yuǎn)背叛”從親屬或種群聚合中得不到任何幫助。
所以,即使“針鋒相對(duì)”并非真正的進(jìn)化穩(wěn)定策略,它卻擁有更高的穩(wěn)定性。這意味著什么?如果我們采用長遠(yuǎn)的目光來看,“永遠(yuǎn)背叛”可以在相當(dāng)長一段時(shí)間內(nèi)抵制其他策略的影響,但如果我們等上很長一段時(shí)間,也許是幾千年后,“針鋒相對(duì)”將最終聚集到足夠的數(shù)目,跨越?jīng)Q勝點(diǎn),其數(shù)量終將反彈。而反方向的發(fā)展并不可能,“永遠(yuǎn)背叛”無法在個(gè)體聚集中獲得好處,因此也無法得到這種更高的穩(wěn)定性。
如我們之前所見,“針鋒相對(duì)”是一個(gè)善良的策略,這表示它永遠(yuǎn)不會(huì)首先背叛。它又是一個(gè)寬容的策略,表示它對(duì)過往的恩怨只有短期記憶。阿克塞爾羅德對(duì)“針鋒相對(duì)”還有另一個(gè)令人回味的定義:不嫉妒。在阿克塞爾羅德的定義中,嫉妒是希望獲得比對(duì)手更多的金錢,而不是追求從銀行家手中得到絕對(duì)數(shù)量較大的收獲。“不嫉妒”表示當(dāng)對(duì)手獲得與你一樣的金錢時(shí),只要大家都能從銀行家處獲得更大收獲,你也同樣高興?!搬樹h相對(duì)”從沒有“贏得”比賽。它從未由其對(duì)手處獲得更多的利益,因?yàn)樗藞?bào)復(fù)之外從未背叛。它能得到的最好結(jié)果是與對(duì)手獲得平局。但它盡量爭取在每一場對(duì)弈中都能獲得盡量高的共享分?jǐn)?shù)。當(dāng)我們考慮“針鋒相對(duì)”與其他策略時(shí),“對(duì)手”一詞其實(shí)并不準(zhǔn)確。然而,令人失望的是,當(dāng)心理學(xué)家在人群中實(shí)驗(yàn)重復(fù)囚徒困境的博弈時(shí),幾乎所有選手都會(huì)嫉妒,于是獲得的金錢也并不多。這表示許多人在潛意識(shí)中更傾向于擊敗對(duì)手,而不是與他人一同合作而擊敗銀行家。阿克塞爾羅德的實(shí)驗(yàn)表明,這是一個(gè)多么嚴(yán)重的錯(cuò)誤。
這不是在所有博弈里都是錯(cuò)誤的。博弈理論家將博弈分為“零和”與“非零和”兩種?!傲愫筒┺摹敝敢环降膭俪黾词菍?duì)方的損失。棋類游戲便是一種“零和博弈”,因?yàn)椴┺碾p方的目標(biāo)是勝過對(duì)方,使對(duì)方獲得損失。囚徒困境則是一種“非零和博弈”。在這里,銀行家支付了金錢,博弈雙方可以攜手合作,一起笑到最后。
這讓我想起了莎士比亞寫過的一句精彩的臺(tái)詞:
“我們要做的第一件事,就是把所有律師都先殺了?!?/p>
——《亨利六世》
在所謂“民事爭議”中,事實(shí)上經(jīng)常有很大空間可以合作。一個(gè)看似“零和博弈”的爭議也許只要加入少許善意,便可以轉(zhuǎn)化為雙方互利的“非零博弈”。拿離婚作為例子。一個(gè)好的婚姻明顯是一個(gè)“非零和博弈”,充滿了互助合作的空間。但即使當(dāng)它瓦解時(shí),夫妻們依然可以繼續(xù)合作,以“非零和博弈”來看待離婚,并從中得到好處。如果孩子的判決問題并不是一個(gè)足夠的理由勸服夫妻們合作,雙方律師的高昂費(fèi)用則也許更有說服力,因?yàn)樗鼘⒔o家庭財(cái)政造成巨大創(chuàng)傷。那么,如果一對(duì)理性文明的夫妻從一開始便一起雇用同一個(gè)律師,這是不是更合理呢?
答案卻是否定的。至少在英格蘭,還有至今美國幾乎50個(gè)州中,法律——或者更嚴(yán)格地說,律師本身的職業(yè)規(guī)范并不允許他們這么做。律師只能接受夫妻雙方中一位作為客戶,而拒絕另一方,迫使對(duì)方去尋找另一個(gè)律師,或者完全失去法律服務(wù)。這便是樂趣的開始。在另一個(gè)房間里,律師們開始談“我們”和“他們”。這里的“我們”指的不是我和我的妻子,而是我和我的律師對(duì)抗她與她的律師。法庭上陳述的則是“史密斯訴史密斯”?。ㄓ拮佣嘤梅蛐?。)無論夫妻雙方是否感覺抗拒對(duì)方,或者他們是否愿意和睦解決問題,法庭已經(jīng)假設(shè)他們之間的對(duì)抗關(guān)系。誰能在這場“我贏你便輸”的游戲里勝出呢?只有律師。
倒霉的夫妻們被拖進(jìn)了這么一場“零和博弈”中,而律師們則可以享有油水肥厚的“非零和博弈”——因?yàn)槭访芩狗驄D提供了回報(bào),而律師們專業(yè)剝削顧客的方式已經(jīng)通過行業(yè)合作精細(xì)地被規(guī)范了。他們合作的一種方式是提出知道對(duì)方完全不會(huì)接受的提議。這可以激發(fā)對(duì)方提出另一個(gè)明知雙方都不會(huì)接受的提議,這種方式循環(huán)往復(fù)。這些事實(shí)合作的“對(duì)手”們所發(fā)的每一封律師函、每一個(gè)電話都在賬單上多加一筆數(shù)目。運(yùn)氣不好的話,這個(gè)過程將持續(xù)幾個(gè)月甚至幾年,雙方的花費(fèi)越來越多。律師們并不需要坐在一起計(jì)算這些事情。相反的是,他們嚴(yán)格的獨(dú)立性正是他們合作的主要方式,以此消耗著顧客的腰包。律師們甚至都沒有感覺到他們所做的一切正是一個(gè)“非零和博弈”。就像我們有時(shí)見到的吸血鬼蝙蝠一樣,他們以一種精心設(shè)計(jì)的儀式在進(jìn)行著這場游戲。這個(gè)系統(tǒng)無需任何有意識(shí)的計(jì)劃或者組織,已然自成一體。它逼迫我們走進(jìn)一場“零和博弈”,顧客們得到了零,律師們得到了豐厚的非零。
我們?cè)撛趺醋瞿??莎士比亞的方法太過殘酷。單單改變法律就簡單多了。但大多數(shù)國會(huì)議員出身法律背景,只有“零和博弈”心理。很難想象比英國下院更為對(duì)抗的氛圍了。(法庭至少還保持了辯論的斯文,因?yàn)槁蓭焸兛梢员е拔也W(xué)的朋友和我將一起合作而笑到最后”的心理。)也許那些用心良苦的立法者們和良心發(fā)現(xiàn)的律師們需要學(xué)一點(diǎn)博弈論。只要律師以完全相反的方式工作,勸說顧客們放棄零和博弈的廝殺,就可以從庭外和解的非零和博弈中得到更多好處。
那么人類生活中的其他博弈呢?哪些是零和,哪些又是非零和?它們并不相同。我們應(yīng)該在生活的哪些方面追求零和博弈,又在哪些方面追求非零和博弈呢?生活中哪些方面值得“嫉妒”,哪些又值得合作并打敗“銀行家”呢?舉個(gè)例子,當(dāng)我們和老板對(duì)工資討價(jià)還價(jià)時(shí),我們是被“嫉妒”所驅(qū)使,還是我們合作以最大化我們的真實(shí)收入呢?在現(xiàn)實(shí)生活中,我們是否把“非零和博弈”誤會(huì)為“零和博弈”,正如我們?cè)谀莻€(gè)心理實(shí)驗(yàn)中一樣呢?我只能簡單提出這些復(fù)雜的問題,因?yàn)樗麄兊拇鸢敢呀?jīng)超出本書涵蓋的范圍了。
足球就是一場零和博弈。至少它一般是這樣。少數(shù)情況下它能變成一個(gè)非零和博弈(英式橄欖球、澳洲橄欖球、美式橄欖球、愛爾蘭橄欖球這些則一直是非零和博弈)。這在1977年的英格蘭足球聯(lián)賽中發(fā)生過。聯(lián)賽中的隊(duì)伍們被分為四級(jí)。俱樂部在比賽中互相對(duì)抗,以積分決定它們的晉級(jí)或降級(jí)。甲級(jí)聯(lián)賽聲名遠(yuǎn)揚(yáng),俱樂部可以趁機(jī)從巨大觀眾群中撈得豐厚利潤。在賽季結(jié)束時(shí),甲級(jí)中排名最后的3個(gè)俱樂部則降級(jí),進(jìn)入下一賽季的乙級(jí)聯(lián)賽。降級(jí)是一個(gè)慘痛的命運(yùn),值得不惜一切去避免。
1977年5月8日是本賽季的最后一天。甲級(jí)聯(lián)賽中3個(gè)保級(jí)名額中的2個(gè)已經(jīng)被確定,第三個(gè)正等待揭曉,它將從桑德蘭隊(duì)、布里斯托隊(duì)與考文垂隊(duì)中誕生。如果桑德蘭隊(duì)輸了這場比賽,布里斯托與考文垂只要打成平手,便可以共同留在甲級(jí)聯(lián)賽。但如果桑德蘭贏了,布里斯托與考文垂比賽中的輸家就會(huì)被降級(jí)。這兩場關(guān)鍵比賽理論上是同時(shí)進(jìn)行的。但事實(shí)上,布里斯托對(duì)考文垂的比賽剛好推遲了5分鐘開始。這種情況下,桑德蘭隊(duì)的結(jié)果在布里斯托對(duì)考文垂比賽結(jié)束前便以前知曉了。這便埋下了這個(gè)復(fù)雜故事的伏筆。
布里斯托與考文垂間的大部分比賽時(shí)間里,用當(dāng)時(shí)一份新聞報(bào)道來說,便是“迅猛激烈”,激動(dòng)人心。此次賽前雙方各自定下的2個(gè)進(jìn)球的目標(biāo),在比賽80分鐘時(shí)已經(jīng)達(dá)到。比賽結(jié)束前2分鐘時(shí),桑德蘭輸了的消息迅速傳了過來??嘉拇沟慕?jīng)理迅速讓場邊的巨大電子信息屏放出了這條消息。所有22名隊(duì)員顯然都看到并且意識(shí)到無需多事了,一個(gè)平局足以讓雙方都能逃避保級(jí)的命運(yùn)。而如果試圖進(jìn)球則會(huì)使情況更糟,這意味著把球員從防守轉(zhuǎn)向進(jìn)攻,將承擔(dān)戰(zhàn)敗而降級(jí)的風(fēng)險(xiǎn)。我們還是引用那份新聞報(bào)道吧?!霸谔啤ぜ獱査梗―on Gillies)80分鐘時(shí)的進(jìn)球幫助球隊(duì)和布里斯托戰(zhàn)成平手時(shí),雙方的支持者1秒鐘前還是分外眼紅的仇人,1秒鐘后卻迅速加入一場共同的狂歡慶祝中。裁判查利斯(Ron Challis)無奈地看著球員們把球傳來傳去,于對(duì)手完全沒有任何威脅。之前的零和博弈在外界新聞下迅速變成一場非零和博弈。在我們?cè)缦鹊挠懻撉闆r下,就好比外部的“銀行家”奇跡般出現(xiàn)了,使得布里斯托和考文垂從平局結(jié)果中得到好處。
類似足球這種觀賞運(yùn)動(dòng)通常是零和博弈,理由是觀看雙方的劇烈對(duì)抗比友好比賽更為激動(dòng)人心。但現(xiàn)實(shí)生活——無論是人類生活或者是植物、動(dòng)物的生活中——并非為觀眾所設(shè)計(jì)。事實(shí)上,現(xiàn)實(shí)生活中的大部分情況都是非零和博弈。社會(huì)扮演了“銀行家”的角色,個(gè)人則可以從對(duì)方的成功中獲益。我們可以看到,在自私的基因的基本原理指導(dǎo)下,即使在自私的人類世界里,合作與互助同樣促使社會(huì)興旺發(fā)展。我們現(xiàn)在可以從阿克塞爾羅德的定義出發(fā)去理解,好人確實(shí)有好報(bào)。
但這只能在博弈重復(fù)進(jìn)行下才能發(fā)生。博弈者必須清楚這并不是他們之間最后一場博弈。用阿克塞爾羅德艱澀的用語來說,“未來的陰影”還很長。但這需要有多長?它不可以無限長。理論上說,博弈的長度并不重要,重要的是博弈雙方必須都不清楚博弈結(jié)束的時(shí)間。假設(shè)你我正在進(jìn)行一場博弈,我們都知道博弈的重復(fù)次數(shù)為100回合,那么我們彼此清楚,第100回合將等同于一場簡單的一次性“囚徒困境”。這種情況下,最理性的決策是我們雙方各自在最后一輪打出“背叛”。自然,我們也彼此能預(yù)測對(duì)方也會(huì)“背叛”,這使得最后一輪的結(jié)果毫無懸念。既已如此,第99輪則相當(dāng)于一次性博弈,而雙方能作出的唯一理性決策則是“背叛”。同理于第98輪。在兩個(gè)完全理性、并假設(shè)對(duì)方同樣理性的博弈者處,如果他們知道比賽的回合數(shù),他們只能彼此不停“背叛”。于是當(dāng)博弈理論家談?wù)摗爸貜?fù)囚徒困境”時(shí),他們經(jīng)常假設(shè)博弈的終點(diǎn)不可知,或者只有銀行家知道。
即使博弈的重復(fù)次數(shù)不得而知,在現(xiàn)實(shí)生活中,我們經(jīng)常可以采用統(tǒng)計(jì)方法來預(yù)測博弈的持續(xù)時(shí)間長度。這種預(yù)測則成為了博弈策略中很重要的一部分。如果我注意到銀行家開始坐立不安,不停地看他的手表,我可以猜到此游戲即將結(jié)束,那么我便可以嘗試背叛。如果我發(fā)現(xiàn)你也注意到銀行家的坐立不安,我也會(huì)開始擔(dān)心你背叛的可能性。我也許會(huì)過于緊張,而提前讓自己先背叛。即使我開始擔(dān)心你也許會(huì)擔(dān)心我……
在一次性與重復(fù)囚徒困境博弈中,數(shù)學(xué)家簡單的直覺也許太過于簡單。每一個(gè)選手都可以持續(xù)預(yù)測博弈進(jìn)行的長度。他的估計(jì)越長,他的選擇就會(huì)越接近數(shù)學(xué)家在重復(fù)博弈中的預(yù)測,更善良、更寬容、更不嫉妒。反之,他的選擇就會(huì)更接近數(shù)學(xué)家在一次性博弈中的預(yù)測,更惡劣、更不寬容。
阿克塞爾羅德對(duì)于“未來陰影”重要性的闡述來自第一次世界大戰(zhàn)時(shí)形成的“自己活,也讓別人活”的現(xiàn)象。他的研究資源來自歷史學(xué)家與社會(huì)學(xué)家托尼·阿什沃思(Tony Ashworth)。一戰(zhàn)時(shí)的圣誕節(jié),英軍與德軍有時(shí)會(huì)友好相處,在無人區(qū)一起喝酒。這種現(xiàn)象早已為世人所知。但事實(shí)上,更為有趣的是,這種非正式非官方,甚至沒有口頭協(xié)定的友好協(xié)議,這種“自己活,也讓別人活”的系統(tǒng),早在1914年便在前線上下流行,持續(xù)了至少2年。一個(gè)高級(jí)英國將領(lǐng)在巡視戰(zhàn)壕時(shí),曾提及他看到德國士兵在英軍前線來復(fù)槍射程內(nèi)散步時(shí)的驚訝:“我們的士兵好像并沒有注意。我私下決定當(dāng)我們接手它時(shí),應(yīng)該阻止這種事情的發(fā)生,決不能允許這種事情出現(xiàn)。這些人似乎并不知道這是一場戰(zhàn)爭。顯然雙方都相信‘自己活,也讓別人活’的想法?!?/p>
博弈論與囚徒困境在當(dāng)時(shí)還未出現(xiàn)。但如今在事后,我們可以清楚理解當(dāng)時(shí)的情況。阿克塞爾羅德提供了一個(gè)精彩的分析。在當(dāng)時(shí)的壕塹戰(zhàn)中,每個(gè)野戰(zhàn)排的“未來陰影”都很長。這便表示,每支英軍的挖掘隊(duì)伍都可能需要與同一支德軍隊(duì)伍對(duì)峙好幾個(gè)月。另外,普通士兵永遠(yuǎn)不知道他們是否,或何時(shí)會(huì)離開,因?yàn)榇蠹叶贾儡婈?duì)的決策專斷隨意,變化無常。在這里“未來的陰影”長而不定,促使了“針鋒相對(duì)”式合作的開始。這種情況已經(jīng)類似于一場囚徒困境的博弈了。
我們還記得,要成為一場真正的囚徒困境,回報(bào)必須有特定的次序規(guī)則。雙方必須同時(shí)認(rèn)為共同合作優(yōu)于互相背叛。在對(duì)方合作時(shí)背叛則為更佳,在對(duì)方背叛時(shí)合作為最劣。彼此背叛則是將軍們所喜的。他們想看到他們的士兵在機(jī)會(huì)到來之時(shí)將對(duì)方捏得粉身碎骨。
將軍們并不愿意看到互助合作的場面,這對(duì)于贏得戰(zhàn)爭毫無幫助。但這對(duì)于雙方的普通士兵而言卻是求之不得的好事,他們并不愿意付出生命的代價(jià)。必須承認(rèn),他們也許認(rèn)可將軍的觀點(diǎn),希望己方能獲得勝利。這便是形成囚徒困境的第二層回報(bào)。但獲得戰(zhàn)爭勝利并不是每個(gè)普通士兵的選擇。戰(zhàn)爭的最終結(jié)果并不太可能從物質(zhì)上極大地有惠于個(gè)人。雖然無論是出自愛國主義抑或是遵守紀(jì)律,你可能覺得從背叛循環(huán)中逃出去也是不錯(cuò)的。但與你穿越無人區(qū)后的某些敵軍士兵互助合作,則很可能影響你本人的命運(yùn),而且這大大優(yōu)于互相背叛。這便使整個(gè)情況形成一個(gè)真正的囚徒困境。類似“針鋒相對(duì)”的行為注定要發(fā)生,也確實(shí)發(fā)生了。
在任何戰(zhàn)壕前線上的局部穩(wěn)定策略并不一定是“針鋒相對(duì)”。后者是屬于善良、雖報(bào)復(fù)但寬容的策略家族中的一員。這些策略即使在理論上并不完全穩(wěn)定,至少也很難在興起時(shí)被改變。比如,根據(jù)一份當(dāng)時(shí)的記錄,三次“針鋒相對(duì)”在一個(gè)區(qū)域同時(shí)形成。
我們走出深夜的戰(zhàn)壕……德國人也走了出來,所以出于禮貌,我們不該開槍。最惡劣的事情是槍榴彈……它們?nèi)绻淙霊?zhàn)壕,就會(huì)殺死大概9~10個(gè)人……但除非德國人們特別吵,我們不應(yīng)該使用這些武器。因?yàn)樗麄円部梢圆扇?bào)復(fù),我們也許沒有一個(gè)人可以回去。
“針鋒相對(duì)”家族中這些策略有一個(gè)很重要的共同點(diǎn):背叛的選手將得到懲罰。復(fù)仇的威脅必須始終在此。在“自己活,也讓別人活”系統(tǒng)中,報(bào)復(fù)能力的展示通常引人注目。雙方不斷攻擊敵軍不遠(yuǎn)處的虛擬目標(biāo)——一種如今也在西方電影中使用的技巧,比如射滅蠟燭火焰,而不是敵軍本身,以展示其百發(fā)百中、極具威脅的攻擊。在另一個(gè)問題上——為什么美國罔顧頂尖物理學(xué)家們的愿望,使用了兩顆原子彈來毀滅兩座城市,而不是用以攻擊類似的蠟燭機(jī)制——這一機(jī)制也能圓滿地回答。
與“針鋒相對(duì)”類似的策略都有一個(gè)重要的特征:它們都很寬容。這有助于減少長期報(bào)復(fù)惡性循環(huán)的產(chǎn)生。這位英國軍官再次戲劇化地描述這種平息報(bào)復(fù)的重要性:
當(dāng)我正在與某連的人喝茶時(shí),我們聽到許多喊叫聲,于是出來查看。我們看見我們的人與德國人各自站在戰(zhàn)壕前的矮墻上。突然炮聲驟響,卻無人受傷。雙方很自然地臥倒,我們的人開始咒罵德國人。這時(shí)一個(gè)勇敢的德國人站起身來大喊:“我們很抱歉,我們希望沒有人受傷。我們不是故意的,都是那個(gè)該死的普魯士大炮!”
阿克塞爾羅德對(duì)這個(gè)道歉的評(píng)價(jià)是:“僅將責(zé)任推卸給機(jī)械,有效阻止了報(bào)復(fù)。它表達(dá)了道德上對(duì)于辜負(fù)信任的道歉,也表達(dá)了對(duì)有人可能受傷的關(guān)切。這確實(shí)是一個(gè)令人欽佩的勇敢的德國人。
阿克塞爾羅德還也強(qiáng)調(diào),在保持互相信任的穩(wěn)定狀況時(shí),預(yù)見性與儀式感十分重要。一個(gè)愉快的例子是:一個(gè)德國士兵提到,英國大炮每天晚上會(huì)根據(jù)鐘點(diǎn)有規(guī)律地在前線一些地方開火:
七點(diǎn)鐘到了,英國人開炮了。他們十分準(zhǔn)時(shí),你都可以據(jù)此來校正手表……他們永遠(yuǎn)有著相同的目標(biāo),非常準(zhǔn)確,從未在前后左右偏移過標(biāo)志……甚至有一些好奇的同伴……會(huì)在七點(diǎn)前一點(diǎn)爬出去,看英國人開炮。
根據(jù)英軍的記錄,德國大炮也在做同樣的事情:
(德國人)選擇的目標(biāo)、射擊的時(shí)間與回合都十分規(guī)律……瓊斯上校知道每一炮發(fā)出的時(shí)間。他的計(jì)算十分準(zhǔn)確。他甚至敢于做一些初生牛犢式的行為,冒險(xiǎn)去到炮擊的地點(diǎn)。因?yàn)樗琅趽魧⒃谒竭_(dá)前停止。
阿克塞爾羅德對(duì)此的評(píng)注是:“這種儀式性的炮擊形式與規(guī)律性的開火表達(dá)了雙重信息。于上級(jí)軍官,它們表達(dá)了抗?fàn)?,而?duì)于敵軍,它們傳遞了和平?!?/p>
這種“自己活,也讓別人活”的系統(tǒng)本可以由口頭溝通所獲得,由理性的策略家在圓桌上討價(jià)還價(jià)而得到。事實(shí)上它無法這么做。它通過人們回應(yīng)對(duì)方行為的方式傳遞,在一系列的局部約定中形成。阿克塞爾羅德計(jì)算機(jī)中的策略完全沒有意識(shí)。它們的善意或惡意、寬容或記恨、嫉妒或大氣,僅由其行為所定義。程序員也許有其他的想法,但這并不相關(guān)。一個(gè)策略是否善良,僅由其行為所確認(rèn),而并非由其動(dòng)機(jī)(因?yàn)樗鼪]有)或作者的性格(當(dāng)程序運(yùn)行時(shí)這已經(jīng)成為歷史了)。一個(gè)計(jì)算機(jī)程序可以以其策略方式來行為,它并不需要知道自己的策略如何,或者任何其他事情。
我們當(dāng)然知道策略家是否有意識(shí)并不相關(guān)。這本書已經(jīng)提到許多無意識(shí)的策略家。阿克塞爾羅德的程序便是我們?cè)谶@本書里用以思考動(dòng)植物、甚至基因的優(yōu)秀模型。我們現(xiàn)在可以問問,他那些關(guān)于寬容善良不嫉妒的成功例子與優(yōu)化結(jié)論是否可以用于自然世界?答案是肯定的,自然界一向如此。唯一條件是自然優(yōu)勢需要設(shè)定未來陰影很長的囚徒困境,而且是非零和博弈。這些條件在生物王國中一直成立。
沒有人會(huì)認(rèn)為細(xì)菌是一個(gè)有意識(shí)的策略家,但寄生菌們天衣無縫地與它們的寄主演繹著囚徒困境。我們沒有理由不采用阿克塞爾羅德的理論——善良、寬容、不嫉妒等等,來研究它們的策略。阿克塞爾羅德和漢密爾頓指出,那些無害且有益的細(xì)菌可以在人們受傷時(shí),變成有害甚至致命的敗血癥。醫(yī)生會(huì)說人體的“自然抵抗能力”在受傷時(shí)會(huì)下降。但也許真實(shí)的原因正是囚徒困境的博弈。在人體內(nèi),細(xì)菌是否有所收獲,同時(shí)也不停檢驗(yàn)其回報(bào)呢?在人體和細(xì)菌的博弈中,“未來陰影”通常很長,因?yàn)橐粋€(gè)普通人可以在任何起始點(diǎn)活上很多年。然而,一個(gè)嚴(yán)重傷者則可能給其寄生菌帶來較短的未來?!氨撑训恼T惑”突然比“互相合作的獎(jiǎng)賞”更有誘惑力。當(dāng)然,細(xì)菌在他們邪惡的小頭腦里可以沒有計(jì)算這些東西!代代細(xì)菌的自然選擇已經(jīng)將它們培養(yǎng)成一個(gè)無意識(shí)的生物,首要任務(wù)是以生物化學(xué)來維系生命。
根據(jù)阿克塞爾羅德和漢密爾頓的分析,雖然植物明顯沒有意識(shí),但它們甚至?xí)脧?fù)仇。無花果樹和榕小蜂便享有緊密合作的關(guān)系。我們所吃的無花果其實(shí)不是果實(shí),無花果頂端有一個(gè)小洞,如果你可以縮小成榕小蜂的尺寸,進(jìn)入這個(gè)小洞(榕小蜂非常小,小得當(dāng)我們吃無花果時(shí)都不會(huì)注意到它),你可以看見無花果壁上有許許多多小花。無花果其實(shí)是一個(gè)花朵們的陰暗溫室與授粉房間,而授粉過程則要靠榕小蜂來完成。無花果樹為榕小蜂提供棲息地,而榕小蜂則在這些小花里產(chǎn)卵。對(duì)于榕小蜂來說,“背叛”指的是在無花果內(nèi)的許多花朵中產(chǎn)卵,使得它們無法互相授粉。無花果樹如何“報(bào)復(fù)”呢?阿克塞爾羅德和漢密爾頓說:“許多情況下,如果榕小蜂進(jìn)入一棵年輕的無花果,卻不為花朵授粉,而是在大部分花朵中產(chǎn)卵,無花果樹將除去這顆還處于生長中的無花果,使得所有榕小蜂的后代都走向死亡。”
艾瑞克·費(fèi)希爾(Eric Fischer)則在海鱸魚——一種雌雄同體的魚身上發(fā)現(xiàn)了一個(gè)奇怪的現(xiàn)象,這正好說明了自然界的“針鋒相對(duì)”。與我們不同,這種魚的性別不是由生命孕育時(shí)的染色體所決定的。每一條魚都有雄性與雌性的功能,交配時(shí)可以選擇產(chǎn)生卵子或精子。他們雙雙締結(jié)一夫一妻的組合,輪流交換性別分飾雌雄角色。我們也許可以推測,由于雄性角色相對(duì)方便,海鱸魚也許更愿意飾演雄性角色,而逃離合作關(guān)系。也就是說,如果其中一只魚可以成功勸服伴侶持續(xù)飾演雌性角色,它就可以逃離其對(duì)孵卵生產(chǎn)的責(zé)任,而將資源投入其他事情,比如和其他魚交配等。
事實(shí)上,費(fèi)希爾卻發(fā)現(xiàn)海鱸魚以一種嚴(yán)格的輪換機(jī)制進(jìn)行其繁衍過程。這就是我們所預(yù)料的“針鋒相對(duì)”。這個(gè)博弈正是一個(gè)真正的囚徒博弈,雖然有些復(fù)雜,但這說明了鱸魚們?yōu)楹尾扇∵@個(gè)策略。在這里,“合作”表示當(dāng)輪到時(shí)扮演雌性角色,“背叛”則是在輪到時(shí)試圖扮演雄性角色。這種“背叛”很容易引起報(bào)復(fù),伴侶可能會(huì)在下一次拒絕扮演雌性角色,或者“她”可以直接中斷伴侶關(guān)系。費(fèi)希爾確實(shí)也發(fā)現(xiàn)了,那些性別角色擔(dān)當(dāng)次數(shù)不等的伴侶們?nèi)菀追质帧?/p>
社會(huì)學(xué)家和心理學(xué)家會(huì)提出一個(gè)問題:為什么有人會(huì)愿意捐贈(zèng)血液(在英國等國家,血液捐贈(zèng)為無償)?我不覺得這個(gè)答案在互惠或偽裝的自私下有那么簡單。當(dāng)這些長期血液捐贈(zèng)者需要輸血時(shí),他們并未得到任何優(yōu)先次序,也沒有人給他們頒發(fā)金星獎(jiǎng)?wù)?。也許我過于天真了,但我覺得這是一種真正的、純粹的無私利他主義。這是因?yàn)槲眚鹬g的血液共享剛好符合阿克塞爾羅德的模型。G. S. 威爾金森(G. S. Wilkinson)的研究表明了這一點(diǎn)。
吸血鬼蝙蝠以在夜里吸血為生。它們要得到食物并不容易,但每每得到的都是大餐。當(dāng)黎明降臨,一些不走運(yùn)的蝙蝠可能會(huì)空著肚子回家,而另一些則可能找到一個(gè)受害者,吸了充足的血液。第二天晚上,同樣的故事又在上演。在這種情況下,一個(gè)互助的利他主義是可能產(chǎn)生的。威爾金森發(fā)現(xiàn)那些在夜里吸飽血液的幸運(yùn)兒確實(shí)會(huì)將一些血液返流,捐贈(zèng)給不走運(yùn)的同伴。威爾金森觀察了110例血液捐贈(zèng),其中有77次是母親喂養(yǎng)孩子,而大部分其他的血液捐贈(zèng)則發(fā)生在近親中。在完全沒有血緣的蝙蝠中,一些血液捐贈(zèng)的例子依然存在,“血濃于水”的說法看來并不完全符合事實(shí)。但是,這些共享血液的蝙蝠也經(jīng)常是室友,他們有許多機(jī)會(huì)與對(duì)方持續(xù)打交道,這正是重復(fù)囚徒博弈所必需滿足的條件。但囚徒博弈的其他條件呢?表12–4的回報(bào)表格顯示了我們對(duì)此的預(yù)期。
表12–4 吸血鬼蝙蝠的血液捐贈(zèng):在各種情況下我的回報(bào)

吸血鬼蝙蝠的情況真的和這張表格一樣么?威爾金森對(duì)那些餓肚子的蝙蝠的體重下降速率進(jìn)行計(jì)算。通過對(duì)飽食、饑腸與處于中間段的蝙蝠餓死速率的分別計(jì)算,他算得血液得以維持生命的時(shí)間。他發(fā)現(xiàn)了一個(gè)并不驚奇的結(jié)論:這些速率并不相等,取決于蝙蝠的饑餓程度。比起吃飽喝足的蝙蝠,相同的血液量可以為饑腸轆轆的生命維持更多的時(shí)間。這也就是說,雖然捐血可以增加捐贈(zèng)者餓死的速率,但救助逝去生命的意義要大得多。這似乎表示蝙蝠的情況確實(shí)符合囚徒困境的規(guī)則。將血液捐贈(zèng)給同伴中所需者,比留著自用更為珍貴。在她(吸血鬼蝙蝠的社交范圍為女性)饑腸轆轆的夜里,她則可以從伙伴的捐贈(zèng)中獲益良多。當(dāng)然,如果她選擇“背叛”,拒絕給同伴捐贈(zèng)血液,逃離互助的責(zé)任,她可以受益更多。在這里,“逃離互助責(zé)任”只在蝙蝠確實(shí)采取“針鋒相對(duì)”策略時(shí)才有意義。那么,“針鋒相對(duì)”在演化中的其他條件是否能滿足呢?
重要的是,這些蝙蝠是否能夠互相辨別呢?威爾金森的實(shí)驗(yàn)結(jié)果是肯定的。他俘虜了一只蝙蝠,將其與同伴隔離,并餓了她一夜,而其他同伴則得以飽食。當(dāng)這只不幸的俘虜返回巢穴時(shí),威爾金森就觀察是否有任何蝙蝠給予其食物。這個(gè)實(shí)驗(yàn)重復(fù)了許多次,不同的蝙蝠輪流作為饑餓的俘虜又被送返。俘虜?shù)尿饌儊碜韵喔魯?shù)英里的兩個(gè)巢穴,兩個(gè)獨(dú)立的組織。如果蝙蝠可以辨別她們的朋友,這只饑餓的蝙蝠將可以從,也只能從自己的巢穴中獲得幫助。
這正是事實(shí)。在觀察到的13個(gè)血液捐贈(zèng)中,12個(gè)捐贈(zèng)者是饑餓者的“老朋友”,來自同一個(gè)巢穴。來自不同巢穴的“新朋友”只喂養(yǎng)了1次饑餓的蝙蝠。這也許是個(gè)巧合,但當(dāng)我們計(jì)算這個(gè)范例時(shí),它發(fā)生的概率只小于1/500。我們可以信心十足地總結(jié),蝙蝠確實(shí)更偏愛幫助老朋友,而不是另一個(gè)巢穴的陌生人。
吸血鬼蝙蝠是神秘的。對(duì)于維多利亞哥特小說的迷戀者,它們經(jīng)常是在夜里恐嚇?biāo)?、吸食血液、犧牲無辜生命以滿足私欲的黑暗力量。再加上其他維多利亞時(shí)期的神秘事件,以及蝙蝠天生鮮紅的牙齒和爪子,吸血鬼蝙蝠難道不正是自然界自私基因的最令人恐怖力量的化身么?我對(duì)于這些神秘事件嗤之以鼻。如果我們想知道一個(gè)事件背后的真相,我們需要研究。達(dá)爾文主義賦予我們的并不是一個(gè)特定生物的詳細(xì)描述,而是一個(gè)更微妙、卻更有價(jià)值的工具:對(duì)原理的理解。如果我們一定要加進(jìn)一個(gè)神秘事件,那便是真相——關(guān)于吸血鬼蝙蝠高尚品格的故事。對(duì)于蝙蝠自身,血并不濃于水。她們超越親屬關(guān)系,在忠誠的朋友間形成她們長久堅(jiān)實(shí)的紐帶。吸血鬼蝙蝠可以講述一個(gè)新的神秘故事,一個(gè)關(guān)于共享、互助、合作的故事。她們昭示這一個(gè)善良的思想:即使我們都由自私的基因掌舵,好人終有好報(bào)。