今天的閱讀分享以大衛(wèi)·高蒂爾(David Gauthier)的協(xié)議道德理論為核心。有必要提前簡要說明,高蒂爾是一位霍布斯研究者,除了今天一篇文本所節(jié)選自的《協(xié)議道德》(1986)以外,他還有《利維坦的邏輯:托馬斯·霍布斯的道德和政治理論》(1969)、《霍布斯與政治契約主義》(2020)等著作,對霍布斯感興趣的可以去看著玩;而高蒂爾在發(fā)展自己的道德理論時,也把霍布斯當作重要的上下文;以霍布斯為起點,高蒂爾想要回答這樣的問題:為什么我們應(yīng)當遵守某些道德原則?特別地,由于他采用基礎(chǔ)主義方法論——道德義務(wù)有沒有理性基礎(chǔ)?(Are moral duties rationally grounded?) 只有完成上述對道德的證成,才可以推導(dǎo)出關(guān)于政治制度安排的規(guī)范性正義理論。
文本有以下三篇:
- Colin Farrelly: An Introduction to Contemporary Political Theory, Chapter 3. 2003.
- David Gauthier: Justice as Mutual Advantage. 1986.
- Allen Buchanan: A Critique of Justice as Reciprocity. 2004.
其中,第二篇是《協(xié)議道德》的第一章,正如其副標題“理論概述”(Overview of a Theory)所示,它可以幫你速通全書結(jié)構(gòu)。
接下來我們將正式進入高蒂爾的體系。
1 Moral, Interest, Reason
1.1 Moral premises and fundamentalism as methodology
為什么我們應(yīng)當遵循某些道德原則?為什么某些安排是正義的而另一些不是?
回答這些問題可以有很多方法。在羅爾斯那里,方法是反思均衡(reflective equilibrium)。以社會理論、基本常識、其他正義觀念等作為背景板,a原則或A原則集合,必須和道德勝任主體所持有的深思熟慮的判斷保持融貫(coherent),才得以成為正義原則;不存在一個信念,其作為基礎(chǔ)被確信和固定下來,原則和判斷都是可以動態(tài)調(diào)整的。
這種融貫的方法在基礎(chǔ)主義者眼中就像是循環(huán)論證:你用來證成道德的東西還是道德,這不是耍賴嗎。在羅爾斯的例子里,深思熟慮的判斷是一些道德判斷(如奴隸制是不正義的),也就是說,主體被要求具備基本的道德感(尤其是對公平的認知);沒有這些作為預(yù)設(shè)的道德感,我們連原初狀態(tài)和無知之幕都沒有理由搭建(為什么契約者要自由平等?為什么不排除社會境況、個人偏好等特殊化信息就不能公平地選擇?這里的自由、平等、公平都是預(yù)設(shè))。盡管允許調(diào)整的平衡機制使得這個邏輯不能被一棍子打成循環(huán)論證,但它依賴道德預(yù)設(shè)是確鑿無疑的。
一刻也沒有為公平正義(Justice as Fairness)的落敗而哀悼,下一秒趕到戰(zhàn)場的是資格正義(Justice as Entitlement)。自由至上主義正義理論內(nèi)戰(zhàn)的結(jié)果令人哭笑不得,因為作為諾齊克論證起點的自我所有權(quán)(更籠統(tǒng)地說,對權(quán)利的重視)就具有道德屬性;如果拆除這個道德預(yù)設(shè),即不再視權(quán)利為值得重視和保護的,他那最最精華的三條持有正義原則比如矯正原則就不能證成了(是的,強迫轉(zhuǎn)讓侵犯了我的權(quán)利,但它為什么不正當呢,既然我們不在乎權(quán)利了?)。顯然,資格正義也依賴道德預(yù)設(shè)。
這時再看基礎(chǔ)主義者高蒂爾的野心:我們將論證,道德可以作為一種理性約束,從理性選擇的非道德前提中推導(dǎo)出來。(Morality, we shall argue, can be generated as a rational constraint from the non-moral premisses of rational
choice.)這就非常令人感動了?,F(xiàn)在我們只需要找到一個非道德前提然后開推。
1.2 Non-moral premises: reason or interest?
What does Hume say?
休謨認為:
- 道德義務(wù)必須符合每個人的真正利益。
- 理性只能判斷事實,除此外對行動毫無作用。
錯誤的接受:遵循道德義務(wù) = 追求個人(真正的)利益。如果等式成立,我們實際上不再需要道德的概念了,可現(xiàn)實是它一直在約束我們,它必定有超越和約束利益的部分。有人可能認為“真正的”構(gòu)成了等式兩側(cè)的差值和約束的實質(zhì),因為個人可能不能很好地認識到他的真正利益是什么;但如果要接受“真正利益”的表述,就必須接受客觀的利益標準,這在休謨的機械決定論年代也許是默認,但現(xiàn)在我們發(fā)現(xiàn),不同個人身上表現(xiàn)出強烈的主觀性,似乎無法推展至普遍的道德。
正確的接受:認可其中存在相關(guān)性。
如果利益不能作為非道德前提,那就只剩下理性/理智/智性可以作為了。
休謨的理性起到什么作用?隨便提一嘴。
怎么考察人們在實踐中運用理性能力,誒,理性選擇剛好是一種符合要求的工具!顯然我們將看到一種基于理性選擇理論的道德理論。接下來就需要選擇一個理性概念。
Beyond Hobbes' conception of rationality
理性選擇理論(rational choice theory)的版本已經(jīng)迭代過很多次,如何定位高蒂爾的版本數(shù)?不要忘了他是霍布斯主義的現(xiàn)代支持者。
先讓我們復(fù)讀一下經(jīng)典版本的什么是理性選擇:將理性概念細化為一系列關(guān)于在可能行動中進行選擇的確定條件,這些就成為行為原則。要素:為達成目標而行動、有完全信息、最優(yōu)選擇(利益/效用最大化)。這里的合理性(rationality)類型是目的-手段/工具理性。
霍布斯可以說非常經(jīng)典了:自然狀態(tài)是沒有任何約束的、一切人對一切人的戰(zhàn)爭狀態(tài),很不利于自我保存;但人的最大利益就是自我保存,對自然狀態(tài)的信息是完全的,為此做出的理性選擇就是接受約束進入社會合作擺脫自然狀態(tài)。但這個版本的理性選擇有諸多問題,高蒂爾發(fā)現(xiàn)了一部分并打了補丁,另一部分則被繼承下來變成了高蒂爾自己的問題。下面我們就來看一看。
2 Basic Settings of Gauthier's RCT
2.1 Preferences instead of interest: initial operation
剛才在休謨那里我們對利益能否最大化衡量有一個懷疑。如果不能最大化衡量,那它顯然不能用作理性選擇的指標。
為此,高蒂爾調(diào)整了霍布斯的基于利益的理性選擇,把它改成了基于偏好的理性選擇,也就是說,把利益最大化改成了效用最大化,并且效用是經(jīng)過一定過程從偏好中得出的。
過程:有一系列事態(tài)(affair),個人系于特定情境對它有一定的傾向的排序(ordinal or interval,取決于應(yīng)用場景有無風(fēng)險),這就是一組偏好關(guān)系(有向圖);鑒于事態(tài)是中立的,個人只在意相對關(guān)系,該圖有邊權(quán)無點權(quán)。但就像我們直覺會認為的那樣,直接給偏好賦值并稱之為效用是不妥當?shù)?,因為它極有可能無法用于最大化計算(有向有環(huán)圖);偏好自身的質(zhì)量也不是隨便的(一條邊的方向是怎么獲取的?),所以需要限制偏好關(guān)系的形態(tài)。
高蒂爾做了一系列討論,認為限制應(yīng)該這樣做:必須是深思熟慮的(considered),最好是連貫的(coherent)。前者要求經(jīng)過充分反思、擁有充足的相關(guān)經(jīng)驗(有很多選擇,它們的主體在經(jīng)過反思和擁有更多經(jīng)驗后反悔了,這些選擇不能說是理性的),它將決定邊權(quán)和方向的有效性;高蒂爾特別將其與經(jīng)濟學(xué)中的顯性偏好(revealed preferences)做了區(qū)分,經(jīng)濟學(xué)不相信不被選擇揭示的偏好存在,但依據(jù)顯性偏好而做出非理性選擇是很好找例子的(比如在德國點了個從沒聽說過的當?shù)夭耍c完吃了才發(fā)現(xiàn)自己不喜歡,雖然點菜的選擇揭示了一個偏好,但它不能用來賦值做最終計算)。
后者則是用來確保最大化計算能夠?qū)嵭械?。連貫性有四個要求(滿足前兩個要求就可以單調(diào)非增非減了,但區(qū)間測度要求更多):
- 完整性(completeness):任意兩個選擇結(jié)果可以比較(確保有向邊可以連出來)。
- 傳遞性(transitivity):字面意思,A大于B,B大于C,則A大于C(確保不成環(huán))。
- 單調(diào)性(monotonicity):“越多越好”或者“獲得你喜歡的事物的概率越高越好”。
- 連續(xù)性(continuity):沒有無限效用,確保中間選項有意義(然而死亡的效用是負無窮,這沒錯吧)。
注意,以上是RCT領(lǐng)域大神發(fā)掘的公理,高蒂爾自己嘗試對后兩個性質(zhì)進行hack并且成功了一次,隨后他放棄打補丁并且承認RCT還需要完善,建議我們聊點輕松的。
最后兩個條件:表達的偏好和選擇揭示的偏好需要一致(確實,表里不一是非理性選擇,但高蒂爾似乎沒有處理一個人在表達偏好時撒謊的問題——我猜會有人提出對于真正偏好的埋沒這個問題,然而言語行為理論告訴我們表達也是一種選擇,所以可以回退一步進行撒謊與不撒謊的理性選擇——可是回退有限嗎?);關(guān)于實際狀況的信念正確與否是無關(guān)緊要的(抗毒的例子)。這樣就完成了一個基于偏好的理性選擇過程。
非常精彩!它相對基于利益的選擇有一個很強的優(yōu)勢,那就是它不需要為事態(tài)賦值、不過問偏好的內(nèi)容(利益是對事態(tài)賦值計算而得的,必須追問客觀的數(shù)字從哪來),而是只考慮關(guān)系、終止于選擇的行動(這波是放過物自體)。而相對基于審慎(prudence)的選擇它似乎更現(xiàn)實,并且給了個人更多不被指責(zé)為非理性的空間,因為它只考慮當下的偏好和環(huán)境而不考慮將來的。
2.2 Constrained Maximization: answer to Compliance Problem
然而,無論是用ordinal還是interval的方式預(yù)處理偏好集合,它都不能應(yīng)用于互動情景。對應(yīng)于經(jīng)濟學(xué),就是古典經(jīng)濟學(xué)簡單最大化的實踐理性概念,還有貝葉斯決策理論的不足。
一說到互動,我們肯定會想到博弈論。高蒂爾隨即把預(yù)處理升級到策略性(strategic),并且給出了新的理性選擇標準:
A: Each person's choice must be a rational response to the choices she expects the others to make.
B: Each person must expect every other person's choice to satisfy condition A.
C: Each person must believe her choice and expectations to be reflected in the expectations of every other person.
這時我們會發(fā)現(xiàn),效用最大化直接嵌入會很怪。高蒂爾援引了霍布斯也處理過的囚徒困境。兩個囚徒各自遵循上述三條理性選擇標準去追求效用最大化,顯而易見地達到了一個次劣結(jié)果。
霍布斯為避免這種結(jié)果寫了三條假言命令,簡單來說就是勸大家接受合作。光接受是不夠的,還要遵守才能確保合作的可持續(xù)性。
霍布斯遇到的第一個麻煩就是愚人的質(zhì)疑。愚人質(zhì)疑他為什么要遵守合作協(xié)議的約束,如果違背它帶給個人的預(yù)期效用更高。同樣的觀點《理想國》里的格勞孔也提過,任何人有了隱形戒指都會行不義之事,因為他們不會被抓。
霍布斯用絕對主權(quán)者的懲罰來壓制這個問題,但這樣的理由是外部的因此不夠令人滿意。高蒂爾決定給出內(nèi)部的理由,那他就必須證明只要選擇是理性的,這個選擇就必然是遵守協(xié)議、遵守道德約束的。
不滿意于納什均衡的最大化天花板,高蒂爾提出了一個新目標:優(yōu)化。就像他之前做的那樣,繼續(xù)修正“效用最大化”的概念,給他加入了“受限的”這一定語,現(xiàn)在它表示一種選擇策略的傾向:遍歷所有博弈結(jié)果,找到一個能使所有博弈方都相比納什均衡有所增益的結(jié)果,選擇這個結(jié)果要求的策略;使所有博弈方都有所增益是他們能夠接受這一結(jié)果的條件,因為人們?nèi)韵MM可能地最大效用(雖然不是直接)。持有這種經(jīng)過修改的最大化原則的理性行動者,接下來被稱為CM;相對應(yīng)地,直接最大化者被稱為SM。
接著他設(shè)了一堆變量并且開列關(guān)系式:
Defection:
Cooperation:
Non-cooperation:
Exploitation:
滿足條件:
The probability that CMs will recognize each other (and thus cooperate):
The probability that CMs will fail to recognize SMs but will themselves be recognized (so that defection and exploitation will result):
The probability that a randomly selected person is a CM:
只要證明 我們就有理由聲稱SM自取其辱,CM是理性選擇。兩個CM沒問題。但遇到SM你不炸了嗎?高蒂爾在這里做了一個不太有力的假設(shè):人的識別能力會不斷提高,所以SM都會被識別出來,從而被排除出合作范圍(要是他們想合作就必須洗心革面變成CM)。數(shù)學(xué)上可以用
的極端假設(shè)來看,這時
,結(jié)果為正。
且不說識別能力會不會提高。還存在一個欺騙能力或者說偽裝能力,高蒂爾好像沒有把它區(qū)別出來(或許有一個pq關(guān)系式)。一個人可以做到100%識別和100%欺騙(理想情況),所以識別能力提高不必然導(dǎo)致識別概率提高,也就是說,CM的受騙概率可能永遠不會低到能夠讓它必然被理性選擇的程度。
雖然高蒂爾證得不好,但有一篇經(jīng)濟學(xué)論文給出了支持他的結(jié)論的結(jié)果:Guttman: On the evolutionary stability of preferences for reciprocity (2000) 古特曼討論了2v2演化博弈模型下“互惠者”和“機會主義者”的策略經(jīng)過迭代進化后穩(wěn)定的情況,重復(fù)博弈的好處就是一次性的識別/欺騙不會帶來那么顯著的結(jié)果變化了,論文結(jié)論稱策略集最終會穩(wěn)定在“互惠者”的行為模式。
除了囚徒困境外還有一個志愿者困境,提出了經(jīng)典的“搭便車”問題,可以也拿來檢驗CM的有效性。
為了把剩下的體系說完,我們就假設(shè)高蒂爾這一步證成了。這回答了為什么要遵守道德約束的問題。
2.3 Complete information and perfect rationality
在另外兩個要素上,高蒂爾還是沿用了完全信息和完全理性的設(shè)定,并因此被更新版本的RCT人抨擊了。等到體系基本過完我們再提這件事。
知道我們?yōu)槭裁匆袷氐赖录s束還不夠,畢竟他的野心是給出一個正義理論,那么還需要契約論裝置來一次同意正當化。于是,天才少年高蒂爾開始搭建理性談判(rational bargaining)的舞臺。
3 Rational Bargaining
作為契約論者,高蒂爾很快就明白了自己怎么從理性走向道德約束:如果我們能理性地選擇同意一個包含著道德約束協(xié)議,那么這很正當,問題就解決了。于是他開始著手設(shè)計一個談判場景(設(shè)計自然狀態(tài)說是)。
3.1 Initial bargaining position
等等!談判其實分為兩個階段,為了推進階段我們要做兩次選擇。
第一個階段是理性地選擇加入談判/合作協(xié)議。
這一階段必須是非強制的(uncoercive),否則易得選擇合作協(xié)議是非理性的。強制意味著你表達的偏好和選擇的偏好會發(fā)生偏差,RCT告訴我們這不是理性選擇。(高蒂爾舉了奴隸和奴隸主談判的例子,但似乎沒必要。)
Lockean Proviso?
其次必須是受洛克限制性條款(proviso)約束的,否則易得選擇合作協(xié)議是非理性的(不能保證不惡化狀態(tài)?那就不是最優(yōu)選擇)。
引入這一條款的必要性是策略合理性的定義帶來的。行動者做一個策略的理性選擇,既可以貢獻也可以傷害,那么有的天才少年就會不貢獻只傷害(也許我可以不干活只靠犯罪吃牢飯?不一定是恰當?shù)睦樱?;由于他能夠策略地影響他人(以及影響博弈矩陣?nèi)的數(shù)字),他還是會被視為合作者——要是沒有洛克條款的話。
這東西的地位有爭議。布坎南說它是最強補?。ɡ碛扇缥宜觯?,盡管是在反對的立場上。如果你沒看到,注意布坎南論文的尾注。
丹尼爾森則認為它不夠基礎(chǔ)主義,也是道德預(yù)設(shè)(聽起來很像諾齊克在保護大家的財產(chǎn)權(quán))。
我也認為丹尼爾森這種看法是誤讀。洛克條款作為一種道德約束,通過這些剛好被證明,是理性必然得出的。
rough equality clause
這一點高蒂爾繼承了霍布斯洛克等契約論前輩。人們大概是心智平等的。
3.2 Distribution of cooperation surplus
第二個階段是理性地選擇一種對合作盈余的分配方式。最小最大相對讓步(minimax relative concession, MRC)。
作為一種分配方式的規(guī)范,它被批評沒有現(xiàn)實可操作性。其實,只有這種批評恰恰說明它的數(shù)學(xué)證成沒有問題。我們先放過它。
4 Critique from Buchanan and others
高蒂爾的正義理論完成了。沒有任何道德預(yù)設(shè),非常完美——但是真的嗎?
4.1 Justice as Reciprocity vs. subject-centered conceptions of justice
在洛克條款那里我們提到過,零貢獻或負貢獻者(主要指不勞而獲的人)被排除在合作范圍之外;鑒于道德約束只在合作協(xié)議范圍內(nèi)生效,我們對這些人是不需要遵守道德約束的,換言之,我們無需正義地對待他們?;セ菡x的權(quán)利賦予根據(jù)于行動者影響博弈矩陣的策略性能力。
其實到此為止,不需要具體的例子我們也可能覺得毛骨悚然了:他們是在說,就算我是人,我也沒有任何基本權(quán)利;想要基本權(quán)利和道德對待?那就做貢獻。
布坎南指出,有一個令人不安的后果,那就是同樣作為零貢獻/負貢獻者的重度殘障人士,也被排除在合作范圍外了。洛克條款不再保護他們,這意味著,他們的境況可以被惡化,用來優(yōu)化另一些人的境況。布坎南舉了人體實驗的例子。
這種設(shè)計如果是為了使不勞而獲者承擔(dān)責(zé)任,可能還沒人說話,但也會有人覺得過于殘酷;但要是并非自愿成為的零貢獻者也得承擔(dān)一樣的責(zé)任,我們都不免覺得不妥當。
而一個主體中心的正義理論,是不會把基本權(quán)利建立在策略能力基礎(chǔ)上的,取而代之的是,非策略能力或者需求——這個人本身的特征。比如說,因為我是人,我就有基本權(quán)利,這是人的特征帶來的。(這條東西的爭論,按照布坎南在腳注里寫的,至少局限在胎兒。)
但即便到這里,高蒂爾孝子還是可以嘴硬一句:你們的道德預(yù)設(shè)太多啦!在我看來真正使互惠正義理論破防的是布坎南的下一個批評。
4.2 Influence of cooperation framework on contribution capacities
高蒂爾總是提貢獻、合作盈余、+1-1。我們會本能地疑惑:現(xiàn)實中怎么做算+1,怎么做算-1?或者說,怎樣才算做貢獻?
沒錯,貢獻的標準是多變的。不同的社會合作安排要求不同的技能,而非同一技能的不同等級。(Different cooperative arrangements may demand different skills, not just different levels of excellece of the same skills.)所以可以想見,一個合作安排中的零貢獻者到了另一個合作安排中可能就是正貢獻者了。(例子太多了)
零貢獻者的產(chǎn)生,可能是社會合作框架不正義導(dǎo)致的。但高蒂爾的正義理論沒法衡量框架的正當性,就不能稱為健全了;同理,框架排除哪些人包容哪些人的設(shè)計,也不能視作正當了。
4.3 New versions of RCT?
高蒂爾的RCT全面落后于結(jié)構(gòu)主義版本。這或許是出現(xiàn)4.2批評的原因。
現(xiàn)在嘗試給高蒂爾打補丁。如果他使用的不是簡單理性而是充分理性(提斯庇利斯的版本),也就是說他將承認沒有獨立的理性選擇可以衡量,這些都是內(nèi)嵌于政治和社會的制度語境的,能不能補上互惠正義缺的營養(yǎng)?(你們討論吧。)