
01 做一個(gè)多模型思考者
要想成為一個(gè)有智慧的人,你必須擁有多個(gè)模型。而且,你必須將你的經(jīng)驗(yàn),無論是間接的,還是直接的,都放到構(gòu)成這些模型的網(wǎng)格上。
查理·芒格(Charlie Munger)
多模型思維具有十分重要的實(shí)用價(jià)值。運(yùn)用這種思維方式,你就能更好地理解復(fù)雜現(xiàn)象,就能更好地推理。你將會(huì)在職業(yè)生涯、社區(qū)活動(dòng)和個(gè)人生活中表現(xiàn)出更小的差距,做出更加合理的決策。是的,你甚至還可能會(huì)變得更有智慧。
如今,用模型組織和解釋數(shù)據(jù)的能力,已經(jīng)成了商業(yè)策略家、城市規(guī)劃師、經(jīng)濟(jì)學(xué)家、醫(yī)療專家、工程師、精算師和環(huán)境科學(xué)家等專業(yè)人士的“核心競爭力”。任何人,只要想分析數(shù)據(jù)、制訂業(yè)務(wù)發(fā)展策略、分配資源、設(shè)計(jì)產(chǎn)品、起草協(xié)議就必須應(yīng)用模型,哪怕是做出一個(gè)簡單招聘決策,也要運(yùn)用模型思維。因此,掌握本書的內(nèi)容,特別是那些涉及創(chuàng)新、預(yù)測、數(shù)據(jù)處理、學(xué)習(xí)和市場準(zhǔn)入時(shí)間選擇的模型,對許多人都有非常重要的實(shí)際價(jià)值。
使用模型來思考能夠帶給你的,遠(yuǎn)遠(yuǎn)不僅僅是工作績效的提高。它還會(huì)使你成為一個(gè)更優(yōu)秀的人,讓你擁有更強(qiáng)的思考能力。你將更擅長評估層出不窮的經(jīng)濟(jì)事件和政治事件,更能識別出自己和他人推理中的邏輯錯(cuò)誤。有了這種思維方式,你將懂得辨識什么時(shí)候意識形態(tài)取代了理性思考,并對各種各樣的政策建議有更豐富、更有層次的洞見,無論是擴(kuò)建城市綠地的建議,還是強(qiáng)制藥物檢測的規(guī)定。
所有這些好處都來自與多種多樣模型的“親密接觸”。你用不著一下子掌握千百種模型,而只需先掌握幾十種就足夠了。
盡管單個(gè)模型本身可能就已經(jīng)相當(dāng)強(qiáng)大了,但是一組模型可以實(shí)現(xiàn)更多的功能。在擁有多個(gè)模型的情況下,我們能夠避免每個(gè)模型本身所固有的局限性。多模型方法能夠消除每個(gè)單個(gè)模型的盲點(diǎn)。基于單一模型的政治選擇可能忽略了世界的一些重要特征,如收入差距、身份多樣性以及與其他系統(tǒng)的相互依賴關(guān)系。 有了多個(gè)模型,我們可以達(dá)成對多個(gè)流程的邏輯推理,可以觀察不同因果過程是如何重疊和相互作用的,也擁有了理解經(jīng)濟(jì)、政治和社會(huì)世界復(fù)雜性的可能。而且,我們在這樣做的時(shí)候并不需要放棄嚴(yán)謹(jǐn)性,因?yàn)槟P退季S能夠確保邏輯的一致性。由此,推理將建立在扎實(shí)的證據(jù)基礎(chǔ)之上,因?yàn)槟P托枰脭?shù)據(jù)檢驗(yàn)、改進(jìn)和精煉??偠灾?,當(dāng)我們的思維得以在多個(gè)邏輯上一致、處在通過了經(jīng)驗(yàn)驗(yàn)證的框架中時(shí),我們更有可能做出明智的選擇。
對于使用模型的人來說,模型思維的興起還有一個(gè)更簡單的解釋:模型能夠讓我們變得更聰明。如果沒有模型,人們就會(huì)受到各種認(rèn)知偏差的影響:我們會(huì)對近期發(fā)生的事件賦予過高的權(quán)重、會(huì)根據(jù)“合理程度”分配概率、會(huì)忽略各種基本比率。如果沒有模型,我們處理數(shù)據(jù)的能力就會(huì)受到極大的限制。有了模型,我們就能澄清相關(guān)假設(shè)且更有邏輯地進(jìn)行思考,還可以利用大數(shù)據(jù)來擬合、校準(zhǔn)、檢驗(yàn)因果關(guān)系與相關(guān)性。總之,有了模型,我們的思考會(huì)更有效。有證明表明,如果讓模型與人面對面直接“競爭”,模型將會(huì)勝出。?
盡管多模型方法看上去似乎很平常,但請注意,它其實(shí)是與我們講授模型和構(gòu)建模型的傳統(tǒng)方法相悖的。傳統(tǒng)的方法,那些在高中時(shí)老師教授的方法,依賴一對一的邏輯,也就是說一個(gè)問題需要一個(gè)模型。比如,老師會(huì)告訴我們,在這種情況下,我們應(yīng)該運(yùn)用牛頓第一定律;在那種情況下,我們應(yīng)該運(yùn)用牛頓第二定律;在第三種情況下,則應(yīng)該運(yùn)用牛頓第三定律。又或者,在這里,我們應(yīng)該使用復(fù)制因子方程(replicator equation)來說明下一期兔子種群的大小。在這種傳統(tǒng)的方法中,目標(biāo)是確定一個(gè)適當(dāng)?shù)哪P筒⒄_應(yīng)用這個(gè)模型。而多模型思維所要挑戰(zhàn)的,恰恰正是這種傳統(tǒng)方法。多模型方法主張嘗試多個(gè)模型。如果你在九年級時(shí)就使用過多模型思維,你可能會(huì)被阻止,但是現(xiàn)在使用多模型思維,你將會(huì)取得很大進(jìn)步。
模型的假設(shè)和結(jié)構(gòu)各不相同。有些模型描述了少量理性的、自私的行為主體之間的互動(dòng),有些模型則描述了大量的遵循規(guī)則的利他主義者的行為。一些模型描述了均衡過程,還有一些模型討論路徑依賴性和復(fù)雜性。這些模型的用途也各不相同。一些模型是用來幫助預(yù)測和解釋的,一些模型是用來指導(dǎo)行動(dòng)、推動(dòng)設(shè)計(jì)或促進(jìn)溝通的,還有一些模型則創(chuàng)造了有待我們?nèi)ヌ剿鞯奶摂M世界。
所有模型都有三個(gè)共同特征:
第一,它們都要簡化,剝離不必要的細(xì)節(jié),抽象掉若干現(xiàn)實(shí)世界中的因素,或者需要從頭重新創(chuàng)造。
第二,它們都是形式化的,要給出精確的定義。模型通常要使用數(shù)學(xué)公式,而不是文字。模型可以將信念表示為世界狀態(tài)的概率分布,可以將偏好表示為各備選項(xiàng)之間的排序。通過簡化和精確化,模型可以創(chuàng)造易于處理的空間,我們可以在這些空間上進(jìn)行邏輯推理、提出假說、設(shè)計(jì)解決方案和擬合數(shù)據(jù)。模型創(chuàng)建了我們能夠以符合邏輯的方式進(jìn)行思考的結(jié)構(gòu)。
第三,所有模型都是錯(cuò)誤的,因?yàn)樗鼈兌际呛喕?,它們省略掉了?xì)節(jié)。通過同時(shí)考慮多個(gè)模型,我們可以實(shí)現(xiàn)多個(gè)可能情況的交叉,從而克服單個(gè)模型因嚴(yán)格而導(dǎo)致的狹隘性。
只依靠單個(gè)模型其實(shí)是過于狂妄自大的表現(xiàn),這種做法會(huì)導(dǎo)致災(zāi)難性的后果。相信只憑一個(gè)方程,就可以解釋或預(yù)測復(fù)雜的現(xiàn)實(shí)世界現(xiàn)象,會(huì)使真理成為那種很有“魅力”的簡潔的數(shù)學(xué)公式的犧牲品。
事實(shí)上,我們永遠(yuǎn)不應(yīng)指望任何一個(gè)模型能夠準(zhǔn)確預(yù)測1萬年后的海平面將上升多少,甚至也不應(yīng)該指望任何一個(gè)模型能夠準(zhǔn)確預(yù)測10個(gè)月后的失業(yè)率。我們需要同時(shí)利用多個(gè)模型才能理解復(fù)雜系統(tǒng)。政治、經(jīng)濟(jì)、國際關(guān)系或者大腦等復(fù)雜系統(tǒng)永遠(yuǎn)都在變化,時(shí)刻都會(huì)涌現(xiàn)出介于有序和隨機(jī)之間的結(jié)構(gòu)和模式。當(dāng)然,根據(jù)定義,復(fù)雜現(xiàn)象肯定是很難解釋或預(yù)測的。?
因此在這里,我們面臨著一個(gè)嚴(yán)重的脫節(jié)。一方面,我們需要模型來連貫地思考。另一方面,任何只具有少數(shù)幾個(gè)活動(dòng)部件的單個(gè)模型都無法解釋高維度的復(fù)雜現(xiàn)象。即便是牛頓,也無法寫出一個(gè)能夠解釋就業(yè)水平、選舉結(jié)果或犯罪率下降趨勢的三變量方程。如果我們希望了解傳染病的傳播機(jī)制、教育成效的變化、動(dòng)植物種類的多樣性、人工智能對就業(yè)市場的沖擊、人類活動(dòng)對地球氣候的影響,或者社會(huì)動(dòng)亂的可能性,就必須通過多個(gè)模型去了解它們:機(jī)器學(xué)習(xí)模型、系統(tǒng)動(dòng)力學(xué)模型、博弈論模型和基于主體的模型等。
智慧層次結(jié)構(gòu)
我們迷失于知識中的智慧到哪里去了?我們迷失于信息中的知識到哪里去了?我們迷失于數(shù)據(jù)中的信息到哪里去了?
把這個(gè)疑問形式化為一個(gè)智慧層次結(jié)構(gòu)(wisdom hierarchy)。
最底部是數(shù)據(jù),也就是原始的、未編碼的事件、經(jīng)歷和現(xiàn)象。出生、死亡、市場交易、投票、音樂下載、降水、足球比賽,以及各種各樣的(物種)發(fā)生事件等。數(shù)據(jù)既可以是一長串的0和1,也可以是時(shí)間戳,或是頁面之間的鏈接等。數(shù)據(jù)是缺乏意義、組織或結(jié)構(gòu)的。
信息用來給數(shù)據(jù)命名并將數(shù)據(jù)歸入相應(yīng)的類別。為了說明數(shù)據(jù)與信息之間的區(qū)別,看看這幾個(gè)例子:落在你頭上的雨是數(shù)據(jù),佛蒙特州伯靈頓市和安大略湖的7月份總降水量則是信息;威斯康星州麥迪遜市國會(huì)大廈旁邊周六市場上的鮮紅辣椒和金黃玉米是數(shù)據(jù),而農(nóng)民的總銷售額則是信息。
柏拉圖將知識定義為合理的真實(shí)信念。更現(xiàn)代的定義則認(rèn)為知識就是對相關(guān)關(guān)系、因果關(guān)系和邏輯關(guān)系的理解。知識組織了信息,呈現(xiàn)為模型的形式。市場競爭的經(jīng)濟(jì)學(xué)模型、網(wǎng)絡(luò)的社會(huì)學(xué)模型、地震的地質(zhì)學(xué)模型、生態(tài)位形成的生態(tài)學(xué)模型以及學(xué)習(xí)的心理學(xué)模型都體現(xiàn)了知識。這些模型能夠解釋和預(yù)測。
層次結(jié)構(gòu)的基礎(chǔ)就是智慧。智慧就是指識別和應(yīng)用相關(guān)知識的能力。智慧需要多模型思維。有時(shí),智慧體現(xiàn)在懂得如何選出最優(yōu)模型,智慧可以通過求出各種模型的平均結(jié)果來實(shí)現(xiàn),這是在進(jìn)行預(yù)測時(shí)的一種常見做法。采取行動(dòng)時(shí),有智慧的人都會(huì)應(yīng)用多個(gè)模型,就像醫(yī)生會(huì)讓病人做好幾種檢查來幫助診斷一樣。他們使用模型來排除某些行為、選擇某些行為。有智慧的個(gè)人和團(tuán)隊(duì)會(huì)有意讓模型之間相互“對話”,探索不同模型之間的重疊和差異。
智慧包括選擇正確的知識或模型??紤]一下這個(gè)物理問題:一個(gè)小小的毛絨玩具獵豹從一架飛在6千米高的飛機(jī)上掉下來,當(dāng)它著地時(shí)會(huì)造成多大的傷害?學(xué)生可能已經(jīng)掌握了引力模型和自由降落速度模型。這兩個(gè)模型會(huì)給出不同的答案。引力模型的預(yù)測是,這個(gè)玩具獵豹會(huì)撕裂汽車的頂棚。自由降落速度模型的預(yù)測則是這個(gè)玩具獵豹的最高速度可以達(dá)到每小時(shí)16千米。?
在這個(gè)毛絨玩具的問題上,要想得到正確的答案需要信息(這個(gè)玩具的重量)、知識(自由降落速度模型)和智慧(選擇正確的模型)。
做一個(gè)多模型思考者
我們生活在一個(gè)充斥著信息和數(shù)據(jù)的時(shí)代。同時(shí),這些數(shù)據(jù)得以產(chǎn)生的技術(shù)條件還極大地縮短了時(shí)間和空間上的距離。它們讓經(jīng)濟(jì)、政治和社會(huì)行動(dòng)者變得更加敏捷,能夠在一瞬間就對經(jīng)濟(jì)和政治事件做出反應(yīng)。它們還增加了連通性,因而也增加了復(fù)雜性??紤]到這種復(fù)雜性,任何單個(gè)模型都更有可能遭到失敗。當(dāng)然,我們不應(yīng)該拋棄模型,恰恰相反,我們應(yīng)該將邏輯一致性置于比直覺更優(yōu)先的位置;我們不能滿足于雙重模型、三重模型甚至四重模型,我們要成為多模型思考者。
要成為一個(gè)多模型思考者,必須學(xué)習(xí)掌握多種模型,我們可以從中獲得實(shí)用的知識,需要理解對模型的形式化描述,并知道如何應(yīng)用它們。當(dāng)然,我們也不一定非要成為專家不可。構(gòu)建模型是一門藝術(shù),只能通過不斷實(shí)踐才能熟練掌握,這不是一項(xiàng)以觀賞為目的的活動(dòng),需要刻意地練習(xí)。在建模中,數(shù)學(xué)和邏輯扮演著專家教練的角色,它們會(huì)糾正我們的缺漏。
02 模型的7大用途
在學(xué)校里,我們應(yīng)用模型來解釋數(shù)據(jù)。在現(xiàn)實(shí)世界中,我們應(yīng)用模型來預(yù)測、設(shè)計(jì)和采取行動(dòng),也可以使用模型來探索新思想和新的可能性,還可以利用模型來交流思想、增進(jìn)理解。
模型的價(jià)值還體現(xiàn)在,它們能夠把特定結(jié)果所需要的條件清晰地揭示出來。我們所知道的大多數(shù)結(jié)論都只是在某些情況下成立。
構(gòu)建模型的3種方法
1 具身法(embodiment approach)。用這種方法構(gòu)建的模型包括重要部分,同時(shí)對于不必要的維度和屬性,要么剝離,要么將它們整合在一起考慮。
2 類比法(analogy approach),可以對現(xiàn)實(shí)進(jìn)行類比與抽象。
相比而言,具身法更強(qiáng)調(diào)現(xiàn)實(shí)主義,而類比法則致力于刻畫過程、系統(tǒng)或現(xiàn)象的本質(zhì)。當(dāng)一位物理學(xué)家假設(shè)不存在摩擦,同時(shí)又以其他方式做出符合現(xiàn)實(shí)的假設(shè)時(shí),他所采用的就是具身法。當(dāng)一位經(jīng)濟(jì)學(xué)家將相互競爭的公司視為不同的物種并在此基礎(chǔ)上定義產(chǎn)品利基時(shí),就是在做類比,用一個(gè)模型來表示不同的系統(tǒng)。但是,在具身法與類比法之間并沒有一條明確的界限。
3 另類現(xiàn)實(shí)法(alternative reality approach),也就是有意不去表征、不去刻畫現(xiàn)實(shí)。這類模型可以作為分析和計(jì)算的“演練場”,我們可以利用這類模型探索各種各樣的可能性。這種方法使我們能夠發(fā)現(xiàn)適用于物理世界和社會(huì)世界之外的一般結(jié)論。這類模型有助于我們更好地理解現(xiàn)實(shí)世界中各種約束條件的含義,比如如果能夠通過空氣安全有效地傳輸能量,那么將會(huì)怎樣?這類模型還允許我們進(jìn)行現(xiàn)實(shí)世界中不可能的(思想)實(shí)驗(yàn):如果我們能夠加快大腦的進(jìn)化,那么將會(huì)怎樣?
無論是表征更復(fù)雜的現(xiàn)實(shí)世界、創(chuàng)造一個(gè)類比,還是建立一個(gè)用來探索思想的虛擬世界,任何一個(gè)模型都必須是易于處理且便于交流的。我們能夠用形式化的語言對模型編碼,比如數(shù)學(xué)符號或計(jì)算機(jī)代碼。在描述模型時(shí),我們不能在不給出正式描述的情況下直接拋出諸如信念或偏好之類的東西。信念通常可以表示為一系列事件或先驗(yàn)的概率分布。而偏好則可以用多種方式來表示,比如用對一組備選項(xiàng)的排序或者一個(gè)數(shù)學(xué)函數(shù)來表示。
模型的7大用途
模型有幾十種用途,不過在這里,我們只專注討論其中的7種用途:推理、解釋、設(shè)計(jì)、溝通、行動(dòng)、預(yù)測和探索。
模型的7大用途(REDCAPE)
推理: 識別條件并推斷邏輯含義。
解釋: 為經(jīng)驗(yàn)現(xiàn)象提供(可檢驗(yàn)的)解釋。
設(shè)計(jì): 選擇制度、政策和規(guī)則的特征。
溝通: 將知識與理解聯(lián)系起來。
行動(dòng): 指導(dǎo)政策選擇和戰(zhàn)略行動(dòng)。
預(yù)測: 對未來和未知現(xiàn)象進(jìn)行數(shù)值和分類預(yù)測。
探索: 分析探索可能性和假說。
R EDCAPE:推理
在構(gòu)建模型時(shí),我們要先確定最重要的行為人(行動(dòng)者)、實(shí)體以及相關(guān)特征。然后,描述這些組成部分如何互動(dòng)和聚合,我們能夠推導(dǎo)出一些東西,并說明原因何在。這樣一來,也就提高了我們的推理能力。邏輯還可以揭示不可能性和可能性。利用模型進(jìn)行推理,我們可以得到精確的,甚至是令人出乎意料的關(guān)系。我們可以發(fā)現(xiàn)自身直覺的制約性。
邏輯也可以揭示數(shù)學(xué)關(guān)系。
當(dāng)我們將模型中推導(dǎo)出來的主張與敘述性主張進(jìn)行比較時(shí),這種“條件性”的威力將會(huì)變得更加明顯,即便后者有經(jīng)驗(yàn)證據(jù)支持時(shí)也是如此。我們先來考慮一下這個(gè)管理名言:重要的事情先做(first thing first)。它說的是,在面對多項(xiàng)任務(wù)時(shí),你應(yīng)該首先完成最重要的那項(xiàng)任務(wù)。這個(gè)原則有時(shí)也被稱為“大石頭優(yōu)先”原則,意思是當(dāng)你要將一些大小不一的石頭裝入一只桶中時(shí),你應(yīng)該先裝入大石頭,如果你先放入小石頭,那么大石頭就放不下了。
“大石頭優(yōu)先”原則,是專家從觀察中總結(jié)出來的,在許多時(shí)候確實(shí)不失為一個(gè)很不錯(cuò)的原則,但是它也不是無條件的?;谀P偷姆椒▽?huì)先對任務(wù)提出具體的假設(shè),然后推導(dǎo)出最優(yōu)規(guī)則。
但是,假設(shè)我們要考慮一個(gè)更加復(fù)雜的任務(wù):在國際空間站上,為若干研究項(xiàng)目分配空間。每個(gè)項(xiàng)目都對有效載荷重量、空間大小和動(dòng)力有一定要求,對宇航員的時(shí)間和認(rèn)知能力也有自己的要求。而且,每個(gè)項(xiàng)目都有做出科學(xué)貢獻(xiàn)的潛在能力。在這個(gè)問題中,即便我們想出了一個(gè)衡量這種“大石頭”(重要性)的方法,對上面這些屬性求加權(quán)平均值的權(quán)重,但在給定的相互依賴性的維度下,“大石頭優(yōu)先”原則也已經(jīng)被證明是一個(gè)相當(dāng)糟糕的原則。更復(fù)雜的算法以及可能的市場機(jī)制則會(huì)更好地發(fā)揮作用。因此,在某些條件下,“大石頭優(yōu)先”原則可能是一個(gè)很好的原則。但是,在另外一些條件下,“大石頭優(yōu)先”原則就不行了。通過利用模型,我們可以劃出一條界線:什么時(shí)候應(yīng)該采用、什么時(shí)候不能采用。
RE DCAPE:解釋
模型為經(jīng)驗(yàn)現(xiàn)象提供了清晰的邏輯解釋。經(jīng)濟(jì)學(xué)模型解釋的是價(jià)格變動(dòng)和市場份額等現(xiàn)象;物理學(xué)模型可以解釋墜落物體的軌跡和軌跡形狀的變化;生物學(xué)模型可以解釋物種的分布;流行病學(xué)模型解釋了傳染病傳播的速度和模式;地球物理學(xué)模型能夠解釋地震的大小和分布。
模型可以解釋點(diǎn)值(point values)和點(diǎn)值的變化。例如,某個(gè)模型可以解釋五花肉期貨的當(dāng)前價(jià)格以及過去6個(gè)月來價(jià)格上漲的原因。
最有效的模型既能解釋簡單的現(xiàn)象,也能解決令人費(fèi)解的問題。教科書中關(guān)于市場的經(jīng)典模型能夠解釋為什么對于像鞋子或薯片這樣正常商品需求的意外增加,會(huì)在短期內(nèi)提高它們的價(jià)格,這是一個(gè)非常直觀的結(jié)果。這些模型還可以解釋,為什么從長期來看,需求增加對價(jià)格的影響會(huì)小于生產(chǎn)商品的邊際成本的影響。需求的增加甚至有可能會(huì)導(dǎo)致價(jià)格下降,這種現(xiàn)象在規(guī)模收益增加的情況下確實(shí)會(huì)出現(xiàn)。這無疑是一個(gè)更令人驚訝的結(jié)果。
有人說,模型可以解釋任何東西。這種說法沒有錯(cuò),模型確實(shí)可以。然而,基于模型的解釋必須包括正式的假設(shè)和明確的因果鏈條,而且這些假設(shè)和因果鏈條都要面對數(shù)據(jù)。例如,有個(gè)模型說,用低被捕概率可以解釋犯罪率的居高不下,這樣的模型就是可檢驗(yàn)的。
RED CAPE:設(shè)計(jì)
模型還可以通過提供框架來幫助設(shè)計(jì),因?yàn)橹挥性谶m當(dāng)?shù)目蚣軆?nèi)我們才可以考慮不同選擇的含義。工程師使用模型設(shè)計(jì)供應(yīng)鏈;計(jì)算機(jī)科學(xué)家使用模型設(shè)計(jì)Web協(xié)議;社會(huì)科學(xué)家使用模型設(shè)計(jì)制度。
REDC APE:交流
由于創(chuàng)造了一種共同的表示方法,模型能夠有效地改進(jìn)交流。模型要求對相關(guān)特征及其關(guān)系給出正式的定義,這使我們能夠精確地進(jìn)行交流。
很多人都低估了交流對人類社會(huì)進(jìn)步的影響。一個(gè)無法交流的思想,就像一棵淹沒在森林中的樹,沒有人會(huì)注意到它。
REDCA PE:行動(dòng)
弗朗西斯·培根曾經(jīng)這樣寫道:“人生的偉大目標(biāo),不在于知,而在于行。”良好的行動(dòng)需要良好的模型。政府、企業(yè)和非營利組織都要使用模型來指導(dǎo)行動(dòng)。無論是提高價(jià)格(降低價(jià)格)、開設(shè)新的分支機(jī)構(gòu)、兼并其他公司、提供全民醫(yī)療保健,還是資助某個(gè)課外計(jì)劃,決策者都要依賴模型。在最重要的行動(dòng)中,決策者要使用多個(gè)復(fù)雜的模型,模型與數(shù)據(jù)緊密相關(guān)。
個(gè)人當(dāng)然也可以這么做。在日常生活中,當(dāng)我們準(zhǔn)備采取某個(gè)重要行動(dòng)時(shí),也應(yīng)該使用模型。例如,在決定購買房屋、更換工作、回到大學(xué)攻讀更高的學(xué)位,或者在決定是購買還是租賃汽車時(shí),都可以使用模型來指導(dǎo)決策。用到的模型可能只是一些定性的模型而不一定有相應(yīng)的數(shù)據(jù)支持,但是多模型思維會(huì)“迫使”我們向自己提出一些重要的問題。
REDCAP E:預(yù)測
模型長期以來被用來預(yù)測。天氣預(yù)報(bào)員、專家、顧問和許多國家中央銀行行長,都在使用模型進(jìn)行預(yù)測。警察機(jī)構(gòu)和情報(bào)部門也使用模型預(yù)測犯罪行為,流行病學(xué)家則使用模型預(yù)測下個(gè)季節(jié)哪種流感病毒將最為流行?,F(xiàn)在,隨著數(shù)據(jù)可得性的提高和精細(xì)度的改進(jìn),利用模型進(jìn)行預(yù)測的做法變得更加常見了。例如,Twitter上的跟帖和谷歌上的搜索關(guān)鍵詞,都已經(jīng)被用于預(yù)測消費(fèi)趨勢和潛在的社會(huì)活動(dòng)了。
模型既可以用來預(yù)測特定的個(gè)別事件,也可以用來預(yù)測一般趨勢。
過去,解釋和預(yù)測往往是齊頭并進(jìn)的。解釋電壓模式的電氣工程模型也可以預(yù)測電壓大小,解釋政客過去投票行為的空間模型也可以預(yù)測他們在未來的投票。
但預(yù)測畢竟是與解釋不同的。有的模型可以用來預(yù)測,但是卻不一定能解釋什么。深度學(xué)習(xí)算法可以預(yù)測產(chǎn)品的銷售情況、明天的天氣變化、價(jià)格演變趨勢和身體健康狀況,但是它們幾乎沒有提供什么解釋。這些模型類似于“嗅彈犬”。盡管這些狗可以利用它們靈敏的嗅覺系統(tǒng)確定一個(gè)包裹是不是包含著爆炸物,但是我們確實(shí)不應(yīng)該要求它們解釋為什么知道那里有炸彈,也不能去問它們工作原理是什么、怎樣才能拆除炸彈。
此外,有些模型有很強(qiáng)的解釋力,但是在預(yù)測上卻沒有什么價(jià)值。板塊構(gòu)造論模型雖然可以解釋地震是怎樣發(fā)生的,但是卻不能預(yù)測地震何時(shí)發(fā)生;動(dòng)力系統(tǒng)模型雖然可以解釋颶風(fēng)是怎樣形成的,但是卻無法準(zhǔn)確預(yù)測颶風(fēng)什么時(shí)候襲來,也不能準(zhǔn)確預(yù)測颶風(fēng)的移動(dòng)路徑;生態(tài)模型雖然可以解釋物種的形成的模式,但是卻無法預(yù)測出現(xiàn)的新物種類型到底是什么。
REDCAPE :探索
最后,我們還會(huì)用模型來探索直覺。這種探索可能與政策相關(guān):如果讓所有城市公交車都免費(fèi),會(huì)怎么樣?如果讓學(xué)生自主選擇作業(yè)來證實(shí)他們的課程成績,會(huì)怎么樣?如果在草坪上標(biāo)出能量消耗數(shù)量,又會(huì)怎么樣?我們可以提出很多假說,而且所有這些假說都可以用模型進(jìn)行探索。我們還可以利用模型來探索某些在現(xiàn)實(shí)世界中不會(huì)出現(xiàn)的情況。如果法國生物學(xué)家拉馬克(Lamarck)的觀點(diǎn)是正確的、如果后天獲得的性狀真的可以遺傳給我們的后代,那么那些把牙齒矯正好了的父母的孩子就再也不需要牙套了嗎?在這樣的世界還會(huì)發(fā)生什么?提出這樣的問題并探索它們的含義可以幫助我們揭示進(jìn)化過程的局限性。暫且將現(xiàn)實(shí)世界的約束丟到一邊,可以極大地激發(fā)我們的創(chuàng)造力。
探索有時(shí)還涉及對共同假設(shè)進(jìn)行跨領(lǐng)域比較。例如,為了理解網(wǎng)絡(luò)效應(yīng),建模者可能會(huì)從一系列程式化的網(wǎng)絡(luò)結(jié)構(gòu)入手,然后追問網(wǎng)絡(luò)結(jié)構(gòu)是不是會(huì)影響以及如何影響合作、傳染病傳播或社會(huì)動(dòng)亂。又或者,建模者可能會(huì)將一系列學(xué)習(xí)模型應(yīng)用于決策、雙人博弈和多人博弈;但是他們這樣做的目的不是為了解釋、預(yù)測、行動(dòng)或設(shè)計(jì),而只是為了探索和學(xué)習(xí)。
當(dāng)我們在實(shí)踐中應(yīng)用一個(gè)模型時(shí),也能以多種方式使用它。同一個(gè)模型既可以用來解釋、預(yù)測,也可以用來指導(dǎo)行動(dòng)。
多模型思維
分類模型
最早的分類模型可以追溯到古希臘時(shí)代。在《范疇篇》(The Categories )一書中,亞里士多德描述了對世界進(jìn)行分類的10個(gè)范疇,包括了實(shí)體(substance)、數(shù)量(quantity)、地點(diǎn)(location)和狀態(tài)(positioning)等,每個(gè)范疇都會(huì)創(chuàng)建不同的類別。
當(dāng)我們使用一個(gè)普通名詞時(shí),“褲子”是一個(gè)類別,“狗”、“勺子”、“壁爐”和“暑假”也是如此。我們就是在使用類別去指導(dǎo)行動(dòng)。我們按種族,比如意大利人、法國人、土耳其人或韓國人,來對餐館進(jìn)行分類,以便決定在哪里吃午餐;按照市盈率對股票進(jìn)行分類,并根據(jù)市盈率高低買賣股票。當(dāng)人們聲稱亞利桑那州的人口之所以增長是因?yàn)樵撝輾夂蛞巳藭r(shí)是在用分類方法進(jìn)行解釋。我們還使用類別進(jìn)行預(yù)測,例如預(yù)計(jì)身為退伍軍人的候選人在選舉中會(huì)有更大的獲勝機(jī)會(huì)。
我們還可以在智慧層次結(jié)構(gòu)中解釋分類模型的作用。對象構(gòu)成了數(shù)據(jù),將對象分為不同類別就能創(chuàng)造出信息,而將估值分配給各個(gè)類別則需要知識。為了評價(jià)孔多塞陪審團(tuán)定理,我們依賴一個(gè)二元分類模型,它將對象或狀態(tài)分為兩個(gè)類別,一類標(biāo)記為“有罪”,另一類標(biāo)記為“無罪”。關(guān)鍵的思想是,相關(guān)屬性的數(shù)量限制了不同類別的數(shù)量,因此也就限制了有用模型的數(shù)量。
如果能構(gòu)建出多個(gè)多樣性的、準(zhǔn)確的模型,我們就可以做出準(zhǔn)確的預(yù)測和估值,并選擇正確的行動(dòng)。加入1個(gè)模型后可以改進(jìn)8%,加入3個(gè)模型后改進(jìn)幅度可以達(dá)到15%。請不要忘記,第二個(gè)和第三個(gè)模型不一定比第一個(gè)模型更好,它們也許會(huì)更糟。但是,即使它們的準(zhǔn)確性稍差,但只要分類(字面意義)有所不同,就應(yīng)該把它們加入進(jìn)來。
創(chuàng)造過多的類別會(huì)導(dǎo)致對數(shù)據(jù)的過度擬合,而過度擬合會(huì)破壞對未來事件的預(yù)測。當(dāng)然,沒有任何一種分類方法是完美的。在每個(gè)類別中,家庭的均值可能會(huì)略有不同,我們稱這種情況稱為分類誤差(categorization error)。
構(gòu)建的類別越大,分類誤差就越大,因?yàn)轭悇e越大,我們就越可能將具有不同均值的家庭集中到同一個(gè)類別中。但是,更大的類別依賴更多的數(shù)據(jù),又可以使我們對每個(gè)類別均值的估計(jì)更加準(zhǔn)確。因估計(jì)均值錯(cuò)誤而出現(xiàn)的誤差稱為估值誤差(valuation error)。估值誤差隨類別數(shù)量的增加而減少。如果不同家庭的月支出不同,那么包含一個(gè)家庭的類別(甚至包含10個(gè)家庭的類別也一樣)將無法準(zhǔn)確估計(jì)均值,但包含1 000個(gè)家庭的類別則能夠準(zhǔn)確地估計(jì)均值。
對人類行為者建模
怎樣對人進(jìn)行建模?在接下來將要給出的眾多模型中,人都將成為分析的基本單元。我們將構(gòu)建關(guān)于人們投票、合作、參與時(shí)尚活動(dòng)、投資退休賬戶,以及毒品上癮的模型。在每一個(gè)模型中,我們都必須對“人”做出假設(shè):他們的目標(biāo)是什么?他們是只關(guān)心自己的利己主義者還是利他主義者?他們可能采取的行動(dòng)是什么?他們?nèi)绾芜x擇自己要采取的行動(dòng)?或者說他們是否擁有選擇權(quán)?
我們可以為每個(gè)模型構(gòu)建任意的特殊假設(shè),但這種做法會(huì)引起混亂并錯(cuò)過真正的機(jī)會(huì)。如果這樣做,最終將只剩下一組特殊的構(gòu)造,而且每一次要構(gòu)建新模型時(shí),都需要對人們的行為方式進(jìn)行新的思考。由此產(chǎn)生的異質(zhì)性會(huì)限制我們思考和組合模型的能力,我們將不可能成為有效率的多模型思考者。
我們遵循的方法強(qiáng)調(diào)一致性和多樣性。或者將人建模為基于規(guī)則的行為者(rule-based actor),或者將人建模為理性行為者(rational actor)。在基于規(guī)則的行為者集合中,我們考慮那些基于簡單固定規(guī)則行事的人以及基于適應(yīng)性規(guī)則行事的人。基于適應(yīng)性規(guī)則行事的人能夠根據(jù)信息、過去的成功或者通過觀察他人的行為而改變自己的行為。
我們怎樣對人建模,歸根到底取決于問題的背景和想要實(shí)現(xiàn)的目標(biāo)。我們是在預(yù)測還是在解釋?是在評估政策行動(dòng)嗎?是在嘗試設(shè)計(jì)一種制度嗎?或者,是在探索?在低風(fēng)險(xiǎn)的環(huán)境中,例如要構(gòu)建一個(gè)預(yù)測人們會(huì)購買什么顏色的外套或者他們會(huì)不會(huì)在看完演出后起立鼓掌的模型時(shí),我們通常會(huì)假設(shè)人們采用固定規(guī)則。而在構(gòu)建關(guān)于人們決定是不是要合作創(chuàng)業(yè)或信任他人的模型時(shí),我們假設(shè)人們會(huì)學(xué)習(xí)和適應(yīng)。而在高風(fēng)險(xiǎn)的環(huán)境中,我們將假設(shè)知曉相關(guān)信息的、經(jīng)驗(yàn)豐富的人會(huì)做出最佳選擇。
基于這種經(jīng)驗(yàn),許多人推斷,構(gòu)建正式的模型需要一種狹隘的、不切實(shí)際的“人性觀”,也就是說,必須假設(shè)所有人都是自私的,而且從來不會(huì)犯錯(cuò)。但事實(shí)并非如此。事實(shí)上,即便是經(jīng)濟(jì)學(xué)家也不會(huì)這樣認(rèn)為。在經(jīng)濟(jì)學(xué)的前沿領(lǐng)域,早就出現(xiàn)了包含不完全信息和異質(zhì)性行為主體的模型。在這些模型中,行為者會(huì)根據(jù)他們所了解到的東西做出調(diào)整,他們有時(shí)(盡管不總是)會(huì)關(guān)心他人的收益。當(dāng)然,人們會(huì)在何種程度上表現(xiàn)出涉他偏好(other-regarding preferences)則取決于具體情況。例如,當(dāng)向慈善機(jī)構(gòu)捐款或從事志愿工作時(shí),一個(gè)人可能會(huì)顯得比在購房時(shí)更加關(guān)心他人。
對人建模的挑戰(zhàn)
對人建模是一個(gè)很大的挑戰(zhàn),雖然模型要求低維表征,但人卻是天生無法簡單地加以表征的。人是多樣性的、易受社會(huì)影響的、容易出錯(cuò)的、有目的的、有適應(yīng)能力且擁有自己主體性的,也就是說,我們有行動(dòng)的能力。
相比之下,諸如碳原子和臺(tái)球之類的物理對象是沒有上述這6個(gè)屬性的。碳原子不具備多樣性,盡管它們可以在化合物中占據(jù)不同的位置,例如在丙烷中。碳原子從不違反物理定律,也不會(huì)主導(dǎo)有目的的生命。它們不會(huì)根據(jù)過去的經(jīng)驗(yàn)改變自己的行為,沒有主體性,也不會(huì)發(fā)起行動(dòng)或轉(zhuǎn)行。因此,社會(huì)科學(xué)家會(huì)時(shí)不時(shí)地諷刺:如果電子可以思考,那么物理學(xué)就會(huì)面臨非常大的困難。如果電子也擁有構(gòu)建模型的能力,那么物理學(xué)無疑會(huì)變得更加困難。
我們可以從多樣性所帶來的問題開始討論。人們的偏好、行動(dòng)能力不同,形成的社交網(wǎng)絡(luò)、利他主義傾向以及分配給不同行動(dòng)的認(rèn)知資源(注意力)也有所不同。如果每個(gè)人都一樣,那么建模工作就會(huì)輕松得多。有時(shí)我們會(huì)根據(jù)統(tǒng)計(jì)原理假設(shè)行為的多樣性可以相互抵消。例如,我們可以構(gòu)建一個(gè)模型,預(yù)測慈善捐贈(zèng)額是收入水平的函數(shù)。對于給定的收入水平和稅率,有些人可能比我們所假設(shè)的(偏好)更利他,而另一些人則可能比假設(shè)的更利己。如果偏離模型的偏差達(dá)到平均值(在第5章中,我們將給出一些能夠解釋為什么會(huì)是這樣的分布模型),那么這個(gè)模型的預(yù)測就可能是準(zhǔn)確的。當(dāng)然,除非不同人的行動(dòng)是相互獨(dú)立的,否則不會(huì)出現(xiàn)多樣性可以抵消掉的結(jié)果。在行為受到社會(huì)影響的時(shí)候,極端行為會(huì)產(chǎn)生溢出效應(yīng)(spillovers)。當(dāng)政治活動(dòng)家鼓動(dòng)選民時(shí),就會(huì)發(fā)生這種情況。在下文中模擬社會(huì)騷亂時(shí),我們會(huì)討論多樣性的這種影響。
人們所犯的錯(cuò)誤是否能夠相互抵消,取決于具體情境。認(rèn)知依戀(cognitive attachment)缺失導(dǎo)致的誤差就可能是隨機(jī)且獨(dú)立的,認(rèn)知偏差導(dǎo)致的誤差可能是系統(tǒng)性的、相關(guān)的。人們對最近發(fā)生的事件往往更加重視,并且更容易回憶起故事性的情節(jié)而不是統(tǒng)計(jì)數(shù)字。這類共同偏差不會(huì)被消除。
還有一個(gè)挑戰(zhàn)與人們所渴望得到的東西有關(guān)。構(gòu)建與人相關(guān)的模型時(shí),一個(gè)主要的挑戰(zhàn)是如何準(zhǔn)確評估他們的目標(biāo)和目的。有些人渴望財(cái)富和名聲,有些人則希望為自己所在的社區(qū)乃至全世界變得更好做出貢獻(xiàn)。在理性行為者模型中,我們直接以函數(shù)的形式表示一個(gè)人的收益。在基于規(guī)則的模型中,目的可能更加隱而不露。這是一種行為規(guī)則,人們愿意生活在一個(gè)“融合”的社區(qū)中,但如果與自己同一種族的人在社區(qū)中的比例低于10%,人們就選擇離開。這樣的規(guī)則顯然包括人們對自己渴望得到的東西的信念。
對人建模的最后一個(gè)挑戰(zhàn)來自人的主體性:我們有采取行動(dòng)的能力,改變行為的能力以及學(xué)習(xí)的能力。也就是說,在某些情況下,人類可能是一種“習(xí)慣生物”:行動(dòng)可能會(huì)超出我們的控制范圍。也很少有人會(huì)主動(dòng)選擇沉迷于阿片類藥物或貧窮。但是,歸根到底是人們采取的行動(dòng)產(chǎn)生了這些結(jié)果。
通常,當(dāng)人們采取的行動(dòng)產(chǎn)生了不好的結(jié)果時(shí),他們會(huì)修正自己的行為。我們可以通過在模型中加入學(xué)習(xí)來捕捉這一點(diǎn)。人們采取的學(xué)習(xí)方式因環(huán)境而異。為了搞清楚自己需要學(xué)習(xí)多少個(gè)小時(shí)才能在考試中取得好成績,或者自己需要每個(gè)星期鍛煉多少次才能保持好身材時(shí),人們可以根據(jù)個(gè)人經(jīng)歷或通過內(nèi)省來學(xué)習(xí)。而在了解要到哪家雜貨店購買食品,或者要不要為某個(gè)慈善項(xiàng)目捐款時(shí),人們可以通過觀察他人來學(xué)習(xí)。
人的這6個(gè)特征的每一個(gè)都是潛在的模型特征。如果建模時(shí)決定只包含一個(gè)特征,那么我們還必須決定在多大程度上來體現(xiàn)它。例如,我們要如何使演員變得多樣性?需要包括多少社會(huì)影響力?人們會(huì)向他人學(xué)習(xí)嗎?要如何定義目標(biāo)?能擁有多大的主體性?我們所擁有的主體性(或活力)可能比自己所認(rèn)為的要少。
理性行為者模型
理性行為者模型假設(shè)人們在給定收益或效用函數(shù)的情況下做出最優(yōu)選擇。這里所說的行為既可以是決策,其收益只取決于行為者個(gè)人的行為;也可以發(fā)生在博弈中,其收益取決于其他人的行為。在同時(shí)進(jìn)行選擇或信息不完全的博弈中,理性行為者模型還需要設(shè)定關(guān)于其他人將會(huì)做什么的信念。
理性行為者模型
行為者個(gè)體的偏好由在一組可能的行為上定義的數(shù)學(xué)形式的效用函數(shù)或收益函數(shù)(payoff function)來表示。行為個(gè)體選擇函數(shù)值最大化的行動(dòng)。在博弈中,這種選擇可能需要相信其他博弈參與者的行為。
我們可以用數(shù)據(jù)估計(jì)函數(shù),可以推導(dǎo)出最優(yōu)行為,還可以通過更改參數(shù)值來提出各種各樣“如果……將會(huì)怎樣”的問題。
除了人們進(jìn)行優(yōu)化這一可疑主張外,人們違背獨(dú)立性和傳遞性的假設(shè)導(dǎo)致許多人質(zhì)疑理性行為者模型的廣泛使用,特別是經(jīng)濟(jì)學(xué)家。但是,作為建模者,我們有充分的理由采用理性行為者模型。
第一,人們往往會(huì)表現(xiàn)得“似乎”在最優(yōu)化。他們可能會(huì)應(yīng)用產(chǎn)生近似最優(yōu)行為的規(guī)則。
第二,即便人們確實(shí)會(huì)犯錯(cuò),但在重復(fù)的情況下,人們的學(xué)習(xí)能力也會(huì)推動(dòng)人們接近最優(yōu)行為。
第三,在“賭注”(利害關(guān)系)很大的情況下,人們更應(yīng)該投入足夠的時(shí)間和精力來做出接近最優(yōu)的選擇。
第四,理性行為者模型簡化了分析。大多數(shù)效用函數(shù)都只有一個(gè)唯一的最優(yōu)行為。一個(gè)人可以有上千種次優(yōu)行為,說人們沒有實(shí)現(xiàn)最優(yōu),就打開了一個(gè)擁有巨大可能性的盒子。
第五,理性行為者假設(shè)保證了內(nèi)部一致性。如果模型假設(shè)了次優(yōu)行為且模型在公共域中,它就可以用來學(xué)習(xí)。人們可以改變自己的行為,可能不會(huì)最優(yōu)化,但除了最優(yōu)之外的任何假設(shè)都會(huì)受到批評,也就是不一致。
第六,有人認(rèn)為這是最重要的一個(gè)原因,也就是理性可以作為基準(zhǔn)。 在設(shè)計(jì)政策、做出預(yù)測或選擇行動(dòng)時(shí),我們應(yīng)該考慮如果人有理性偏好并且進(jìn)行最優(yōu)化時(shí)會(huì)發(fā)生什么。這種做法可能幫助我們找出思維中存在的缺陷。還應(yīng)該接受這樣一種可能性,也就是這種做法會(huì)使我們得出這樣的結(jié)論:理性行為者模型不適用,我們應(yīng)該選擇其他模型。有鑒于此,我們可能會(huì)再增加第七個(gè)原因:多模型思維。如果人們應(yīng)用多模型方法,犯錯(cuò)的可能性就會(huì)大大減少。
選擇理性行為者模型的理由
“似乎”: 基于智能規(guī)則做出的行為可能與最優(yōu)或近似最優(yōu)行為無法區(qū)分。
學(xué)習(xí): 在重復(fù)的情況下,人們應(yīng)該能夠接近最優(yōu)行為。
大的“賭注”: 在重大決策中,人們會(huì)收集信息并認(rèn)真思考。
唯一性: 最優(yōu)行為通常是唯一的,從而使模型成為可檢驗(yàn)的。
一致性: 最優(yōu)行為創(chuàng)建一致的模型。如果人們學(xué)會(huì)了利用這樣的模型,就不會(huì)改變自己的行為。
基準(zhǔn): 最優(yōu)行為提供了一個(gè)基準(zhǔn),作為人們認(rèn)知能力的上限。
損失厭惡和雙曲貼現(xiàn)
理性行為者模型受到心理學(xué)家、經(jīng)濟(jì)學(xué)家和神經(jīng)科學(xué)家的挑戰(zhàn)。他們指出,這種模型與人類的行為方式不符。來自實(shí)驗(yàn)室和自然實(shí)驗(yàn)的經(jīng)驗(yàn)證據(jù)表明,人在決策時(shí)會(huì)受到各種各樣的偏差(包括現(xiàn)狀偏差)的影響。我們在進(jìn)行概率計(jì)算時(shí)會(huì)忽略基本比率,對確定的事情賦予的權(quán)重過高,也會(huì)表現(xiàn)出損失厭惡。
我們已經(jīng)掌握了大量支持區(qū)分兩種思維方式的證據(jù):快速、直觀的基于規(guī)則的思考(快思考)和深思熟慮(慢思考)??焖伎几菀资艿缴鲜龈鞣N偏差的影響。 從長遠(yuǎn)來看,我們可以從大腦的結(jié)構(gòu)中推斷出一些行為模型,但是一定要記住,大腦具有巨大的可塑性。能夠通過慢思考來克服各種偏差。
在嘗試構(gòu)建更符合現(xiàn)實(shí)的模型時(shí),我們必須牢記易處理性這個(gè)原則。更符合現(xiàn)實(shí)的模型可能需要更復(fù)雜的數(shù)學(xué)。這些困難或擔(dān)憂當(dāng)然并不意味著我們必須放棄那些心理現(xiàn)實(shí)行為模型,但它們確實(shí)意味著我們應(yīng)該謹(jǐn)慎行事,并將更多的注意力放到那些已經(jīng)得到很好證明的行為規(guī)律上。
下面就來討論兩種已經(jīng)多次復(fù)制成功的偏差:損失厭惡和雙曲貼現(xiàn)(hyperbolic discounting)。損失厭惡是指面對收益時(shí),人們表現(xiàn)為風(fēng)險(xiǎn)厭惡,面對損失時(shí),人們卻表現(xiàn)為風(fēng)險(xiǎn)偏好。
例如,人們更偏好肯定能贏得400美元,而不怎么喜歡有機(jī)會(huì)贏得1 000美元的彩票。然而,他們卻更愿意選擇有可能損失1 000美元的彩票,而不愿意選擇肯定會(huì)損失600美元。同樣的不一致性也延伸到非貨幣領(lǐng)域。醫(yī)生在收益情境時(shí)的選擇是風(fēng)險(xiǎn)厭惡的,而當(dāng)備選方案以損失的形式呈現(xiàn)給他們時(shí),他們則愿意冒更大的風(fēng)險(xiǎn)。
前景理論:示例
收益框架: 有兩個(gè)備選方案。
備選方案A:肯定可以贏得400美元。
備選方案B:如果硬幣正面朝上,可以贏得1 000美元;如果背面朝上,什么也得不到。
損失框架: 先給你1 000美元,然后給你兩個(gè)備選方案。
備選方案:肯定會(huì)損失600美元。
備選方案 :如果硬幣正面朝上,不會(huì)損失什么;如果背面朝上,你將損失1 000美元。
在這里,A和是等價(jià)的,B和 也是等價(jià)的。根據(jù)前景理論,會(huì)有更多的人選擇A和 。
總之,根據(jù)對模型用途的設(shè)想,我們可以選擇假設(shè)損失厭惡和雙曲貼現(xiàn),只要這些假設(shè)似乎更能匹配大多數(shù)人的行為。但我們也可以不這樣做,主要原因是,它們可能使模型更加復(fù)雜,而不能改變我們所發(fā)現(xiàn)的東西的性質(zhì);或者,如果假設(shè)雙曲貼現(xiàn),模型可能產(chǎn)生不符合實(shí)際的行為。
基于規(guī)則的模型
現(xiàn)在討論基于規(guī)則的模型?;谧顑?yōu)化的模型假設(shè)人們最大化的效用函數(shù)或收益函數(shù),而基于規(guī)則的模型則假設(shè)特定的行為。基于規(guī)則的模型可能會(huì)假設(shè),在拍賣中,一個(gè)人的出價(jià)總是比拍賣物品的真實(shí)價(jià)值低10%;或者,如果一個(gè)人的朋友一直可以獲得更高回報(bào)的話,那么這個(gè)人會(huì)“復(fù)制”這位朋友的行為。
許多人將基于最優(yōu)化的模型等同于數(shù)學(xué)(模型),而將基于規(guī)則的模型等同于計(jì)算(模型)。但是基于最優(yōu)化的模型和基于規(guī)則的模型之間的區(qū)別并不像人們想象的那樣清晰。這兩種方法的關(guān)鍵區(qū)別在于它們的基本假設(shè)。在基于最優(yōu)化的模型中,對偏好或收益的假設(shè)是最基本的;而在基于規(guī)則的模型中,對行為的假設(shè)才是最基本的。
行為規(guī)則既可以是固定的,也可以是適應(yīng)性的。固定規(guī)則意味著始終適用相同的算法。正如理性選擇模型可以作為人類認(rèn)知能力的上限,固定規(guī)則模型則可以作為人類認(rèn)知能力的下限。
而適應(yīng)性規(guī)則可以在一系列行為之間切換,演變出新的行為或者復(fù)制其他行為。之所以要采取這些行動(dòng),是為了提高收益。因此,與固定規(guī)則不同,適應(yīng)性規(guī)則需要效用函數(shù)或收益函數(shù)。這種方法的支持者認(rèn)為,在任何情況下,只要人們傾向于采取簡單而有效的規(guī)則,就應(yīng)該采用基于適應(yīng)性規(guī)則的模型,也就是說,既然人們以這種方式行事,那么就得按這種方式來建模。?
毫無疑問,人類行為發(fā)生在零智能與完全理性這兩種極端情況之間,因此構(gòu)建行為個(gè)體利用適應(yīng)性規(guī)則的模型是有意義的。這些規(guī)則應(yīng)該考慮到人們在同一個(gè)領(lǐng)域內(nèi)的認(rèn)知依戀和認(rèn)知能力各不相同這一事實(shí)。因此,我們應(yīng)該期待行為多樣性會(huì)涌現(xiàn)出來,也可以期待群體內(nèi)部的某種一致性。這些也都可以包含在模型當(dāng)中。
總而言之,考慮到對人建模所涉及的復(fù)雜性,我們有充分的理由去利用多種不同的模型。我們可能無法準(zhǔn)確地預(yù)測人們會(huì)做什么,但是也許能夠確定一系列可能性。如果可以的話,就應(yīng)該多構(gòu)建一些模型,我們已經(jīng)從構(gòu)建模型中獲益,因?yàn)槲覀冎罆?huì)發(fā)生什么。
最后,我們呼吁大家保持謙卑和同理心。在構(gòu)建關(guān)于人的模型時(shí),建模者必須非常謙卑。由于面臨著多樣性、社會(huì)的影響、認(rèn)知錯(cuò)誤、目的性和適應(yīng)性等多種挑戰(zhàn),我們的模型不可避免地會(huì)出現(xiàn)這樣那樣的問題,這也正是需要采用多模型方法的原因。嚴(yán)謹(jǐn)?shù)男袨槟P湍軌蚝芎玫財(cái)M合某些情況,并使我們能夠?qū)W⒂诃h(huán)境的其他方面。當(dāng)我們擁有更多更好的數(shù)據(jù)時(shí),更豐富的行為模型將會(huì)更合適。我們必須保持適度的期望。人是多樣性的、易受社會(huì)影響的、容易出錯(cuò)的、有目的的、有適應(yīng)能力且擁有主體性的。怎么能認(rèn)為單一的人類行為模型不會(huì)出錯(cuò)呢?一定會(huì)。我們的目標(biāo)是構(gòu)建許多模型,作為一個(gè)整體,它們將是有用的。
05 正態(tài)分布
我不敢說自己比其他65個(gè)人都更聰明——但是我當(dāng)然要比那65個(gè)人的平均水平更高。
理查德·費(fèi)曼(Richard Feynman)
分布構(gòu)成任何建模者核心知識庫的一部分。從本章開始,我們將利用各種分布來構(gòu)建和分析路徑依賴、隨機(jī)游走、馬爾可夫模型,以及各種搜索模型和學(xué)習(xí)模型。如果想要度量權(quán)力、收入和財(cái)富的不平等,并進(jìn)行統(tǒng)計(jì)檢驗(yàn),也需要關(guān)于分布的知識。在本書中,我們花了篇幅不大的兩章專門討論分布。本章先討論正態(tài)分布(normal distribution),下一章討論冪律分布(長尾分布)。我們都是從建模者而不是從統(tǒng)計(jì)學(xué)家的角度來討論的。作為建模者,我們對兩個(gè)主要問題感興趣:為什么要這樣看待分布?為什么分布很重要?
要解決第一個(gè)問題,就需要重新認(rèn)識分布。分布以數(shù)學(xué)的方式刻畫變量的變差(在某個(gè)類型內(nèi)部的差異)和多樣性(不同類型之間的差異),將變量表示為在數(shù)值上或類別上定義的概率分布。正態(tài)分布的形狀是我們熟悉的鐘形曲線形狀。大多數(shù)物種的高度和重量都滿足正態(tài)分布,它們圍繞著均值對稱分布,而且不會(huì)包含特別大或特別小的事件,例如,我們從來沒有遇到過1米長的螞蟻,也沒有看到過1千克重的麋鹿。我們可以通過中心極限定理(Central Limit Theorem)來解釋正態(tài)分布的普遍性。中心極限定理告訴我們,只要把隨機(jī)變量加總或求其平均值,就可以期望獲得正態(tài)分布。許多經(jīng)驗(yàn)現(xiàn)象,特別是像銷售數(shù)據(jù)或投票總數(shù)這樣的總量數(shù)據(jù),都可以寫成隨機(jī)事件總和的形式。
當(dāng)然,并不是所有事件的規(guī)模(大小)都是正態(tài)分布的。地震、戰(zhàn)爭死亡人數(shù)和圖書銷量都呈長尾分布,這種分布主要由很小的事件組成,也包括極少數(shù)非常巨大的大型事件。加利福尼亞州每年都發(fā)生超過10 000次地震,但是除非你一直盯著茉莉花的花瓣看它們是否在顫動(dòng),否則你不會(huì)注意到這些地震。然而,偶然也會(huì)出現(xiàn)大的地震:地面裂開、高速公路塌陷,整個(gè)城市都在顫抖。
了解系統(tǒng)是否由于多種原因產(chǎn)生正態(tài)分布或長尾分布是非常重要的。例如,我們可能想了解電網(wǎng)是否會(huì)受到大規(guī)模停電的沖擊,或者市場體系是否會(huì)產(chǎn)生少數(shù)億萬富翁和數(shù)十億窮人。有了相關(guān)的分布知識,就可以預(yù)測洪水超過堤壩的可能性、達(dá)美航空238航班準(zhǔn)時(shí)抵達(dá)鹽湖城機(jī)場的可能性,以及交通樞紐成本超過預(yù)算金額兩倍的可能性。分布知識對設(shè)計(jì)也很重要。正態(tài)分布意味著不會(huì)有太大的偏差,因此飛機(jī)設(shè)計(jì)師不需要為身高5米的人預(yù)留腿部空間。對分布的理解也有利于指導(dǎo)行動(dòng)。正如我們在下文中將會(huì)了解的那樣,防止騷亂在更大程度上取決于能不能在極端情況下安撫人群,而不在于平時(shí)能不能減少不滿情緒的平均水平。
結(jié)構(gòu):正態(tài)分布
分布為事件或價(jià)值分配概率。每日降雨量、考試分?jǐn)?shù)或身高的分布為每一個(gè)可能的結(jié)果值分配一個(gè)概率。各種統(tǒng)計(jì)量將分布中包含的信息壓縮為單個(gè)數(shù)值,例如均值,分布的平均值。德國黑森林中樹木的平均高度可能達(dá)到24米,開胸手術(shù)后的住院時(shí)間平均為5天。社會(huì)科學(xué)家經(jīng)常通過均值來比較各個(gè)國家的經(jīng)濟(jì)和社會(huì)條件。2017年,美國的人均國內(nèi)生產(chǎn)總值為57 000美元,遠(yuǎn)超法國的42 000美元,但是法國人的平均預(yù)期壽命則比美國人高出3年。
均值之外的第二個(gè)重要統(tǒng)計(jì)量是方差,可以衡量一個(gè)分布的離散程度,也就是數(shù)據(jù)與均值之間距離的平方的平均值。 1 如果分布中的每個(gè)點(diǎn)具有相同的值,那么方差等于零。如果一半數(shù)據(jù)的值為4,一半的值為10,那么平均來說,每個(gè)點(diǎn)與均值的距離為3、方差等于9。分布的標(biāo)準(zhǔn)差是另一個(gè)常用的統(tǒng)計(jì)量,等于方差的平方根。
可能的分布集合是無限的。我們可以在紙上任意畫出一條線并將它解釋為概率分布。幸運(yùn)的是,我們經(jīng)常遇到的分布一般都屬于有限的幾種類型。最常見的分布就是正態(tài)分布,也就是鐘形曲線,如圖5-1所示。
圖5-1 正態(tài)分布及其標(biāo)準(zhǔn)差
正態(tài)分布的均值是對稱的。如果一個(gè)正態(tài)分布的均值等于零,那么抽取到大于3的概率等于抽取到小于-3的概率。正態(tài)分布的特征在于其均值和標(biāo)準(zhǔn)差(或者等價(jià)地,其方差)。也就是說,所有正態(tài)分布的圖形看上去都是相似的,大約68%的結(jié)果在均值的一個(gè)標(biāo)準(zhǔn)差內(nèi),大約95%的結(jié)果在兩個(gè)標(biāo)準(zhǔn)差內(nèi),并且超過99%的結(jié)果在三個(gè)標(biāo)準(zhǔn)差內(nèi)。正態(tài)分布允許任何大小的結(jié)果或事件,不過“大”事件是非常罕見的,與均值距離超過五個(gè)標(biāo)準(zhǔn)差的事件發(fā)生的概率為200萬分之一。
我們可以利用正態(tài)分布的規(guī)律給各種范圍的結(jié)果分配概率。如果位于美國威斯康星州密爾沃基市房子的平均面積是2 000平方英尺(1平方英尺≈0.09平方米)、標(biāo)準(zhǔn)差為500平方英尺,那么那里68%的房子面積介于1 500平方英尺到2 500平方英尺之間,95%的房子面積介于1 000平方英尺到3 000平方英尺之間。如果2019年的福特??怂蛊嚻骄考觼觯?加侖≈3.79升)汽油可以行駛40英里(1英里≈1.6千米),且標(biāo)準(zhǔn)差為每加侖1英里,那么超過99%的福特??怂蛊嚸考觼銎涂梢孕旭?7英里至43英里。盡管消費(fèi)者希望自己的汽車越省油越好,但是一般來說不可能每加侖汽油行駛80英里。
邏輯:中心極限定理
非常多的現(xiàn)象都表現(xiàn)為正態(tài)分布:動(dòng)物和植物的體型大小,學(xué)生在考試中的成績,便利店每天的銷售額,海膽的壽命,等等。中心極限定理表明為什么對隨機(jī)變量求和或取均值會(huì)產(chǎn)生正態(tài)分布。
中心極限定理
只要各隨機(jī)變量是相互獨(dú)立的,每個(gè)隨機(jī)變量的方差都是有限的,且沒有任何一小部分隨機(jī)變量貢獻(xiàn)了大部分變差,那N ≥20個(gè)隨機(jī)變量的和就近似一個(gè)正態(tài)分布。 2
中心極限定理一個(gè)非常重要的特征是,隨機(jī)變量本身不一定是正態(tài)分布的。它們可以有任何分布,只要每一個(gè)隨機(jī)變量都具有有限的方差,并且它們中的任何一小部分隨機(jī)變量都不貢獻(xiàn)大部分方差。假設(shè),在一個(gè)500人的小城鎮(zhèn)中,人們的購買行為數(shù)據(jù)顯示,每個(gè)人平均每個(gè)星期花費(fèi)100美元。在這些人中,可能有些人這個(gè)星期只花50美元、下個(gè)星期則花150美元,另一部分人可能每3個(gè)星期花費(fèi)300美元。而其他人則可能每個(gè)星期的花費(fèi)在20至180美元之間。只要每個(gè)人的支出都只有有限的變差并且沒有任何一小部分人貢獻(xiàn)了大部分變差,那么分布的總和必定是一個(gè)正態(tài)分布,其均值為50 000美元。每個(gè)星期的總支出也將是對稱的:可能高于55 000美元,也可能低于45 000美元。根據(jù)同樣的邏輯,人們購買的香蕉、牛奶以及炸玉米餅的數(shù)量也都是正態(tài)分布的。
我們還可以應(yīng)用中心極限定理來解釋人類身高的正態(tài)分布。一個(gè)人的身高取決于基因、環(huán)境以及兩者之間的相互作用?;虻呢暙I(xiàn)率可能高達(dá)80%,因此不妨假設(shè)身高只取決于基因。研究表明,至少180個(gè)基因有助于人體長高。 3 例如,一個(gè)基因可能有助于長出較長的頸部或頭部,另一個(gè)基因可能有助于長出更長的脛骨。雖然基因之間存在相互作用,但我們可以假設(shè)在“長高”這件事情上,每個(gè)基因都是相互獨(dú)立的。如果身高等于180個(gè)基因貢獻(xiàn)的總和,那么身高將呈現(xiàn)正態(tài)分布。相同的邏輯可以證明,狼的體重和大熊貓的拇指長度也是如此。
功能:應(yīng)用分布知識
我們對正態(tài)分布的第一個(gè)應(yīng)用將揭示:為什么罕見結(jié)果在規(guī)模小的群體中更常見,為什么最好的學(xué)校往往規(guī)模較小,為什么癌癥發(fā)病率最高的郡縣人口較少。回想一下,在一個(gè)正態(tài)分布中,95%的結(jié)果位于兩個(gè)標(biāo)準(zhǔn)偏差內(nèi),99%的結(jié)果位于三個(gè)標(biāo)準(zhǔn)偏差內(nèi),根據(jù)中心極限定理,一組獨(dú)立隨機(jī)變量的均值將是正態(tài)分布的(當(dāng)然方差要滿足前述要求)。由此可見,我們可以非常確信:考試分?jǐn)?shù)的總體平均值也將是正態(tài)分布的。然而,隨機(jī)變量平均值的標(biāo)準(zhǔn)差并不等于變量標(biāo)準(zhǔn)差的平均值,而且總和的標(biāo)準(zhǔn)差也不等于標(biāo)準(zhǔn)差的總和。相反,這些關(guān)系取決于總體大小的平方根。
平方根法則(The square root rules)
N 個(gè)相互獨(dú)立的隨機(jī)變量,都具有標(biāo)準(zhǔn)差σ ,對這些隨機(jī)變量的值的標(biāo)準(zhǔn)差σ μ 和對這些隨機(jī)變量總和的標(biāo)準(zhǔn)差σ Σ ,分別由以下公式給出: 4
均值的標(biāo)準(zhǔn)差公式表明,大的總體的標(biāo)準(zhǔn)差要比小的總體的標(biāo)準(zhǔn)差低得多。由此可以推斷,在小的群體中應(yīng)該會(huì)觀察到更多的好事和更多的壞事。事實(shí)上我們確實(shí)觀察到了:最安全的居住地是小城鎮(zhèn),但最不安全的地方也是小城鎮(zhèn);肥胖率和癌癥發(fā)病率最高的那些郡縣的人口較少。這些事實(shí)都可以通過標(biāo)準(zhǔn)差的差異來解釋。
如果不考慮樣本量,直接根據(jù)離群值(異常值)推斷因果關(guān)系可能會(huì)導(dǎo)致相當(dāng)糟糕的政策行為。出自這個(gè)原因,美國統(tǒng)計(jì)學(xué)家霍華德·魏納(Howard Wainer)將均值標(biāo)準(zhǔn)差公式稱為“世界上最危險(xiǎn)的方程式”。例如,在20世紀(jì)90年代,蓋茨基金會(huì)和其他一些非營利機(jī)構(gòu)以“最好的學(xué)校都是小學(xué)?!睘橐罁?jù),倡導(dǎo)將大學(xué)校分拆為小學(xué)校。 5 為了揭示這種推理的邏輯缺陷,試想一下,現(xiàn)在有兩所學(xué)校,一所是只有100名學(xué)生的小學(xué)校,另一所是有1 600名學(xué)生的大學(xué)校,并假設(shè)這兩所學(xué)校學(xué)生的成績均來自相同的分布,平均分為100,標(biāo)準(zhǔn)差為80。在小學(xué)校中,平均值的標(biāo)準(zhǔn)差等于8,即學(xué)生成績的標(biāo)準(zhǔn)差80除以學(xué)生人數(shù)的平方根10。而在大學(xué)校中,平均值的標(biāo)準(zhǔn)差則等于2。
如果以平均分為標(biāo)準(zhǔn),把那些平均成績在110以上的學(xué)校稱為“優(yōu)秀”,把平均成績在120以上的學(xué)校稱為“非常優(yōu)秀”,那么將只有小學(xué)校才有可能達(dá)到這個(gè)標(biāo)準(zhǔn)。對于小學(xué)校而言,平均成績?yōu)?10時(shí),只比總體均值高出了1.25個(gè)標(biāo)準(zhǔn)差,這類事件發(fā)生的概率大約為10%。而平均成績?yōu)?20時(shí),則比總體均值高出了2.5個(gè)標(biāo)準(zhǔn)差,這類事件大約150所學(xué)校發(fā)生一次。對大學(xué)校進(jìn)行相同的計(jì)算時(shí),我們卻會(huì)發(fā)現(xiàn)“優(yōu)秀”閾值意味著比均值高5個(gè)標(biāo)準(zhǔn)差,而“非常優(yōu)秀”閾值則比均值高10個(gè)標(biāo)準(zhǔn)差!實(shí)際上這類事件永遠(yuǎn)不會(huì)發(fā)生。因此,最好的那些學(xué)校普遍規(guī)模較小這個(gè)“事實(shí)”并不能證明小學(xué)校的表現(xiàn)更好。即便學(xué)校規(guī)模本身完全沒有影響,“最好的學(xué)校都很小”這種事情也會(huì)發(fā)生,因?yàn)槠椒礁▌t會(huì)起作用。
檢驗(yàn)顯著性
我們還可以利用正態(tài)分布的規(guī)律來檢驗(yàn)各種平均值的顯著性差異。如果經(jīng)驗(yàn)均值與假設(shè)均值之間的偏差了超過兩個(gè)標(biāo)準(zhǔn)差,那么社會(huì)科學(xué)家就會(huì)拒絕這兩種均值相同的假設(shè)。 6 現(xiàn)在提出這樣一個(gè)假設(shè),即巴爾的摩的通勤時(shí)間與洛杉磯的通勤時(shí)間相同。假設(shè)數(shù)據(jù)表明,巴爾的摩的通勤時(shí)間平均為33分鐘,而洛杉磯為34分鐘。如果這兩個(gè)數(shù)據(jù)集的均值標(biāo)準(zhǔn)差都是1分鐘,那么我們就不能拒絕巴爾的摩和洛杉磯兩地通勤時(shí)間相同的假設(shè)。雖然二者的均值不同,但只存在1個(gè)標(biāo)準(zhǔn)差。如果洛杉磯的平均通勤時(shí)間為37分鐘,那么我們就會(huì)拒絕這個(gè)假設(shè),因?yàn)榫抵g相差4個(gè)標(biāo)準(zhǔn)偏差。
但是,物理學(xué)家可能不會(huì)拒絕這樣的假設(shè),至少當(dāng)數(shù)據(jù)來自物理實(shí)驗(yàn)時(shí)不會(huì)。物理學(xué)家采用更嚴(yán)格的標(biāo)準(zhǔn),因?yàn)樗麄儞碛懈蟮臄?shù)據(jù)集(原子的數(shù)量遠(yuǎn)遠(yuǎn)超過了人的數(shù)量),數(shù)據(jù)也更“干凈”。物理學(xué)家在2012年證明希格斯玻色子(Higgs boson)存在時(shí)所依據(jù)的證據(jù),在700萬次試驗(yàn)中隨機(jī)出現(xiàn)不到一次。
美國食品藥品監(jiān)督管理局(FDA)所使用的藥物批準(zhǔn)程序也包含了顯著性檢驗(yàn)。如果一家制藥公司聲稱自己研發(fā)的某種新藥可以減輕濕疹的嚴(yán)重程度,那么這家公司就必須進(jìn)行兩項(xiàng)隨機(jī)對照試驗(yàn)。為了構(gòu)建一項(xiàng)隨機(jī)對照試驗(yàn),該公司組織了兩個(gè)相同的濕疹患者群體。一組接受這種藥物治療,另一組則只使用安慰劑。試驗(yàn)結(jié)束后,比較平均嚴(yán)重程度和平均副作用發(fā)生率。然后,該公司還要進(jìn)行統(tǒng)計(jì)檢驗(yàn)。如果藥物顯著地緩解了濕疹癥狀(以標(biāo)準(zhǔn)差衡量)且沒有顯著地導(dǎo)致副作用,則可以批準(zhǔn)該藥物。美國食品藥品監(jiān)督管理局并沒有使用嚴(yán)格的雙標(biāo)準(zhǔn)差規(guī)則。治療某種致命疾病且同時(shí)只會(huì)導(dǎo)致輕微副作用的藥物比能夠緩解真菌導(dǎo)致的灰指甲癥狀但同時(shí)卻會(huì)導(dǎo)致骨癌發(fā)病率高于預(yù)期的藥物的統(tǒng)計(jì)標(biāo)準(zhǔn)更低。美國食品藥品監(jiān)督管理局還關(guān)注統(tǒng)計(jì)檢驗(yàn)的效力,也就是測試能夠證明藥物有效的概率。
六西格瑪方法
這里要討論的正態(tài)分布規(guī)律的最后一個(gè)應(yīng)用是六西格瑪方法,我們將說明正態(tài)分布是如何通過六西格瑪方法為質(zhì)量控制提供有效信息的。六西格瑪方法是摩托羅拉公司于20世紀(jì)80年代中期提出的,目的是減少誤差,該方法根據(jù)正態(tài)分布對產(chǎn)品屬性進(jìn)行建模。試想這個(gè)例子:一家企業(yè)專業(yè)生產(chǎn)制造門把手所用的螺栓。它生產(chǎn)的螺栓必須天衣無縫地與其他制造商生產(chǎn)的旋鈕組裝在一起。規(guī)格要求是螺栓直徑為14毫米,但是任何直徑介于13毫米與15毫米之間的螺栓也可以接受。如果螺栓的直徑呈正態(tài)分布,均值為14毫米,標(biāo)準(zhǔn)差為0.5毫米,那么任何超過兩個(gè)標(biāo)準(zhǔn)差的螺栓都是不合格的。兩個(gè)標(biāo)準(zhǔn)差事件發(fā)生的概率為5%,這個(gè)概率對于一家制造企業(yè)來說太高了。
六西格瑪方法涉及縮減標(biāo)準(zhǔn)差的大小從而降低生產(chǎn)出不合格產(chǎn)品的可能性。各企業(yè)可以通過加強(qiáng)質(zhì)量控制來降低誤差率。2008年2月26日,星巴克超過7 000家門店停止?fàn)I業(yè)3小時(shí),目的是重新培訓(xùn)員工。與此類似,航空公司和醫(yī)院所用的檢查清單也有助于減少變差。 7 六西格瑪方法降低了標(biāo)準(zhǔn)差,這樣即使出現(xiàn)了6個(gè)標(biāo)準(zhǔn)差的誤差,也可以避免出現(xiàn)故障。在生產(chǎn)螺栓這個(gè)例子中,就要求必須把螺栓直徑的標(biāo)準(zhǔn)差減少至1/6毫米。而6個(gè)標(biāo)準(zhǔn)差的含義是,誤差率僅為十億分之二。實(shí)際使用的閾值假設(shè)1.5個(gè)標(biāo)準(zhǔn)差的出現(xiàn)是不可避免的。因此,一個(gè)六西格瑪事件實(shí)際上對應(yīng)于一個(gè)四個(gè)半西格瑪事件,這時(shí)允許的誤差率大約為三百萬分之一。
在六西格瑪方法中應(yīng)用中心極限定理(即隱含的加性誤差模型)是如此微妙,因而幾乎沒有什么人注意到。螺栓制造企業(yè)不可能精確地測量每個(gè)螺栓的直徑,它可能會(huì)抽樣幾百個(gè),并根據(jù)這樣一個(gè)樣本來估計(jì)均值和標(biāo)準(zhǔn)差。然后通過假設(shè)直徑的變差源于多種隨機(jī)效應(yīng)的總和,例如機(jī)器振動(dòng)、金屬質(zhì)量變化以及壓力機(jī)溫度和速度的波動(dòng),就可以利用中心極限定理推斷出正態(tài)分布。這樣一來,這家螺栓制造企業(yè)就可以得出一個(gè)基準(zhǔn)標(biāo)準(zhǔn)差,然后花大力氣去降低它。
對數(shù)正態(tài)分布:乘法沖擊
中心極限定理要求我們對隨機(jī)變量求和或求平均值,以獲得正態(tài)分布。如果隨機(jī)變量是不可相加而是以某種方式相互作用的,或者如果它們不是相互獨(dú)立的,那么產(chǎn)生的分布就不一定是正態(tài)分布。事實(shí)上,一般情況下都不會(huì)是。例如,獨(dú)立隨機(jī)變量之間的乘積就不是正態(tài)分布,而是對數(shù)正態(tài)分布。 8 對數(shù)正態(tài)分布缺乏對稱性,因?yàn)榇笥?的數(shù)字乘積的增長速度比它們的和的增長速度快,比如,4+4+4+4=16,但4×4×4×4=256;而小于1的數(shù)字的乘積則比它們的和小,比如, ,但 。如果將20個(gè)不均勻地分布在0到10之間的隨機(jī)變量相乘,那么多次相乘后所得到的乘積將會(huì)包括一些很接近于零的結(jié)果與一些相當(dāng)大的結(jié)果,從而生成如圖5-2所示的對數(shù)正態(tài)分布。
圖5-2 一個(gè)對數(shù)正態(tài)分布
一個(gè)對數(shù)正態(tài)分布的尾部長度取決于隨機(jī)變量相乘的方差。如果它們的方差很小,尾巴就會(huì)很短,如果方差很大,尾巴就可能會(huì)很長。如前所述,將一組很大的數(shù)相乘會(huì)產(chǎn)生一個(gè)非常大的數(shù)字。在各種各樣的情況下都會(huì)出現(xiàn)對數(shù)正態(tài)分布,包括英國農(nóng)場的大小,地球上的礦物質(zhì)的濃度,從受到感染到癥狀出現(xiàn)的時(shí)間,等等。 9 大多數(shù)國家的收入分布也近似于對數(shù)正態(tài)分布,盡管在最頂端,許多點(diǎn)會(huì)偏離對數(shù)正態(tài)分布,因?yàn)楦呤杖氲娜恕疤唷绷恕?/p>
一個(gè)簡單的模型可以解釋為什么收入分布更接近于對數(shù)正態(tài)分布而不是正態(tài)分布。這個(gè)模型將與工資增長有關(guān)的政策與這些政策所隱含的分布聯(lián)系起來。大多數(shù)企業(yè)和機(jī)構(gòu)都按某種百分比來分配加薪,表現(xiàn)高于平均水平的人能夠得到更高百分比的加薪,表現(xiàn)低于平均水平的人則只能得到更低百分比的加薪。與這種加薪方法相反,企業(yè)和機(jī)構(gòu)也可以按絕對金額來分配加薪,例如普通員工可以獲得1 000美元的加薪,表現(xiàn)更好的人可以獲得更多,而表現(xiàn)更差的人則只能獲得更少。
百分比加薪方法與絕對金額加薪方法兩者之間的區(qū)別乍一看似乎只是語義上的區(qū)別,但其實(shí)不然。 10 如果每一年的績效都是相互獨(dú)立且隨機(jī)的,那么根據(jù)員工績效按百分比加薪,就會(huì)產(chǎn)生一個(gè)對數(shù)正態(tài)分布。即使后來的表現(xiàn)相同,未來幾年的收入差距也會(huì)加劇。假設(shè)一名員工因過去幾年表現(xiàn)良好,收入水平達(dá)到了80 000美元,而另一名員工則只達(dá)到了60 000美元。在這種情況下,當(dāng)這兩名員工的表現(xiàn)同樣出色并都可以獲得5%的加薪時(shí),前者能夠獲得4 000美元的加薪,后者卻只能得到3 000美元的加薪。這就是說,盡管績效完全相同,不平等也會(huì)導(dǎo)致更大的不平等。如果企業(yè)按絕對數(shù)額分配加薪,那么兩名績效相同的員工將獲得相同的加薪,由此產(chǎn)生的收入分布將接近正態(tài)分布。
小結(jié)
在本章中,我們討論了正態(tài)分布的結(jié)構(gòu)、邏輯和功能。我們看到,正態(tài)分布可以用均值和標(biāo)準(zhǔn)差來表示。中心極限定理說明,當(dāng)我們將有限方差的獨(dú)立隨機(jī)變量相加或求平均值時(shí),正態(tài)分布是如何產(chǎn)生的。還給出了隨機(jī)變量的均值與總和的標(biāo)準(zhǔn)差公式,闡述了這些性質(zhì)會(huì)帶來的后果。我們現(xiàn)在已經(jīng)知道,小的群體更有可能呈現(xiàn)異常事件,如果缺乏對這類事件的洞察力,就會(huì)做出不正確的推斷并采取不明智的行動(dòng)。我們還了解到,假設(shè)隨機(jī)變量服從正態(tài)分布,科學(xué)家就可以對統(tǒng)計(jì)檢驗(yàn)的顯著性和效力做出判斷。本章還分析了在過程管理中如何利用正態(tài)假設(shè)來預(yù)測失敗發(fā)生的可能性。
并不是每個(gè)量都可以寫成獨(dú)立隨機(jī)變量的總和或平均值,因此并非所有事件都滿足正態(tài)分布。有一些量是獨(dú)立隨機(jī)變量之間的乘積,因此它們是對數(shù)正態(tài)分布的。對數(shù)正態(tài)分布只取正值,有更長的尾巴,意味著更大的事件和更多非常小的事件。當(dāng)高方差的隨機(jī)變量相乘時(shí),尾部會(huì)變得更長。長尾分布的可預(yù)測性較差,而正態(tài)分布則意味著很強(qiáng)的規(guī)律性。作為一個(gè)預(yù)測規(guī)則,我們當(dāng)然更傾向于規(guī)律性,而不是發(fā)生很大事件的可能性。因此,如果了解了生成各種各樣分布的邏輯,我們將會(huì)獲益匪淺。我們可能更希望隨機(jī)沖擊相加,而不是相乘,以減少發(fā)生很大事件的可能性。
06 冪律分布
既然在各種領(lǐng)域中都能發(fā)現(xiàn)發(fā)冪律分布,那么如果有某個(gè)機(jī)制可以解釋所有這些冪律分布就太好了,可惜的是,這種機(jī)制并不存在。如果冪律分布的每一個(gè)實(shí)例都有一個(gè)獨(dú)特的解釋,那將更好,可惜的是,這也不是真的。相反,我們只擁有一系列能夠生成冪律分布的不同模型,每個(gè)模型都能解釋不同的現(xiàn)象。
在本章中,我們將重點(diǎn)放在兩個(gè)冪律分布模型上。第一個(gè)模型是優(yōu)先連接模型(preferential attachment model),它能夠解釋城市規(guī)模、圖書銷量和網(wǎng)絡(luò)鏈接等;第二個(gè)模型是自組織臨界模型(self-organized criticality model),它能夠解釋交通擁堵、戰(zhàn)爭傷亡,以及地震、火災(zāi)和雪崩的大小等。我們重新評估了特別大的事件的影響,并描述在預(yù)防和規(guī)劃這些事件上的能力局限。
冪律分布的結(jié)構(gòu)
在冪律分布中,事件發(fā)生的概率與事件大小的某個(gè)負(fù)指數(shù)成比例。例如,我們熟悉的函數(shù) 就描述了一種冪律。在這個(gè)冪律分布中,一個(gè)事件的概率與其大小成反比:事件越大,發(fā)生的可能性越小。因此,在冪律分布中,小事件的數(shù)量要比大事件要多得多。
長尾分布的含義
在這里,我們討論長尾分布的三個(gè)含義,即它們對公平、災(zāi)難和波動(dòng)性的影響。根據(jù)定義,與正態(tài)分布相比,長尾分布意味著少數(shù)幾個(gè)大“贏家”(大崩潰、大地震、大火災(zāi)和嚴(yán)重的交通擁堵)和很多的“輸家”;而正態(tài)分布則是關(guān)于均值對稱的。長尾分布也可能增加波動(dòng)性,因?yàn)楦髮?shí)體中的隨機(jī)波動(dòng)會(huì)產(chǎn)生更大的影響。
公平
如果某一個(gè)人寫的書更好、創(chuàng)作的歌曲更有吸引力、發(fā)表的論文學(xué)術(shù)水平更高,那么他應(yīng)該比其他人獲得更大的名聲和更多的金錢。但是,如果另一個(gè)人只是因?yàn)楸憩F(xiàn)得稍微好一點(diǎn),或者完全靠碰巧走運(yùn)就比其他人賺到了多得多的錢、獲得了大得多的名聲,那就有失公平了。就像我們在優(yōu)先連接模型中看到的,因?yàn)轳R太效應(yīng),正反饋創(chuàng)造了少數(shù)大贏家。在市場中,要發(fā)生正反饋,人們必須知道別人買了什么商品,而且人們必須有能力購買商品。就手機(jī)上的應(yīng)用程序而言,根本不存在可能會(huì)減慢正反饋的生產(chǎn)限制,長尾分布還包括災(zāi)難性事件:地震、火災(zāi)、金融崩潰和交通擁堵。盡管模型無法預(yù)測地震,但確實(shí)可以深入解釋為什么地震的分布會(huì)滿足冪律。這些相關(guān)的知識告訴我們各種強(qiáng)度的地震發(fā)生的可能性。我們至少知道會(huì)發(fā)生什么,盡管不知道什么時(shí)候會(huì)發(fā)生。??
我們還可以使用這個(gè)模型來做一個(gè)很好的類比。請回想一下,第1章中討論了席卷整個(gè)體系的金融機(jī)構(gòu)的破產(chǎn),我們可以將森林火災(zāi)模型應(yīng)用到那種情況下:把銀行和其他金融機(jī)構(gòu)想象為網(wǎng)格上的樹,網(wǎng)格上的鄰接則表示存在未償還的貸款。一個(gè)銀行破產(chǎn)相當(dāng)于一棵樹著火,而火勢有可能會(huì)蔓延到鄰近的銀行。
當(dāng)銀行的“密度”變得越來越高的時(shí)候,這種看似淺顯的森林火災(zāi)模型就預(yù)示著大規(guī)模的銀行破產(chǎn)隨時(shí)可能發(fā)生。不過,在深入探析這個(gè)類比時(shí),我們可以發(fā)現(xiàn)它存在四個(gè)方面的缺點(diǎn)。第一,金融機(jī)構(gòu)的網(wǎng)絡(luò)并未嵌入物理空間,各家銀行的連接數(shù)也不相同,有的銀行可能擁有幾十項(xiàng)金融債務(wù),而有些銀行則可能只有一兩項(xiàng)金融債務(wù)。第二,森林中的樹木不能主動(dòng)采取行動(dòng)來減少火勢蔓延的可能性,但是銀行卻可以,它們可以提高自己的儲(chǔ)備水平。
第三,一家銀行擁有的連接越多,其破產(chǎn)會(huì)產(chǎn)生連鎖反應(yīng)的可能性就越低,因?yàn)樗膿p失已經(jīng)分散到了更多的銀行身上。例如,如果一家銀行只從另一家銀行借款,那么如果它在借來的1億美元的貸款上出現(xiàn)了違約,第二家銀行可能會(huì)破產(chǎn)。但是,如果第一家銀行是從其他25家銀行分別借款的,那么任何一家銀行都不至于受到重創(chuàng)。在這種情況下,銀行體系可以很好地消化這個(gè)違約事件而不會(huì)崩潰。 16
第四,從一家銀行的破產(chǎn)到另一家銀行的破產(chǎn),這種蔓延會(huì)不會(huì)出現(xiàn)還取決于銀行的投資組合。如果兩家“相連”的銀行擁有相似的投資組合,那么當(dāng)一家銀行破產(chǎn)時(shí),另一家銀行也可能早就脆弱不堪了,這時(shí)銀行破產(chǎn)蔓延的可能性就很大。如果整個(gè)網(wǎng)絡(luò)中的所有銀行都擁有相同的投資組合,那么最糟糕的情況就很可能會(huì)出現(xiàn)。在這種情況下,當(dāng)一家銀行破產(chǎn)時(shí),就可能會(huì)出現(xiàn)普遍的銀行破產(chǎn)。 但是,如果每家銀行分別持有不同的投資組合,那么一家銀行表現(xiàn)不佳并不意味著其他銀行也表現(xiàn)不佳。在這種情況下,銀行破產(chǎn)就可能不會(huì)蔓延。因此,一個(gè)模型要想真正有用,就必須考慮到各種不同的投資組合。如果沒有這些信息,那么即便知道哪些銀行對其他銀行負(fù)有未償還債務(wù)也不足以預(yù)測或防止銀行破產(chǎn),而且銀行之間的高互連性的凈效應(yīng)也是不明確的。
如果組成冪律分布的實(shí)體規(guī)模出現(xiàn)了波動(dòng),那么冪律的指數(shù)就可以作為衡量系統(tǒng)層面波動(dòng)性的一個(gè)代表。由此可以推斷,企業(yè)規(guī)模的分布應(yīng)該會(huì)影響市場波動(dòng)性。
設(shè)想長尾分布的世界
在長尾分布中,大事件發(fā)生的概率必須加以考慮。在本書討論的多個(gè)模型中,長尾分布是由于反饋和相互依賴性而產(chǎn)生的。我們應(yīng)該高度注意這個(gè)結(jié)果。隨著世界中相互聯(lián)系性的提高和反饋的增加,我們應(yīng)該會(huì)觀察到更多的長尾分布,同時(shí)現(xiàn)在關(guān)注的這些長尾分布的尾部也可能會(huì)進(jìn)一步拉長。這就是說,不平等可能會(huì)增加,災(zāi)難可能變得更大,波動(dòng)性也會(huì)變得更加劇烈。這些都是不可取的。
07 線性模型
模型通常假定變量之間存在某種特定的函數(shù)關(guān)系。這種關(guān)系可以是線性的,也可以是非線性的。
相關(guān)關(guān)系vs. 因果關(guān)系
回歸所揭示的是變量之間的相關(guān)關(guān)系,而不是因果關(guān)系。如果先構(gòu)建了某個(gè)模型,然后用回歸檢驗(yàn)?zāi)P偷慕Y(jié)果是否得到數(shù)據(jù)的支持,但那也不能證明因果關(guān)系。但是,在我們能夠用回歸發(fā)現(xiàn)顯著的相關(guān)性之前,有一種方法遠(yuǎn)比回歸方法好,這種方法就是通常所稱的“數(shù)據(jù)挖掘”(data mining)。但是,數(shù)據(jù)挖掘存在識別與其他因果變量相關(guān)的某個(gè)變量的風(fēng)險(xiǎn)。
數(shù)據(jù)挖掘還可能導(dǎo)致虛假的相關(guān)關(guān)系,即兩個(gè)變量只是偶然相關(guān)。
我們可以通過創(chuàng)建訓(xùn)練集(training set)和檢驗(yàn)集(testing set)來避免報(bào)告虛假相關(guān)。在訓(xùn)練集上發(fā)現(xiàn)的相關(guān)性,如果也存在于檢驗(yàn)集上,就更可能是真實(shí)的。但即便是這樣,我們?nèi)匀粺o法保證那就是因果關(guān)系。為了證明因果關(guān)系,還需要進(jìn)行一個(gè)實(shí)驗(yàn)來操縱自變量并觀察因變量是否會(huì)隨之發(fā)生變化,或者也可以想辦法找到可以證明這類因果關(guān)系的自然實(shí)驗(yàn)。
多元線性模型
大多數(shù)現(xiàn)象都有不止一個(gè)因果變量和相關(guān)變量。一個(gè)人的幸??梢詺w因于身體健康、婚姻美滿、子女、宗教信仰和財(cái)富等。一棟房子的價(jià)值取決于室內(nèi)面積、庭院大小、浴室數(shù)量、臥室數(shù)量、建筑類型以及當(dāng)?shù)貙W(xué)校的質(zhì)量等。在解釋房子價(jià)值的時(shí)候,可以把所有這些變量都包含在回歸中。但是必須記住,隨著添加更多的變量,也就需要更多的數(shù)據(jù),不然無法得到顯著的系數(shù)。
總而言之,線性模型需要假定效應(yīng)大小不變。線性回歸為我們對數(shù)據(jù)進(jìn)行第一輪加工提供了一個(gè)強(qiáng)大的工具,有了它,我們能夠識別出變量的符號、大小和顯著性。
請記住,線性模型只是一個(gè)開始,大多數(shù)有趣的現(xiàn)象都不是線性的。因此,回歸模型通常會(huì)包括非線性項(xiàng),例如年齡的平方、年齡的平方根,甚至包括年齡的對數(shù)。為了解釋非線性,我們還可以將線性模型首尾相連,這些連接起來的線性模型可能近似于曲線,就像我們可以使用直邊的磚塊來砌出彎曲的路徑一樣。雖然線性可能是一個(gè)強(qiáng)大而不切實(shí)際的假設(shè),但是它至少提供了一個(gè)很好的起點(diǎn)。在給定了數(shù)據(jù)的情況下,可以使用線性模型來檢驗(yàn)我們的直覺判斷。然后,我們可以構(gòu)建更精細(xì)的模型,其中變量的影響會(huì)隨著它的增加(收益遞減)或變得更強(qiáng)大(正回報(bào))而減弱。?
08 非線性模型
索洛 * 增長模型
模型證明,資本積累可以實(shí)現(xiàn)快速增長,技術(shù)投資也可以。一個(gè)實(shí)物資本較少的落后國家,有可能通過新的資本投入進(jìn)入技術(shù)前沿,從而實(shí)現(xiàn)難以置信的高速增長。?
創(chuàng)新對長期增長來說是必不可少的,這種必要性也意味著一次性進(jìn)口新技術(shù)有很大的局限性,而持續(xù)增長需要?jiǎng)?chuàng)新。
這些模型也表明,攫取和腐敗,也就是政府將經(jīng)濟(jì)體的產(chǎn)出挪用于政府開支,會(huì)減少儲(chǔ)蓄,進(jìn)而削弱增長。實(shí)現(xiàn)這些目標(biāo),需要一個(gè)強(qiáng)大但有限的中央政府來促進(jìn)多元化。強(qiáng)大的中央政府能夠保護(hù)產(chǎn)權(quán)、貫徹法治。多元主義能夠阻止精英的俘虜,精英往往更喜歡現(xiàn)狀,可能不會(huì)接受創(chuàng)新,因?yàn)閯?chuàng)新往往可能具有很大的破壞性。
09 熵:對不確定性建模
熵是對不確定性的一個(gè)正式測度。利用熵,我們可以證明不確定性、信息內(nèi)容與驚喜之間的等價(jià)性。低熵對應(yīng)于低不確定性,同時(shí)揭示的信息很少。如果某個(gè)結(jié)果發(fā)生在低熵系統(tǒng)中,例如太陽從東方升起,我們并不會(huì)感到驚訝。而在高熵系統(tǒng)中,比如在抽獎(jiǎng)時(shí)抽中了某個(gè)數(shù)字,結(jié)果是不確定的,并且實(shí)現(xiàn)的結(jié)果能夠揭示信息。在這個(gè)過程中,我們經(jīng)歷了驚喜。
利用熵,可以比較不同的現(xiàn)象。我們可以判斷新西蘭的選舉結(jié)果是不是比聯(lián)合國對譴責(zé)某個(gè)國家的方案的投票結(jié)果更不確定,還可以將股票價(jià)格的不確定性與體育賽事結(jié)果的不確定性進(jìn)行比較,也可以利用熵的概念來區(qū)分四類結(jié)果:均衡、周期性、復(fù)雜性和隨機(jī)性。我們可以將看似隨機(jī)的復(fù)雜模式和真正的隨機(jī)性區(qū)分開來,并且可以分辨出哪些現(xiàn)象看起來像是有一定模式的,但事實(shí)上是隨機(jī)的。
我們還可以使用熵來表征分布。在沒有控制或調(diào)節(jié)力量的情況下,一些群體可能會(huì)向最大熵漂移。給定特定的約束條件,例如不變的均值或方差,就可以解出最大熵分布。最大熵分布的結(jié)果還可以用來證明某些分布比其他分布更優(yōu),從而能夠?qū)ξ覀冊诮r(shí)的選擇起到指導(dǎo)作用。