《為什么:關于因果關系的新科學 》作者: [美]朱迪亞·珀爾(Judea Pearl) / [美]達納·麥肯齊(Dana Mackenzie)

原作名:?The Book of Why : The New Science of Cause and Effect

ISBN:?9787521705072

內容簡介:

在本書中,人工智能領域的權威專家朱迪亞·珀爾及其同事領導的因果關系革命突破多年的迷霧,厘清了知識的本質,確立了因果關系研究在科學探索中的核心地位。

而因果關系科學真正重要的應用則體現(xiàn)在人工智能領域。作者在本書中回答的核心問題是:如何讓智能機器像人一樣思考?換言之,“強人工智能”可以實現(xiàn)嗎?借助因果關系之梯的三個層級逐步深入地揭示因果推理的本質,并據(jù)此構建出相應的自動化處理工具和數(shù)學分析范式,作者給出了一個肯定的答案。作者認為,今天為我們所熟知的大部分機器學習技術,都建基于相關關系,而非因果關系。要實現(xiàn)強人工智能,乃至將智能機器轉變?yōu)榫哂械赖乱庾R的有機體,我們就必須讓機器學會問“為什么”,也就是要讓機器學會因果推理,理解因果關系。或許,這正是我們能對準備接管我們未來生活的智能機器所做的最有意義的工作。


作者簡介:

朱迪亞·珀尓(Judea Pearl),現(xiàn)加州大學洛杉磯分校計算機科學教授,“貝葉斯網(wǎng)絡”之父,2011年因創(chuàng)立因果推理演算法獲得圖靈獎,同時也是美國國家科學院院士,IEEE智能系統(tǒng)名人堂第一批10位入選者之一。

目前已出版3本關于因果關系科學的經典著作,分別為《啟發(fā)法》(1984)、《智能系統(tǒng)中的概率推理》(1988)和《因果論:模型、論證、推理 》(2009)。他還獲得過多項頂級科學榮譽,包括認知科學領域的魯梅哈特獎、物理學及技術領域的富蘭克林獎章以及科學哲學領域的拉卡托斯獎。

達納·麥肯齊(Dana Mackenzie),普林斯頓大學數(shù)學博士,自由科學記者,知名科普作家,著有《無言的宇宙》等作品,其學術論文多次收錄于《科學》《新科學家》《科學美國》《探索》等重量級期刊。


精彩書評:

壹:短評

#??打算當成一本科普暢銷書來看,沒想到是一本真正的科學思考書籍,對于邏輯、數(shù)學有一定基礎要求。因果還是相關?這個我們曾直接接受的選項在本書中受到了質疑,固然有王婆賣瓜之嫌,但是對于do因子、非擾動因素、反事實假設、幾種悖論的論述還是非常有意思,值得思考的。暢銷書某種意義上讓讀者爽,反復用一本書,各個有點雞湯的例子來說明一兩個簡單的道理;而真正有價值的書籍往往信息密度大,恨不得一本書里塞上一千個、一萬個值得讀者思考的點,而且不是那種能直接接受或質疑的點,是必須反復咀嚼、配合多個問題來回答的點。這本書提到的很多思維方式適合常常翻閱,刺激自己的大腦。

#? 有一定難度,所謂“原因”就是“如果不這樣的話則‘結果’不會發(fā)生”的思路還挺深刻的。

#??非常好看,講述了因果推斷這一個相當新的領域,而且作為一個學統(tǒng)計的,這里面的概念簡直是mind-blowing

#??里程碑式的作品。真理掌握在少數(shù)人手中,庸人對于自己不理解的事情自有自己的解釋方法。很多人看不懂,還要強行評論,汗。


貳:

若一位40歲的女性做了乳房X光檢查以檢測乳腺癌,其得到的檢測結果為陽性。這位女性非常六神無主,問醫(yī)生,這個數(shù)據(jù)可靠嗎?我得了乳腺癌嗎?醫(yī)生說不一定啊,不過根據(jù)乳腺癌檢測聯(lián)合會(BCSC)的數(shù)據(jù),對于40歲的患有乳腺癌的女性來說,乳房X光檢查結果為陽性的概率為73%。若你為這位女性的家屬,請問,在多大程度上她會患乳腺癌?她應該做手術嗎?

或許你會說既然是73%的概率那么趕緊做吧!都這個時候了,寧愿信其有也不信其無?。?/p>

其實,你這是走入了一個慣性推斷誤區(qū)。按照貝葉斯法則,這是一個典型的將前向概率混淆為逆概率的例子。

前向概率指的是,假設你的確患有乳腺癌,檢測結果為陽性的概率:P(檢測|疾?。荒娓怕手傅氖羌俣z測結果為陽性,檢測者確實得了乳腺癌的概率為多大?也就是P(疾病|檢測)。上述例子中的73%只是前向概率,它考察的是檢測技術的靈敏性或準確度,這根本不是我們要關心的問題。顯然,逆概率才是我們關心的問題,也就是根據(jù)檢測結果推斷疾病的概率。

那么,這個概率到底多大?這當然與患者本人的條件如是否有家族疾病史等有很大關系。但當我們不去考慮這些極端情況,只從普遍意義上考慮這個問題,那么這個逆概率就與先驗概率(健康女性下一年患乳腺癌的概率)有關了。來,讓我們看一看這個美麗的推導過程。(友情提示:前方高能,較為燒腦,可略過過程直接看結果)

假設D(代表疾病)指得癌癥,證據(jù)T(代表檢測)指乳房X光檢測結果。那么P(疾病|檢測)可以表示為:

P(D|T)= P(T|D)/ P(T)×(D的先驗概率)

其中P(T|D)/ P(T)用一個新術語表達為似然比,它衡量的是該疾病的患者得到陽性檢測結果的概率比一般群體要高多少?

已知:P(T|D)為73%, D的先驗概率為1/700;(來自權威機構BCSC的統(tǒng)計數(shù)據(jù))

P(T)的估算比較棘手。因為,T既可能來自患這種病的檢查者也可能來自沒有患這種病的檢查者。因此,P(T)應該是P(T|D)(患病者檢測結果為陽性的概率)和P(T|~D)(未患病者結果為陽性的概率)的加權平均。其中,P(T|~D)一般稱為假陽性率,根據(jù)BCSC統(tǒng)計其數(shù)值為12%。為什么要加權平均值?因為健康女性(~D)的數(shù)量要遠多于患乳腺癌的女性(D):699:1。

P(T)=(1/700)×(73%)+(699/700)×(12%)≈12.1%

按照逆概率方程式,我們可以得出:

P(D|T)= (73%/12.1%)×(1/700)≈ 0.0086

換言之,在拿到陽性檢測結果的前提下,這名檢查者的確患有癌癥的概率還不到1%?。?!

相信這一結果讓許多人驚掉了下巴。所以,下一次如果你的檢查結果為陽性時,先不必驚慌,啟動一下大腦的系統(tǒng)二,考慮一下逆概率,到底多大可能性上我患有該疾病呢?

生活中還有許多類似的案例,均源于我們對前向概率和逆概率的認知偏差,即顛倒了因果關系或者混淆了因果與非因果關系。

教科書教我們對科學方法的描述為:(1)提出一個假設;(2)推斷假設的可檢驗結果;(3)進行實驗并收集證據(jù);(4)更新對假設的信念。通常,教科書涉及的只是簡單的正確與錯誤兩種結果,證據(jù)要么證實了假設,要么駁斥了假設。但是生活和科學從來就不會那么簡單!所有的證據(jù)都包含一定程度的不確定性。貝葉斯法則引導我們去思考的正是如何更新對假設的信念,也即反事實或者逆向思維。當有原因時很容易推斷出結果,但從結果到原因就要復雜的多。

夏洛克·福爾摩斯的高明之處就在于,看起來,他在演繹推理,從假設到結論,事實上,他的拿手好戲恰恰與演繹相反,是從證據(jù)到假設,即從結果到原因的歸納思考。

“當你排除了所有不可能的 ,剩下的那個無論多么不可思議,都一定是真相?!?/p>


叁:

出生體重悖論:來自第五章 煙霧繚繞的爭論

20世紀60年代中期,流行病學家發(fā)現(xiàn),吸煙的母親比不吸煙的母親更容易生出低出生體重嬰兒,然而吸煙母親的低出生體重嬰兒的存活率比不吸煙母親的嬰兒高。于是,研究人員指出,如果嬰兒碰巧存在出生時體重不足的問題,那么其母親在懷孕期間吸煙似乎反而有益于新生兒的健康。 這個被稱之為“出生體重悖論”的難題顯然與醫(yī)學共識相悖。原因是原有的研究依從一個假設的因果關系鏈“吸煙-低出生體重-嬰兒死亡率”,但在此因果鏈中,低出生體重并不是嬰兒死亡率的充分必要因,造成低出生體重的原因除了“吸煙”,可能還有“先天畸形”,而后者造成的嬰兒死亡率顯然會更高。

出生體重悖論是對撞偏倚的一個完美的例子,對撞因子“出生體重”一旦被控制,就導致了“吸煙”與“嬰兒死亡率”的偽相關。

因果圖之美就在于他們讓偏倚的源頭變得顯而易見。思考問題時,要對因果關系路徑上各種要素進行可能的想象,借助因果圖消除迷霧,澄清事實。 編后記: 寫出這個知識卡片太不容易了。 因為這一章的邏輯還是有些繞。明明是非常符合常識的吸煙致癌,卻花費了科學家們長達半個世紀的爭論,因為相關并不能證明因果??茖W家們找不到充分的證據(jù)證明吸煙——致癌。 但是讀到最終也沒有找到這個具體的證明方法到底是什么。 按照作者的解釋就是畫一個因果圖就清晰了。但是還沒有get到因果圖這么強大的功能。


關注朋朋不迷路,發(fā)送簡信交流更便捷;

更多書單 信息,點擊簡書個人主頁查閱。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內容