為什么(the book of why)

有段時(shí)間,沒有通過筆記的方式,梳理讀書的內(nèi)容了,這次重新拾起來,我想有兩個(gè)原因,一個(gè)是這本書的內(nèi)容價(jià)值太大,二是第一遍基本沒怎么讀懂,那就必須得用點(diǎn)硬手段,強(qiáng)迫加深自己對(duì)這本書的理解了。

導(dǎo)言:思維勝于數(shù)據(jù)

因果推斷引擎示意

通過將客觀數(shù)據(jù),和主觀業(yè)務(wù)經(jīng)驗(yàn)/主觀認(rèn)知,相結(jié)合,解決目標(biāo)問題的方法論。

  1. 知識(shí):推理主體過去的經(jīng)驗(yàn),認(rèn)知、思維、經(jīng)驗(yàn)底蘊(yùn)。
  2. 假設(shè):研究者在現(xiàn)有知識(shí)的基礎(chǔ)上認(rèn)為有必要明確表述出來的陳述。
  3. 因果模型:因果圖模型,因果推斷邏輯的外在表現(xiàn)形式,通過一種更簡(jiǎn)潔、清晰的方式,幫助人們更好認(rèn)知因素之間的因果關(guān)系。
  4. 可驗(yàn)證的蘊(yùn)涵,將通過主觀經(jīng)驗(yàn)建立的圖結(jié)構(gòu),轉(zhuǎn)化為數(shù)據(jù)語(yǔ)音,"因素D和L相對(duì)獨(dú)立,不相關(guān)",對(duì)比真實(shí)數(shù)據(jù)結(jié)論,驗(yàn)證假設(shè)無誤。
  5. 我們提交的問題,例:P(L|do(D))
  6. 因果推斷的結(jié)果,注意如果前置因果圖模型里因素不夠,可能這個(gè)結(jié)果是無法順利得到的

我們平常工作中說的業(yè)務(wù)漏斗、業(yè)務(wù)模型,本質(zhì)就是因果圖,對(duì)產(chǎn)生一份業(yè)務(wù)結(jié)果需要經(jīng)過關(guān)鍵環(huán)節(jié)的抽象。

因果關(guān)系之梯

因果關(guān)系的三個(gè)層級(jí)

  • 第一層級(jí),是觀察能力,發(fā)現(xiàn)環(huán)境中規(guī)律的能力。

買啤酒的顧客也愛買尿布,這是規(guī)則。

  • 第二層級(jí),是行動(dòng)能力,預(yù)測(cè)對(duì)環(huán)境刻意改變的后果。
  • 第三層級(jí),是想象能力,反事實(shí)的想象能力,通過想象不存在的世界,推測(cè)觀察到的現(xiàn)象為何
因果推斷的三層境界

為什么我們要努力推演接近第三個(gè)層級(jí)?
舉個(gè)例子,<假如我們把牙膏的價(jià)格提高一倍,則之前買了牙膏的顧客仍在選擇購(gòu)買的概率是多少?>
正確的預(yù)測(cè),某個(gè)因素改變對(duì)結(jié)果的影響,后續(xù)在真實(shí)世界就能用過更快、更精準(zhǔn)的方式,采取措施,改進(jìn)目標(biāo)。

從海盜到豚鼠:因果推斷的起源

豚鼠出生體重示例的因果圖

p+ l * l' * q = 5.66克/天
計(jì)算l、l'、q,的路徑系數(shù),再用5.66減去他,就得到了P對(duì)X的影響。

從證據(jù)到因:當(dāng)貝葉斯牧師預(yù)見福爾摩斯先生

從因推出果,叫前向概率,從果逆推因,叫逆推概念。

因果關(guān)系的三種結(jié)構(gòu)

  • chain,A—>B—>C,鏈?zhǔn)浇Y(jié)構(gòu)
  • fork,A<—B—>C,叉結(jié)構(gòu)
  • collider,A—>B<—C,對(duì)撞結(jié)構(gòu)

混雜和去混雜:或者,消滅潛伏變量

解決了混雜因子的黃金方法,隨機(jī)樣本,AB實(shí)驗(yàn)

煙霧繚繞的爭(zhēng)論:消除迷霧,澄清事實(shí)

香煙致癌,在今天看是板上釘釘?shù)慕Y(jié)論,但在20世紀(jì)下半葉的美國(guó),還是個(gè)激烈討論、論證的問題。


美國(guó)人均香煙消費(fèi)量和肺癌及支氣管癌死亡率

這個(gè)圖已經(jīng)帶很強(qiáng)的因果性信息了,關(guān)鍵點(diǎn)在:

  • 兩個(gè)曲線的形狀非常擬合
  • 前者和后者的波峰上升節(jié)點(diǎn)間的時(shí)間差距近乎一致,大概是30年左右

在無法對(duì)是否吸煙做AB實(shí)驗(yàn)的情況下,因果派和否定派各執(zhí)一詞,否定派的認(rèn)知是,吸煙和癌癥之間有混雜因子,例如人可能有吸煙基因,這種基因讓人們渴望吸煙,也是他們更有可能患上肺癌。

吸煙對(duì)新生兒的影響-因果論證過程

在20世紀(jì)60年代中期,雅各布指出,如果嬰兒碰巧存在出生時(shí)體重不足的問題,那么期母親在懷孕期間吸煙似乎反而有益于新生兒的健康,這個(gè)被稱作"出生體重悖論"

實(shí)驗(yàn)的過程:

  1. 通過對(duì)比,發(fā)現(xiàn)吸煙母親的胎兒重量的確比不吸煙的母親胎兒重要輕7盎司。
  2. 吸煙母親的低體重樣兒存活率要比不吸煙母親的嬰兒高

這就好像說,母親吸煙有保護(hù)胎兒的作用一樣

混雜因子影響的方式
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容