概率思維

——概率論解決隨機(jī)問題的本質(zhì),就是把局部的隨機(jī)性轉(zhuǎn)變?yōu)檎w上的確定性。

比如一座城市,哪些家庭今天會(huì)要孩子、嬰兒會(huì)在哪一刻誕生,這些都是隨機(jī)的,但是從整體上來看,這座城市的出生率、每年新生兒的數(shù)量,卻是大致確定的。

或者說拋硬幣,每次的結(jié)果都是隨機(jī)的,但是整體來看正反的概率都是1/2。

概率論不是幫你預(yù)測(cè)下一秒會(huì)發(fā)生什么,而是為你刻畫世界的整體確定性。某一次結(jié)果的隨機(jī),是低層次的事;而概率論,是高層次的、確定性的認(rèn)知。

——隨機(jī)性不等于不確定性

隨機(jī)性和不確定性最大的差別就在于,這個(gè)事件可能出現(xiàn)的結(jié)果是否可知。

簡(jiǎn)單地講,隨機(jī)性是這個(gè)事件可能出現(xiàn)的結(jié)果我都知道,只是不知道下一次會(huì)出現(xiàn)哪個(gè)結(jié)果。

隨機(jī)播放音樂,雖然不知道接下來會(huì)播放哪一首,但歌單里總共10首歌,下一首肯定是這10首里的一首。

而不確定性,是我連可能出現(xiàn)結(jié)果的選項(xiàng)都不知道。

比如,我今天出門會(huì)發(fā)生什么事情,這就是不確定性,而不是隨機(jī)性。因?yàn)榭赡馨l(fā)生的事太多了,堵車、下雨、碰到熟人、撿到錢……都可能發(fā)生,根本沒法窮盡所有可能的結(jié)果。

而只有知道了全部可能的結(jié)果,才能分析它們的概率;不知道可能的結(jié)果,就沒法深入研究。所以說,概率論面對(duì)和處理的是隨機(jī)性,而不是不確定性。隨機(jī)事件結(jié)果選項(xiàng)可知的特性,是概率論發(fā)揮作用的基礎(chǔ)。

當(dāng)然,很多不確定性是可以轉(zhuǎn)變成隨機(jī)性的。

比如“我今天出門會(huì)發(fā)生什么事”這個(gè)問題,可能的結(jié)果沒法窮盡,是個(gè)不確定性的問題。但如果把問題修改一下,“今天出門遇到的第一個(gè)人,是我認(rèn)識(shí)的還是不認(rèn)識(shí)的呢”,就把不確定性的問題變成了隨機(jī)性的問題,變成了可能遇到認(rèn)識(shí)的人和不認(rèn)識(shí)的人的概率問題了。

盡量把不確定的問題,轉(zhuǎn)變?yōu)殡S機(jī)的問題,用概率去研究,就是對(duì)付它們的科學(xué)方法。

再?gòu)?fù)雜的概率問題,也都是基于三個(gè)計(jì)算法則的。哪三個(gè)法則呢?
第一個(gè),我稱之為“排列組合法則”;
第二個(gè),是“加法法則”;
第三個(gè),是“乘法法則”。

—排列組合法

適用于結(jié)果有限,而且每種結(jié)果都是等可能性的情況。

—加法法則

如果說排列組合法則是針對(duì)單個(gè)隨機(jī)事件的概率計(jì)算,加法法則針對(duì)的就是多個(gè)隨機(jī)事件。以兩個(gè)隨機(jī)事件為例,一個(gè)隨機(jī)事件發(fā)生或者另一個(gè)隨機(jī)事件發(fā)生的概率,也就是這兩個(gè)隨機(jī)事件發(fā)生其一的概率,等于兩個(gè)隨機(jī)事件各自發(fā)生概率的和

不過,加法法則也有個(gè)限定條件,就是這兩個(gè)隨機(jī)事件不能同時(shí)發(fā)生,我們也稱之為“互斥”。

舉個(gè)反例。天氣預(yù)報(bào)說,周六下雨的概率是50%,周日下雨的概率是60%,那周末兩天有降雨的概率是多少呢?是周六下雨的概率直接加上周日下雨的概率嗎?一加結(jié)果是110%,超過1了。前面說了,概率一定在0和1之間,不可能大于1,所以這么算肯定不對(duì)。到底哪里錯(cuò)了呢?

可能你已經(jīng)發(fā)現(xiàn)了,周六下雨和周日下雨并不互斥,周六下雨了,周日也可以下雨,它們可以同時(shí)發(fā)生。也就是說,還存在 “周六和周日都下雨”的情況,所以不能直接用加法法則。那怎么辦呢?用加法法則得出的結(jié)果減去周六周日都下雨的概率就好了。

以兩個(gè)隨機(jī)事件為例,加法法則是兩個(gè)隨機(jī)事件發(fā)生其一的概率,將兩個(gè)隨機(jī)事件各自發(fā)生的概率相加。

—乘法法則是兩個(gè)獨(dú)立事件同時(shí)發(fā)生的概率,將兩個(gè)隨機(jī)事件各自發(fā)生的概率相乘就行了。

不過,乘法法則也有個(gè)限定條件,得是獨(dú)立事件。如果是獨(dú)立事件,彼此互不影響,可以直接使用乘法法則。如果是非獨(dú)立事件,那就不能直接乘了,而是要對(duì)乘法法則做個(gè)變形,也就是利用條件概率。


常用的度量概率的方法有三種——定義法、頻率法、迭代法。

定義法,是通過自然世界的對(duì)稱性來定義概率;

頻率法,是用隨機(jī)事件發(fā)生的頻率來計(jì)算概率;

迭代法,是用一種動(dòng)態(tài)發(fā)展的、考慮個(gè)人差異的角度來度量概率。

當(dāng)我們用概率解決生活問題的時(shí)候,發(fā)現(xiàn)還是有些事情解決不了。

首先,有些事是沒法試的。

其次,很多事不斷發(fā)展,它的概率是不斷變化的。

而且,很多問題還和個(gè)體的差異有關(guān)。

類似的問題還有很多?;蛘呤菙?shù)據(jù)量不足,或者是概率本身不斷變化,或者是和個(gè)體密切相關(guān),這些事情的概率都沒有辦法通過反復(fù)試驗(yàn)、收集數(shù)據(jù)來預(yù)測(cè)

所以有了迭代法

迭代法就是說,先利用手頭少量的數(shù)據(jù)做推測(cè),甚至是主觀猜測(cè)一件事兒的概率,然后再通過收集來的新數(shù)據(jù),不斷調(diào)整對(duì)這件事概率的估算。最常用的方法就叫作“貝葉斯”。

整體不需要通過補(bǔ)償來對(duì)局部產(chǎn)生作用,大數(shù)定律并不通過補(bǔ)償來實(shí)現(xiàn)。

大數(shù)定律不會(huì)對(duì)已經(jīng)發(fā)生的情況進(jìn)行補(bǔ)償,而是利用大量的正常數(shù)據(jù),削弱那部分異常數(shù)據(jù)的影響。正常數(shù)據(jù)越多,異常數(shù)據(jù)的影響就越小,直到小到可以忽略不計(jì)。

如何保證未來一定有大量的正常數(shù)據(jù)呢?

均值回歸

整體通過均值回歸對(duì)局部起作用

均值回歸的意思是說,如果一個(gè)數(shù)據(jù)和它的正常狀態(tài)偏差很大,那么它向正常狀態(tài)回歸的概率就會(huì)變大。

其實(shí),均值回歸更準(zhǔn)確的叫法應(yīng)該是“趨均值回歸”,趨向均值的方向回歸。所以它產(chǎn)生作用的對(duì)象,是那些特殊的、異常的、極端的數(shù)據(jù)。這些異常的狀態(tài)是沒法長(zhǎng)期持續(xù)的,所以回歸正常值的概率會(huì)變大。不過,至于是比正常值稍微高一些,還是稍微低一些,都有可能,完全是隨機(jī)的。

比如,一個(gè)同學(xué)正常的數(shù)學(xué)水平是80分,這次超水平發(fā)揮考了100分,下一場(chǎng)考試,他大概率考不到100分,但可能考90分,可能考80分,也可能考70分。這些都比100分正常,都更接近他的真實(shí)水平,所以都是均值回歸。而不是說上次考100分,這次只能考60分、50分來補(bǔ)償上次的高分。

總之,大數(shù)定律不需要補(bǔ)償,而是通過均值回歸,通過產(chǎn)生大量的正常數(shù)據(jù),削弱之前異常數(shù)據(jù)的影響。

比如我們經(jīng)常會(huì)說一些俗語,運(yùn)氣不好的時(shí)候,會(huì)說“三十年河?xùn)|,三十年河西。嚴(yán)格地說,都有一定的道理,但又都不全對(duì)。

為什么說有一定的道理呢?因?yàn)樗鼈兲N(yùn)含了樸素的概率思維,知道在大多數(shù)情況下,不正常的狀態(tài)難以持續(xù)。正常情況下,誰的運(yùn)氣也不可能一直壞嘛。

為什么說它們不全對(duì)呢?因?yàn)椴还苁恰叭旰訓(xùn)|,三十年河西”,還是“否極泰來”,背后都蘊(yùn)含著剛才我們說的補(bǔ)償思維,認(rèn)為三十年河?xùn)|后,之后三十年一定河西;

而我們現(xiàn)在知道,大數(shù)定律不需要通過補(bǔ)償來實(shí)現(xiàn)。極度的壞運(yùn)氣過后不一定就有好運(yùn)氣,而是通過均值回歸,讓運(yùn)氣回到不那么壞的正常狀態(tài)。所以更準(zhǔn)確的說法應(yīng)該是,“否極”后,可能“泰來”,也可能是回到運(yùn)氣不好不壞的狀態(tài),都有可能。


本質(zhì)上,數(shù)學(xué)期望是對(duì)事件長(zhǎng)期價(jià)值的數(shù)字化衡量。

大數(shù)定律把局部的隨機(jī)性變成了整體上的確定性,也就是概率;而數(shù)學(xué)期望又把概率代表的長(zhǎng)期價(jià)值變成了一個(gè)具體的數(shù)字,方便我們比較。

數(shù)學(xué)期望相同,并不代表兩件事的價(jià)值就一樣。隨機(jī)結(jié)果的波動(dòng)程度,同樣對(duì)一件事的價(jià)值,對(duì)我們的決策影響巨大,在描述和思考一個(gè)隨機(jī)事件的時(shí)候,我們還得考慮這種波動(dòng)性。這就涉及到一個(gè)專業(yè)概念,叫作“方差”。

方差描述的就是,隨機(jī)結(jié)果圍繞數(shù)學(xué)期望的波動(dòng)范圍。

方差的本質(zhì),就是對(duì)風(fēng)險(xiǎn)的度量。一個(gè)隨機(jī)事件的方差越大,可能的結(jié)果離期望值越遠(yuǎn),就說明它的風(fēng)險(xiǎn)越大。

生活里也是這樣。雖然日常我們追求穩(wěn)定,但是如果能在穩(wěn)定的基礎(chǔ)上適當(dāng)增加一些方差,增加一些波動(dòng)性,比如偶爾一次旅行、出去吃頓好的、給媳婦買個(gè)奢侈品包,都會(huì)讓生活更加豐富多彩,幸福感更高。

——條件概率

說白了,條件概率就是計(jì)算和量化某個(gè)條件對(duì)隨機(jī)事件的影響。日常生活中,我們總說“找到關(guān)鍵因素”,其實(shí)是在尋找對(duì)這件事產(chǎn)生重大影響的條件。是的,我們?cè)谟?jì)算條件概率。

——貝葉斯推理

根據(jù)新信息不斷調(diào)整對(duì)一個(gè)隨機(jī)事件發(fā)生概率的判斷,這就是貝葉斯推理。

貝葉斯推理的兩大優(yōu)勢(shì)

第一,起點(diǎn)不重要,迭代很重要。

貝葉斯不是推理一次就完了,它是個(gè)反復(fù)的過程。每找到一個(gè)新信息,就進(jìn)行一次推理,得到一個(gè)新判斷。而下一個(gè)信息,要么進(jìn)一步證實(shí)我們的判斷,要么削弱我們的判斷,就要對(duì)之前的判斷進(jìn)行調(diào)整。這樣不斷微調(diào)、不斷微調(diào),慢慢的,結(jié)果一定會(huì)和真實(shí)狀況越來越接近。毫不夸張的說,貝葉斯最后一定會(huì)無窮逼近于真理。

第二,信息越充分,結(jié)果越可靠。

盡可能豐富的信息,是貝葉斯走向準(zhǔn)確的最大保障。

拿機(jī)器學(xué)習(xí)來說吧,它的底層理論就是貝葉斯。為什么谷歌訓(xùn)練人工智能識(shí)別貓和狗時(shí),要給它看成千上萬張照片?為什么特斯拉的自動(dòng)駕駛汽車要進(jìn)行各種路測(cè),千方百計(jì)收集用戶開車的數(shù)據(jù)?就是因?yàn)閿?shù)據(jù)越多,供它調(diào)整的機(jī)會(huì)越多,它的計(jì)算結(jié)果就會(huì)越精確,越逼近真相。


—概率思維的三個(gè)原則


原則一:對(duì)抗直覺,能算就算。

很多概率相關(guān)的事情,不要相信自己的直覺,只要?jiǎng)庸P簡(jiǎn)單算一算,就很容易得出結(jié)論。

原則二:尋找條件,增大概率

尋找影響這件事的關(guān)鍵條件。

生活中,幾乎所有涉及個(gè)體的決策都是如此。想要成功,就要找到對(duì)自己成功影響最大的那個(gè)條件概率。換句話說,想要成功,就是找到最大化概率的條件。

對(duì)于創(chuàng)業(yè)來說,成功的平均概率可能只有1%,但如果你擁有關(guān)鍵技術(shù)、找到了藍(lán)海、采取了差異化競(jìng)爭(zhēng)策略,你成功的概率就會(huì)大大增加。

原則三:相信系統(tǒng),長(zhǎng)期主義

如果尋找條件概率不足以大幅度提高我們做一件事的成功率,而只是讓我們獲得一些微弱的優(yōu)勢(shì),比如只讓成功率提高到了55%,具體某一次決策時(shí),仍然有一半的可能性會(huì)失敗,這時(shí)候該怎么辦呢?

這就要說到概率思維的第三個(gè)原則——相信系統(tǒng),長(zhǎng)期主義。

還記得網(wǎng)上那個(gè)勵(lì)志雞湯嗎?1.01的365次方是37.8,而0.99的365次方是0.03,激勵(lì)我們每天進(jìn)步一點(diǎn)點(diǎn)。雖然這是一個(gè)雞湯,但不得不說,它是有道理的。

表面上看兩個(gè)概率相差無幾,但只要加入“時(shí)間”這一個(gè)變量,長(zhǎng)期結(jié)果就會(huì)大不一樣——只要有1%的概率優(yōu)勢(shì),長(zhǎng)期來看,勢(shì)必會(huì)造成贏者通吃的局面

“訓(xùn)練時(shí),用正確姿勢(shì)投丟的球比用錯(cuò)誤姿勢(shì)投進(jìn)的球,更有價(jià)值?!逼鋵?shí)就是我們說的相信系統(tǒng),堅(jiān)持長(zhǎng)期主義。用錯(cuò)誤的姿勢(shì)投球,可能某一次能蒙進(jìn),但只有用標(biāo)準(zhǔn)的姿勢(shì)反復(fù)練習(xí),把這個(gè)姿勢(shì)固定成肌肉記憶,才能真正提高自己的命中率。

而所謂的科學(xué)決策,其實(shí)是一個(gè)決策系統(tǒng),只要決策系統(tǒng)有概率優(yōu)勢(shì),我們就要長(zhǎng)期堅(jiān)持,相信系統(tǒng),而不在乎單次決策的隨機(jī)結(jié)果的好壞。

(如果在某種條件下的條件概率只是大一點(diǎn),一方面你的優(yōu)勢(shì)并不明顯,而且不能保證每次都會(huì)好一點(diǎn),有時(shí)候人家可能偶爾比你好。畢竟這是隨機(jī)的,就好比你投籃,用正確的方法投籃比不用正確的方法投籃,在這個(gè)條件下,投中的概率比錯(cuò)誤的方式好一點(diǎn),但是這也是隨機(jī)的,可能某次錯(cuò)誤的投球方式比你用正確的方法投的還要準(zhǔn)。但是只要我長(zhǎng)期用正確的方式這樣訓(xùn)練,投中率就會(huì)慢慢提高,這就是長(zhǎng)期主義,相信系統(tǒng),不在乎單次隨機(jī)結(jié)果的好壞)

其實(shí)我們學(xué)習(xí)也都是如此。你流的每一滴汗,讀的每一本書,都會(huì)一點(diǎn)點(diǎn)的改變你的身體,改變你的認(rèn)知。這些微小的改變,這些微小的概率提升,在時(shí)間的作用下都能被無限放大——每天進(jìn)步一點(diǎn)點(diǎn),相信時(shí)間的力量

站在當(dāng)下,未來任何事都只是一個(gè)概率。所謂堅(jiān)持,所謂努力,其實(shí)就是尋找一個(gè)大概率的方向,然后相信系統(tǒng),相信長(zhǎng)期主義。當(dāng)然,你得堅(jiān)持活著,等到長(zhǎng)期的到來。

參考文獻(xiàn)

得到-劉嘉《概率論22講》

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容