概率于Machine Learning而言還是比較重要的,但是概率的難點在于,其不夠直觀,那么換一個視角,我們稱之為"上帝視角",將概率轉(zhuǎn)化為面積,這樣便會變的直觀;
1.概率的定義
概率,顧名思義就是某事件發(fā)生可能性的一種量化,這是我們最直觀的感受;
下面從一個比較經(jīng)典的案例來作為引入 --- 蒙提霍爾問題:
有ABC三扇門,其中有一扇是正確的門,打開有一輛豪車,其余兩扇,門為錯誤的門,門內(nèi)有山羊:
前提:骰子1,2對應(yīng)門1;骰子3,4對應(yīng)門2,骰子5,6對應(yīng)門3
- 主持人通過投骰子,決定將豪華車放入哪個門內(nèi)
- 選手通過擲骰子決定打開那一扇門
- 選手選擇完畢之后,主持人會打開剩余兩扇門中錯誤的一扇門,然后詢問選手是否改變主意
下面來看概率:
- 如果第一次選擇正確,重選必定錯誤
- 如果第一次選擇錯誤,重選必定正確
所以"第一次選擇錯誤"的概率就是"重選后正確"的概率,其重選的正確率就是 2/3
但是其實也會有另一種誤區(qū):
第一選擇完畢后,主持人打開一個錯誤的門,那么此時就剩下一個錯誤的門和一個正確的門,此時重選的概率就是:
假如主持人打開的錯誤門是門1;
- 門2是正確答案的概率: 1/2
- 門3是正確答案的概率: 1/2
但是仔細(xì)一想,這種概率是建立在,選手沒有進(jìn)行第一次選擇的基礎(chǔ)上進(jìn)行的;
2.飛艇角度來看蒙提霍爾問題
正如上面的誤區(qū),概率是一個抽象的東西,有時候我們會掉進(jìn)這個誤區(qū)中出來
概率是一種抽象的概念,如果我們僅僅憑直覺判斷,很難清晰理解它的本質(zhì)
我們的思路是這樣:
1.轉(zhuǎn)換視角來看待這個問題(這里是飛艇視角)
2.盡量把問題轉(zhuǎn)換成一種可以實際衡量的形式
場景是這樣的:
- 將劇本設(shè)定為360個會場中有120個會場的門1是正確答案,120個會場的門2是正確答案,120個會場是門3是正確答案
- 然后門1是正確答案120個會場中,有40個挑戰(zhàn)者選擇門1,有40個挑戰(zhàn)者選擇門2,有40個挑戰(zhàn)者選擇門3
| 挑戰(zhàn)者選擇門1 | 挑戰(zhàn)者選擇門2 | 挑戰(zhàn)者選擇門3 | ||||
|---|---|---|---|---|---|---|
| 主持人 | 打開門2 | 打開門3 | 打開門1 | 打開門3 | 打開門1 | 打開門2 |
| 門1是正確答案 | 20個會場 | 20個會場 | 0個會場 | 40個會場 | 0個會場 | 40個會場 |
| 門2是正確答案 | 0個會場 | 40個會場 | 20個會場 | 20個會場 | 40個會場 | 0個會場 |
| 門3是正確答案 | 40個會場 | 0個會場 | 40個會場 | 0個會場 | 20個會場 | 20個會場 |
根據(jù)上表,我們來復(fù)原剛剛的誤區(qū):
- 1.挑戰(zhàn)者選擇門3
- 2.主持人打開門1的有60個會場
- 3.其中門2是正確答案是40個,門3是正確答案是20個,所以證明剛剛是錯誤的
3.上帝視角來看概率
這時候我們需要來看一個概念三元組:
何為上地視角,其實就是一種鳥瞰的視角,每一個會場(其實就是一個世界,也可以認(rèn)為一種可能出現(xiàn)的場景就是一個世界),對于特定的世界來說,當(dāng)前世界的劇本已經(jīng)被鎖定;
舉一個簡單的例子:
隨機(jī)投一枚骰子,共有6種結(jié)果:結(jié)果為1是一個世界,結(jié)果為2也是一個世界,同理3,4,5,6 亦是如此...,而我們從"上地視角",俯瞰這些世界;場景:投硬幣

- 每個世界的拋硬幣的結(jié)果是永遠(yuǎn)不變的
- 然后人們不知道身處哪一個世界,所以不確定性就會產(chǎn)生
到目前為止,我們便已經(jīng)將一個抽象的概念:概率,轉(zhuǎn)化為一個可量化的概念(面積量化)
這里我們來用幾個數(shù)學(xué)符號:
這樣的話就知道三元組的第一個和第三個參數(shù)意義,第二個參數(shù)這里暫且跳過
這樣概率便轉(zhuǎn)化為面積,任何量化的東西,要比抽象的概念理解起來更加舒服,深刻;
4.隨機(jī)變量 & 概率分布
4.1 隨機(jī)變量
注意這里的子集A僅僅是平面上的一個點,我們稱為樣本點或者基本事件會更加合適一些,打個比方,投擲硬幣為正面向上的區(qū)域有無數(shù)個點,而當(dāng)前的事件應(yīng)該是正面朝上的事件,而點A僅僅是構(gòu)成事件的樣本點而已;
4.2 概率分布
隨機(jī)變量是基于具體的平行世界的,相對的概率分布只考慮面積,比如投擲硬幣:
- 正面:0.5
- 反面:0.5
5.事件的獨立性
其實可以這樣表述這個定義:事件A和時間B,如果P(A|B) = P(A|非B),那么我們就認(rèn)為事件A和事件B相互獨立
下面來介紹幾個等價表訴:
- A與B相互獨立
- P(A|B) = P(A|非B)
- P(A|B) = P(A)
- P(A,B) = P(A)P(B)
- P(A,B):P(A,非B) = P(非A,B):P(非A,非B)
所以判斷事件A B 是否獨立可以利用上訴的任意等價表訴來進(jìn)行判斷