Machine Learning & 概率 & 隨機(jī)變量 & 概率分布 & 事件的獨立性

概率于Machine Learning而言還是比較重要的,但是概率的難點在于,其不夠直觀,那么換一個視角,我們稱之為"上帝視角",將概率轉(zhuǎn)化為面積,這樣便會變的直觀;

1.概率的定義

概率,顧名思義就是某事件發(fā)生可能性的一種量化,這是我們最直觀的感受;

下面從一個比較經(jīng)典的案例來作為引入 --- 蒙提霍爾問題:

有ABC三扇門,其中有一扇是正確的門,打開有一輛豪車,其余兩扇,門為錯誤的門,門內(nèi)有山羊:
前提:骰子1,2對應(yīng)門1;骰子3,4對應(yīng)門2,骰子5,6對應(yīng)門3

    1. 主持人通過投骰子,決定將豪華車放入哪個門內(nèi)
    1. 選手通過擲骰子決定打開那一扇門
    1. 選手選擇完畢之后,主持人會打開剩余兩扇門中錯誤的一扇門,然后詢問選手是否改變主意

下面來看概率:

  • 如果第一次選擇正確,重選必定錯誤
  • 如果第一次選擇錯誤,重選必定正確

所以"第一次選擇錯誤"的概率就是"重選后正確"的概率,其重選的正確率就是 2/3

但是其實也會有另一種誤區(qū):

第一選擇完畢后,主持人打開一個錯誤的門,那么此時就剩下一個錯誤的門和一個正確的門,此時重選的概率就是:
假如主持人打開的錯誤門是門1;

  • 門2是正確答案的概率: 1/2
  • 門3是正確答案的概率: 1/2

但是仔細(xì)一想,這種概率是建立在,選手沒有進(jìn)行第一次選擇的基礎(chǔ)上進(jìn)行的;

2.飛艇角度來看蒙提霍爾問題

正如上面的誤區(qū),概率是一個抽象的東西,有時候我們會掉進(jìn)這個誤區(qū)中出來

概率是一種抽象的概念,如果我們僅僅憑直覺判斷,很難清晰理解它的本質(zhì)

我們的思路是這樣:
1.轉(zhuǎn)換視角來看待這個問題(這里是飛艇視角)
2.盡量把問題轉(zhuǎn)換成一種可以實際衡量的形式

場景是這樣的:
  • 將劇本設(shè)定為360個會場中有120個會場的門1是正確答案,120個會場的門2是正確答案,120個會場是門3是正確答案
  • 然后門1是正確答案120個會場中,有40個挑戰(zhàn)者選擇門1,有40個挑戰(zhàn)者選擇門2,有40個挑戰(zhàn)者選擇門3
挑戰(zhàn)者選擇門1 挑戰(zhàn)者選擇門2 挑戰(zhàn)者選擇門3
主持人 打開門2 打開門3 打開門1 打開門3 打開門1 打開門2
門1是正確答案 20個會場 20個會場 0個會場 40個會場 0個會場 40個會場
門2是正確答案 0個會場 40個會場 20個會場 20個會場 40個會場 0個會場
門3是正確答案 40個會場 0個會場 40個會場 0個會場 20個會場 20個會場

根據(jù)上表,我們來復(fù)原剛剛的誤區(qū):

  • 1.挑戰(zhàn)者選擇門3
  • 2.主持人打開門1的有60個會場
  • 3.其中門2是正確答案是40個,門3是正確答案是20個,所以證明剛剛是錯誤的
3.上帝視角來看概率
  • 這時候我們需要來看一個概念三元組:
    (\Omega,F,P)
    何為上地視角,其實就是一種鳥瞰的視角,每一個會場(其實就是一個世界,也可以認(rèn)為一種可能出現(xiàn)的場景就是一個世界),對于特定的世界來說,當(dāng)前世界的劇本已經(jīng)被鎖定;
    舉一個簡單的例子:
    隨機(jī)投一枚骰子,共有6種結(jié)果:結(jié)果為1是一個世界,結(jié)果為2也是一個世界,同理3,4,5,6 亦是如此...,而我們從"上地視角",俯瞰這些世界;

  • 場景:投硬幣

概率.png
  • 每個世界的拋硬幣的結(jié)果是永遠(yuǎn)不變的
  • 然后人們不知道身處哪一個世界,所以不確定性就會產(chǎn)生

到目前為止,我們便已經(jīng)將一個抽象的概念:概率,轉(zhuǎn)化為一個可量化的概念(面積量化)

這里我們來用幾個數(shù)學(xué)符號:

\Omega:代表所有平行世界的合集,也就是所有可能場景的集合; \omega是每一個世界的映射.eg: \omega1, \omega2...
P是每一個世界的面積,這里我們需要知道所有的平行世界的面積為1,或者可以這樣理解,\Omega是所有平行世界的合集,
當(dāng)然從數(shù)學(xué)角度來看他只是一個面,\Omega是點的集合,對于\Omega中人意一點A,其發(fā)生的概率,就是其所在區(qū)域的面積,用P(A)表示
這樣的話就知道三元組的第一個和第三個參數(shù)意義,第二個參數(shù)這里暫且跳過

這樣概率便轉(zhuǎn)化為面積,任何量化的東西,要比抽象的概念理解起來更加舒服,深刻;
這里補(bǔ)充一下,每個世界\omega可以理解為樣本,由所有平行世界組成的\Omega就是樣本空間,\Omega的子集A就是事件,我們?nèi)粘5挠懻摰母怕蕬?yīng)當(dāng)是基于事件取量化的

4.隨機(jī)變量 & 概率分布

4.1 隨機(jī)變量

注意這里的子集A僅僅是平面上的一個點,我們稱為樣本點或者基本事件會更加合適一些,打個比方,投擲硬幣為正面向上的區(qū)域有無數(shù)個點,而當(dāng)前的事件應(yīng)該是正面朝上的事件,而點A僅僅是構(gòu)成事件的樣本點而已;

所以進(jìn)一步來看,隨機(jī)事件是會隨機(jī)改變的不確定點,他也是由某個世界中的點集表示,所以隨機(jī)事件應(yīng)該是關(guān)于\omega的函數(shù),即為:

f(\omega)

4.2 概率分布

隨機(jī)變量是基于具體的平行世界的,相對的概率分布只考慮面積,比如投擲硬幣:

  • 正面:0.5
  • 反面:0.5
5.事件的獨立性

其實可以這樣表述這個定義:事件A和時間B,如果P(A|B) = P(A|非B),那么我們就認(rèn)為事件A和事件B相互獨立

下面來介紹幾個等價表訴:

  • A與B相互獨立
  • P(A|B) = P(A|非B)
  • P(A|B) = P(A)
  • P(A,B) = P(A)P(B)
  • P(A,B):P(A,非B) = P(非A,B):P(非A,非B)

所以判斷事件A B 是否獨立可以利用上訴的任意等價表訴來進(jìn)行判斷

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容