離散型概率分布

補充知識

——wikipedia

伯努利試驗

是只有兩種可能結(jié)果(成功或失敗)的單次隨機試驗,即對于一個隨機變量X而言:

P(X=1)=p
P(X=0)=1-p

伯努利過程

  • 一系列獨立同分布的伯努利試驗,每個X_i的2個結(jié)果也被稱為“成功”或“失敗”。

  • 是一個由有限個或無限個的獨立隨機變量 X_1, X_2, X_3 ,...所組成的離散時間隨機過程,其中 X_1, X_2, X_3 ,...滿足如下條件:

  • 對每個i, X_i 等于 0 或 1;
  • 對每個i, X_i=1 的概率等于 p;

伯努利過程相關(guān)的隨機變量有:

  • 只有一次伯努利試驗發(fā)生服從伯努利分布。
  • 前 n 個試驗的成功次數(shù)服從二項分布。
  • 要得到 r 次成功所需要的試驗次數(shù)服從負二項分布
  • 要得到 1 次成功所需要的試驗次數(shù)服從幾何分布,這是負二項分布的一個特例。

伯努利分布

背景引入:

在實際中的案例結(jié)果往往只有兩種結(jié)果(正、反)。例如:拋硬幣、明天下不下雨、買彩票中獎與不中獎、疾病生存還是死亡、合格與不合格等等。這樣的事件便是伯努利試驗。

定義:

伯努利分布(Bernoulli distribution)又名兩點分布0-1分布,是一個離散型概率分布,是最簡單的離散型概率分布。若伯努利隨機試驗成功,則伯努利隨機變量取1。若伯努利試驗失敗,則伯努利隨機變量取值為0。記其成功概率為p,失敗概率為q=1-p。

概率密度函數(shù):

f(X=x)=p^x(1-p)^{1-x}= \begin{cases} p,x=1\\ q,x=0 \end{cases}

期望:

E(X)=\sum_{i=0}^{1}x_i f_X(x)
E(X)=0+p
E(X)=p

方差:

D(X)=\sum_{i=0}^{1}(x_i-E(X))^2f_X(x)
D(X)=(0-p)^2(1-p)+(1-p)^2p
D(X)=p(1-p)
D(X)=pq

二項分布

背景引入:

對同一個硬幣扔10次,出現(xiàn)3次正面朝上的概率。扔硬幣的過程便是一個伯努利過程,正面朝上次數(shù)的概率就是二項分布。

定義:

Binomial Distribution是n個獨立的伯努利試驗成功的次數(shù)的離散概率分布,其中每次試驗的成功概率為p。實際上,當n = 1時,二項分布就是伯努利分布。二項分布是顯著性差異的二項試驗的基礎(chǔ)?!?a target="_blank">wikipedia

概率質(zhì)量函數(shù):

如果隨機變量X服從參數(shù)n和p為的二項分布,我們記X\sim B(n,p)。n次試驗中正好得到k次成功的概率由概率質(zhì)量函數(shù)給出:

f(k,n,p)=P(X=k)=C_n^kp^k(1-p)^{n-k}
其中,C_n^k=\frac{n!}{k!(n-k)!}是二項式系數(shù)

  • 分布形狀的變化規(guī)律:

二項分布是一個概率分布族,隨著試驗次數(shù)n和成功概率p的不同而不同,且它與正態(tài)分布關(guān)系密切。

[圖片上傳失敗...(image-72b122-1589359103816)]

"成功"概率p越接近0.5(也即"成功"概率與"失敗"概率越接近),二項分布將越對稱。且近似于均值為np、方差為npq的正態(tài)分布。——圖中藍色與綠色對比

對于任意"成功"概率p,無論其距離0.5有多遠,隨著試驗次數(shù)n的增加,二項分布與均值為np、方差為npq的正態(tài)分布越來越接近?!獔D中綠色與紅色對比

期望:

期望等于每次單獨的伯努利試驗的期望和
E(X)=np

方差:

方差等于每次單獨的伯努利試驗的方差和
D(X)=np(1-p)

幾何分布

在n次伯努利試驗中,試驗k次才得到第一次成功的概率,也就是說:前k-1次都失敗,第k次成功的概率。記為X\sim G(p)。

概率質(zhì)量函數(shù):

P(X=k)=(1-p)^{k-1}p
[圖片上傳失敗...(image-93f207-1589359103817)]

期望:

E(X)=\frac{1}{p}

方差:

E(X)=\frac{1-p}{p^2}

超幾何分布

描述了由有限個物體中抽出n個物件,成功抽出指定種類的物件的個數(shù)(不放回抽取)。例如在有N個樣本,其中K個是不及格,N-K個是及格的,超幾何分布描述了在該N個樣本中抽出n個,其中k個是不及格的概率。記為X\sim H(n,K,N)

若n=1,超幾何分布還原為伯努利分布。

概率質(zhì)量函數(shù):

[圖片上傳失敗...(image-dbc806-1589359103817)]

f(k;n,K,N)=\frac{C_K^kC_{N-K}^{n-k}}{C_N^n}

  • C_N^n表示所有在N個樣本中抽出n個的方法數(shù)目;
  • C_K^k表示在K個樣本中,抽出k個的方法數(shù)目,即組合數(shù),又稱為二項式系數(shù)。
  • C_{N-K}^{n-k}表示剩下來的樣本都是及格的,而及格的樣本有N-K個。

泊松分布

泊松分布適合于描述單位時間單位空間內(nèi)隨機事件發(fā)生的次數(shù)的概率分布。記為X\sim P(\lambda)。

  • 如某一服務(wù)設(shè)施在一定時間內(nèi)受到的服務(wù)請求的次數(shù),
  • 電話交換機接到呼叫的次數(shù)、
  • 汽車站臺的候客人數(shù)、
  • 機器出現(xiàn)的故障數(shù)、
  • 自然災(zāi)害發(fā)生的次數(shù)、
  • DNA序列的變異數(shù)、
  • 放射性原子核的衰變數(shù)、
  • 激光的光子數(shù)分布等等。

概率質(zhì)量函數(shù):

P(X=k)=\frac{e^{-\lambda} \lambda^k}{k!}
泊松分布的參數(shù)\lambda是單位時間或單位空間內(nèi)隨機事件的平均發(fā)生率。

[圖片上傳失敗...(image-41616c-1589359103817)]

橫軸是索引k,發(fā)生次數(shù)。該函數(shù)只定義在k為整數(shù)的時候。

期望:

E(X)=\sum_{i=0}^{\infty}iP(X=i)
E(X)=\sum_{i=1}^{\infty}i\frac{e^{-\lambda} \lambda^i}{i!}
E(X)=\lambda e^{-\lambda}\sum_{i=1}^{\infty}\frac{\lambda^{i-1}}{(i-1)!}
E(X)=\lambda e^{-\lambda}\sum_{i=0}^{\infty}\frac{\lambda^{i}}{i!}
E(X)=\lambda e^{-\lambda}e^{\lambda}
E(X)=\lambda

方差:

E(X^2)=\sum_{i=0}^{\infty}i^2P(X=i)
E(X^2)=\sum_{i=0}^{\infty}i^2\frac{e^{-\lambda} \lambda^i}{i!}
E(X^2)=\lambda e^{-\lambda}\sum_{i=1}^{\infty}\frac{e^{-\lambda} \lambda^{i-1}}{(i-1)!}
利用泰勒展開式
E(X^2)=\lambda e^{-\lambda}(e^\lambda+\lambda e^\lambda)
E(X^2)=\lambda +\lambda^2
所以可以得到:
D(X)=E(X^2)-E(X)^2
D(X)=\lambda+\lambda^2-\lambda^2
D(X)=\lambda

泊松定理

在二項分布的伯努利試驗中,如果試驗次數(shù)n很大,二項分布的概率p很小,且乘積λ= np比較適中,則事件出現(xiàn)的次數(shù)的概率可以用泊松分布來逼近。

事實上,二項分布可以看作泊松分布在離散時間上的對應(yīng)物。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容