2.1-2.2 離散型隨機變量

第二章 隨機變量及其分布

2.1 隨機變量的基本概念

概率研究的傳統(tǒng)方法

  1. \Omega中的樣本點與試驗有關(guān),類型多樣,不便于進行抽樣的研究
  2. 很多非等可能的問題的概率如何計算沒有很好地解答

新的思路:

  • 引入函數(shù)的概念對隨機試驗進行更為抽象的描述
  • 通過某種從樣本空間到實數(shù)集的映射,將對隨機試驗及其概率的研究轉(zhuǎn)化為對隨機數(shù)值及其取值概率的問題
  • 將微積分等現(xiàn)代數(shù)學工具引入到概率的研究中來

解決問題的思路:將樣本空間\Omega數(shù)字化(抽象化)

例:隨機抽取一件產(chǎn)品,考察其是否合格,則
\Omega=\{\text{合格},\text{不合格}\}

X(\omega)=\left\{\begin{array}{ll}{0,} & {\omega=\text{合格}} \\ {1,} & {\omega=\text{不合格}}\end{array}\right.

\Omega \stackrel{X}{\longrightarrow} \Omega^{\prime}=\{0,1\}
相對而言,新的集合\Omega‘更便于使用數(shù)學的方法進行討論。


定義:設\{\Omega,\mathscr{F},P\}為概率空間,若對任意\omega\in\Omega均存在唯一實數(shù)X(\omega)與之對應,且對任意x\in\mathbb{R},\{X \leq x\} \triangleq\{\omega | X(\omega) \leq x\} ?是一隨機事件,即
\{X \leq x\}\in\mathscr{F}
則稱X=X(\omega)?隨機變量(random variable,簡寫為r.v.)

隨機變量X(\omega)?是定義在樣本空間\Omega上的函數(shù)。
隨機變量是\Omega \longrightarrow \mathbb{R}?的(可測)映射。所謂“可測”,也即\{X \leq x\}?必須是事件!
實變函數(shù)論中,對可測的概念(可測集合、可測映射)給出了嚴格的定義,與概率論中使用的可測概念是完全一致的
隨機變量的引入,使得原來我們必須在樣本空間\Omega上討論的概率問題,可以轉(zhuǎn)而在實數(shù)集上進行研究。在新的抽象層次上研究概率問題,不僅有利于發(fā)現(xiàn)不同問題之間的關(guān)聯(lián),也為引入各種數(shù)學工具提供了便利。

對于任意實數(shù),\{X\leq x\}都是事件,故可定義函數(shù)
F(x)=P\{X\leq x\}
F(x)稱為隨機變量X分布函數(shù)(Cumulative Distribution Function, 簡稱CDF


例:在實彈射擊訓練中,對同一目標連續(xù)打三發(fā)子彈,擊中目標記為1,否則記為0,則樣本空間
\Omega=\{000,001,010,100,011,101,110,111\}
定義隨機變量
X=\text{命中的次數(shù)},

\Omega \stackrel{X}{\longrightarrow} \Omega^{\prime}=\{0,1,2,3\}
則事件
\begin{aligned}\{X=0\} &=\{000\} \\\{X=2\} &=\{011,101,110\} \\\{X \leq 2\} &=\{000,001,010,100,011,101,110\} \\ &=\{X \leq 3\}-\{X=3\} \\ &=\Omega-\{111\} \end{aligned}


現(xiàn)實中,很多試驗的結(jié)果本身就是隨機變量,例如:

  1. 某地區(qū)的日平均氣溫X,日平均氣溫Y
  2. 電子產(chǎn)品的壽命X
  3. 某城市的日耗電量X
  4. 一戰(zhàn)士連續(xù)對目標射擊n次,擊中目標次數(shù)X
  5. 從一大批產(chǎn)品中隨機抽取n件進行測試,其測得的次品數(shù)N

很多問題的實際背景不同,但數(shù)學本質(zhì)完全一樣。 利用隨機變量將樣本空間轉(zhuǎn)變?yōu)槌橄笮问剑軌蚋奖愕匕l(fā)現(xiàn)不同問題的相似性。


隨機變量可分為離散型非離散型隨機變量,其中后者又可以分為連續(xù)型隨機變量奇異型隨機變量,我們主要研究其中的離散型、連續(xù)型及其混合型的隨機變量。

2.2 離散型隨機變量及其分布律

若 r.v X 可取至多可列個值,則稱X離散型隨機變量。

至多可列 也即有限或可列

例:

  1. 對同一目標連續(xù)射擊n 次,擊中目標次數(shù) X .
  2. 用同一支槍對目標進行射擊,直到擊中目標為止,射擊次數(shù) X .
  3. 114查號臺一天接到的呼叫次數(shù) X .
  4. 從一批產(chǎn)品中隨機抽取 n件進行測試, 其測得的次品數(shù) N.

離散型r.v.的分布律

X 為離散型 r.v,設X 所有可能的取值為
x_1,x_2,...,x_k,...

P\left\{X=x_{k}\right\}=p_{k} \quad(k=1,2, \cdots)
則稱上式為離散型 r.v X 的分布律(Probability Distribution Law,縮寫PDL


x_1<x_2<x_3<...<x_k<...

F(x)=P\left\{X\leq x_{k}\right\}=\sum\limits_{i=1}^kp_{i} \quad(k=1,2, \cdots)
一般稱為r.v.X累積分布函數(shù)(Cumulative Distribution Function,縮寫CDF


例:在實彈射擊訓練中,對同一目標連續(xù)打三發(fā)子彈,設每一發(fā)的命中率為p,記X 為擊中目標次數(shù),求 X 的分布律.

解:樣本空間
\Omega=\{000,001,010,100,011,101,110,111\}
r.v X 的取值為0,1,2,3,其分布律
\begin{array}{l}{P\{X=0\}=(1-p)^{3}} \\ {P\{X=1\}=3 p(1-p)^{2}} \\ {P\{X=2\}=3 p^{2}(1-p)} \\ {P\{X=3\}=p^{3}}\end{array}
分布律的特點:所有樣本點對應的概率總和為1,上例中
P\{X=0\}+P\{X=1\}+P\{X=2\}+P\{X=3\}=[(1-p)+p]^3=1

分布律時,必須注意所有的樣本點必須都遍歷一次!


分布律的基本性質(zhì)

  1. p_{k} \geq 0, k=1,2, \cdots
  2. \sum_{k=1}^{\infty} p_{k}=1

以上兩點是分布律的本質(zhì)特征,也即:

  • 離散型 r.v. 的分布律必滿足以上兩條性質(zhì)
  • 滿足以上兩條性質(zhì)的數(shù)列\{p_k\}必是某離散型r.v的分布律

直觀解釋:

  1. 將球扔向位于x_k處的“盒子”的概率為p_k
將球扔向特定位置的盒子的概率
  1. 將總質(zhì)量為1的“物質(zhì)”散布在至多可列個點x_k
總質(zhì)量1的散布

分布律的幾種表示法

  • 解析法
    P\left\{X=x_{k}\right\}=p_{k} \quad(k=1,2, \cdots)
  • 列表法
列表法表示分布律
  • 矩陣法
    \left( \begin{array}{ccccc}{x_{1}} & {x_{2}} & {\cdots} & {x_{k}} & {\cdots} \\ {p_{1}} & {p_{2}} & {\cdots} & {p_{k}} & {\cdots}\end{array}\right)
  • 圖示法
圖示法表示分布律

幾種重要的離散型隨機變量

兩點分布

定義:如果 r.v X 的分布律為
P\left\{X=c_{1}\right\}=p, P\left\{X=c_{2}\right\}=1-p \quad(0<p<1)
則稱 r.v X 服從兩點分布,特別當c_1=1,c_2=0時稱 r.v X 服從(0-1)兩點分布

產(chǎn)生兩點分布的實際背景:試驗只產(chǎn)生兩個結(jié)果.

例如:

  1. 一門課程的考試是“及格”還是“不及格”
  2. 剛出生的新生兒是“男”還是“女”
  3. 產(chǎn)品檢驗的結(jié)果是“合格”還是“不合格”
  4. 射擊結(jié)果是“擊中目標”還是“沒有擊中目標”

注:如果r.v. X的分布律為
P\{X=c\}=1,
則稱r.v. X服從退化分布(或單點分布),或者說X“幾乎處處”等于c,記為
X \stackrel{\mathrm{a.e}}{=} c \quad\text{或}\quad X=c(\mathrm{a} . \mathrm{e})


Bernoulii試驗與二項分布

Bernoulii試驗:只產(chǎn)生兩個結(jié)果A,\bar{A}的試驗

n重Bernoulli試驗Bernoulli概型:將Bernoulli試驗<u>獨立重復</u>進行 n

  • 要求每次試驗相互獨立(無關(guān)),從而對應結(jié)果的概率不變

例:某戰(zhàn)士用步槍對目標進行射擊,記
A=\{\text{擊中目標}\},\quad \bar{A}=\{\text{未擊中目標}\}
對每次射擊的觀察是Bernoulli試驗,連續(xù)觀察n次射擊結(jié)果則為n重Bernoulli試驗

例:從一批產(chǎn)品中隨機抽取一個產(chǎn)品進行檢驗,記
A=\{\text{合格}\},\quad \bar{A}=\{\text{不合格}\}
檢驗一個產(chǎn)品是Bernoulli試驗

問:獨立抽檢 n 件產(chǎn)品是否是n 重Bernoulli試驗?

分析:產(chǎn)品抽一個少一個,所以每次抽檢后概率
P(A)=P\{\text{合格}\}
都在變化,故不能認為是n 重Bernoulli試驗

如果產(chǎn)品數(shù)量比較大,可近似看作 n 重Bernoulli試驗.

n 重Bernoulli試驗中,令
P(A)=p, P(\overline{A})=1-p

A_i=\{\text{第}i\text{次試驗結(jié)果}\},i=1,2,...,n
對任意1 \leq i_{1}<i_{2}<\dots<i_{k} \leq n,有
P\left(A_{i 1} A_{i 2} \cdots A_{i_{k}}\right)=P\left(A_{i_{1}}\right) P\left(A_{i_{2}}\right) \cdots P\left(A_{i k}\right)

X=\{n\text{重Bernoulli試驗中事件}A\text{發(fā)生的次數(shù)}\}
X 是一個離散型 r.v.

X的分布律是什么?

分析:X的可能取值為0,1,2,...,n,對任意k\leq n,\{X=k\}表示n次獨立試驗中A恰好發(fā)生了k次(\bar{A}恰好發(fā)生了n-k次),也即
\{X=k\}=\bigcup_{1 \leq i_{1}<\cdots<i_{k} \leq n} A_{i_{1}} \cdots A_{i_{k}} \overline{A}_{j_{1}} \cdots \overline{A}_{j_{n-k}}
以上取并的事件兩兩不相容,結(jié)合獨立性的假設,可知
\begin{aligned} P\{X=k\}&=P\left\{\bigcup_{1 \leq i_{1}<\cdots<i_{k} \leq n} A_{i_{1}} \cdots A_{i_{k}} \overline{A}_{j_{1}} \cdots \overline{A}_{j_{n-k}}\right\}\\ &=\sum_{1 \leq i_{1}<\cdots<i_{k} \leq n} P\left\{A_{i_{1}} \cdots A_{i_{k}} \overline{A}_{j_{1}} \cdots \overline{A}_{j_{n-k}}\right\}\\ &=\sum_{1 \leq i_{1}<\cdots<i_{k} \leq n} \overbrace{p \cdots p}^{k} \overbrace{(1-p) \cdots(1-p)}^{n-k}\\ &=C_{n}^{k} p^{k}(1-p)^{n-k} \end{aligned}
q=1-p,從而X 的分布律為
P\{X=k\}=C_{n}^{k} p^{k} q^{n-k} \quad(k=0,1,2, \cdots, n)
不難驗證

  1. P\{X=k\}>0 \quad(k=0,1,2, \cdots, n)
  2. \sum_{k=0}^{n} P\{X=k\}=\sum_{k=0}^{n} C_{n}^{k} p^{k} q^{n-k}=(p+q)^{n}=1

定義:若 r.v X 的分布律為
P\{X=k\}=C_{n}^{k} p^{k} q^{n-k} \quad(k=0,1,2, \cdots, n)
則稱 X 服從參數(shù)為( n, p)二項分布,記為X \sim B(n, p)

特別當n=1時,B(1,p)就是(0-1)兩點分布,即
P\{X=k\}=p^{k} q^{1-k} \quad(k=0,1)
實際背景:二項分布產(chǎn)生于 n 重Bernoulli試驗

例:一大批電子元件有10%已損壞,若從這批元件中隨機選取20只來組成一個線路,問這線路能正常工作的概率是多少?

解:因為元件的數(shù)量很大,所以取20只元件可看作是有放回抽樣,記 X 表示20只元件中好品的數(shù)量,則
X \sim B(20,0.9)
于是
\begin{aligned} P\{\text{線路正常}\}&=P\{X=20\} \\ &=C_{20}^{20} \times 0.9^{20} \times 0.1^{20-20} \\ &=0.9^{20} \approx 0.1216 \end{aligned}


Poisson流與Poisson分布

Poisson流:隨著時間的推移,在時間軸上源源不斷出現(xiàn)的具有某種特性的隨機粒子(事件)流.

  • 粒子出現(xiàn)的次數(shù)與時間起點無關(guān),只與時間長短有關(guān)
  • 任何兩個不重疊的時間段內(nèi),粒子出現(xiàn)的次數(shù)是相互獨立的
  • 在非常短的時間內(nèi),幾乎不可能出現(xiàn)兩個以上粒子

典型的Poisson流:

  1. 隨機服務系統(tǒng)
  • 電話交換臺在某時間段內(nèi)接到的呼叫數(shù)
  • 公共汽車站在某時間段內(nèi)來到的乘客數(shù)
  • 營業(yè)員在某時間段內(nèi)接待的顧客數(shù)
  • 114查號臺在某時間段內(nèi)接到的查號電話數(shù)
  • 醫(yī)院在一天內(nèi)收到的急診病人數(shù)
  • 大型超市停車場,汽車的到達數(shù)
  1. 稀疏現(xiàn)象
  • 電子設備在某時間內(nèi)受到的干擾沖擊次數(shù)
  • 雷達在跟蹤目標時接收到的電磁干擾信號脈沖流
  • 巡航導彈飛過攔截區(qū)域的中彈數(shù)量
  • 人的一生中患癌癥等嚴重疾病的次數(shù)
  • 某地區(qū)在一天發(fā)生的交通事故數(shù)
  • 一本書一頁中的印刷錯誤數(shù)
  • 119報警臺在某時間段內(nèi)接到的火警電話數(shù)
  • 快遞公司在一天內(nèi)遺失的快件數(shù)
  1. 物理學中的現(xiàn)象
  • 放射性分裂落到某區(qū)域的質(zhì)點數(shù)
  • 熱電子的發(fā)射數(shù)
  • 顯微鏡下落在某區(qū)域中的微生物數(shù)

X_t表示時間區(qū)間(0,t]內(nèi)出現(xiàn)的質(zhì)點個數(shù),如果X_t滿足:

  1. 平穩(wěn)性:在任意時間段(t_0,t_0+t]內(nèi),出現(xiàn)k個質(zhì)點的概率P\{X_t=k\}僅與t有關(guān)
  2. 獨立增量性:在任意兩個不重疊的時間段(a_1,a_2](b_1,b_2]內(nèi),各質(zhì)點出現(xiàn)的個數(shù)是相互獨立的,即隨機變量X_{a_2}-X_{a_1}X_{b_2}-X_{b_1}是相互獨立的
  3. 普通性:在很短的時間(0,t]內(nèi),幾乎不可能出現(xiàn)兩個以上的質(zhì)點,且有
    P\{X_t=1\}=\lambda t+\circ(t),\quad P\{X_t=2\}=\circ(t),
    其中\lambda為常數(shù)。
    則稱X_t是參數(shù)為\lambdaPoisson流

\lambda>0已知,若 r.vX 的分布律為
P\{X=k\}=\frac{\lambda^{k}}{k !} e^{-\lambda}, k=0,1,2, \cdots
稱稱X 服從參數(shù)為\lambdaPoisson分布,記為X \sim P(\lambda)

Poisson分布可用來描述稀疏事件發(fā)生的頻數(shù)

  • 所謂稀疏事件,是指在單次試驗中發(fā)生的概率很小,而試驗的次數(shù)又很大

可以驗證,Poisson分布滿足分布律的基本性質(zhì)

  1. P\{X=k\}>0, k=0,1,2, \cdots
  2. \sum_{k=0}^{\infty} P\{X=k\}=\sum_{k=0}^{\infty} \frac{\lambda^{k}}{k !} e^{-\lambda}=e^{\lambda} \cdot e^{-\lambda}=1

Poisson分布與Poisson流的關(guān)系:在Poisson流中,記時間間隔(0,t]中出現(xiàn)的質(zhì)點數(shù)為X

Poisson流

X \sim P(\lambda t),也即
P\{X=k\}=\frac{\lambda t^{k}}{k !} e^{-\lambda t}, k=0,1,2, \cdots
其中參數(shù)\lambda稱為Poisson強度.

Poisson強度可以直觀地理解為單位時間內(nèi)出現(xiàn)的質(zhì)點個數(shù)的平均數(shù)


Poisson(小數(shù))定理(Poisson law of small numbers):設\lambda>0為常數(shù),n 為正整數(shù),\lim _{n \rightarrow \infty} n p_{n}=\lambda,則對任一非負整數(shù)k,有
\lim _{n \rightarrow \infty} C_{n}^{k} p_{n}^{k}\left(1-p_{n}\right)^{n-k}=\frac{\lambda^{k} e^{-\lambda}}{k !}
證:記n p_{n}=\lambda_{n}, p_{n}=\lambda_{n} / n,則
\begin{aligned} C_{n}^{k}& p_{n}^{k}\left(1-p_{n}\right)^{n-k}= C_{n}^{k}\left(\frac{\lambda_{n}}{n}\right)^{k}\left(1-\frac{\lambda_{n}}{n}\right)^{n-k} \\ &=\frac{\lambda_{n}^{k}}{k !}\left[1 \cdot\left(1-\frac{1}{n}\right) \cdot\left(1-\frac{2}{n}\right) \cdots\left(1-\frac{k-1}{n}\right)\right]\left(1-\frac{\lambda_{n}}{n}\right)^{n}\left(1-\frac{\lambda_{n}}{n}\right)^{-k} \end{aligned}
因為
\begin{aligned} \lim\limits_{n\to\infty}&\underbrace{1\cdot\left(1-\frac1n\right)\cdot\left(1-\frac2n\right)\ldots\left(1-\frac{k-1}n\right)}_{k\text{個}}\\ &=1\cdot\underbrace{\lim\limits_{n\to\infty}\left(1-\frac1n\right)\cdot\lim\limits_{n\to\infty}\left(1-\frac2n\right)\ldots\lim\limits_{n\to\infty}\left(1-\frac{k-1}n\right)}_{k\text{個}}\\ &=\underbrace{1\cdot1\cdot1\ldots1}_{k\text{個}}=1 \end{aligned}
\lim\limits_{n\to\infty}\left(1-\frac{\lambda_n}n\right)^n =\lim\limits_{n\to\infty}\left[\left(1-\frac{\lambda_n}n\right)^{\frac{n}{\lambda_n}}\right]^{\lambda_n} =\left[\lim\limits_{n\to\infty}\left(1-\frac{\lambda_n}n\right)^{\frac{n}{\lambda_n}}\right]^{\lim\limits_{n\to\infty}\lambda_n}=e^{\lambda}
\lim\limits_{n\to\infty}\left(1-\frac{\lambda_n}n\right)^{-k} =\left[\lim\limits_{n\to\infty}\left(1-\frac{\lambda_n}n\right)\right]^{-k}=1

\lim _{n \rightarrow \infty} C_{n}^{k} p_{n}^{k}\left(1-p_{n}\right)^{n-k}=\frac{\lambda^{k} e^{-\lambda}}{k !}

二項分布與Poisson分布的累積分布函數(shù)與分布律對比

例:若一年中某類保險者里面每個人死亡的概率等于0.005,現(xiàn)有10000個人參加這類人壽保險, 試求在未來一年中在這些保險者里面:⑴ 有40個人死亡的概率; ⑵死亡人數(shù)不超過70個的概率.

解:記 X 為未來一年中在這些人中死亡的人數(shù),則
X \sim B(10000,0.005)
(1)
P\{X=40\}=C_{10000}^{40} \times 0.005^{40} \times 0.995^{9960}
因為n=10000, p=0.005, \lambda=n p=50,所以
P\{X=40\} \approx \frac{50^{40}}{40 !} e^{-50}=0.0214
(2)
P\{X \leq 70\}=\sum_{k=0}^{70} C_{10000}^{k} \times 0.005^{k} \times 0.995^{10000-k} \approx 0.997
注:當 n 很大時,直接計算二項分布的和比較難,因此在實際中往往采用如下的方法進行計算

  1. 用計算機編程計算
  2. 利用第五章的極限定理,作近似計算

Poisson分布由法國數(shù)學家Siméon-Denis Poisson在1838年發(fā)表,最初是作為二項分布的近似被引入
Poisson分布是構(gòu)造隨機現(xiàn)象的“基本粒子”之一,其應用范圍不亞于正態(tài)分布

Poisson分布的分布律
Poisson分布的累積分布函數(shù)

課后思考題:習題二:1,2,5,6,7,8,10

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容