概率論
基礎(chǔ)概念
隨機(jī)試驗(yàn)
試驗(yàn)是指為了觀察某事的結(jié)果或某物的性能而從事的某種活動(dòng)。在概率論中,一個(gè)試驗(yàn)如果具有以下3個(gè)特點(diǎn):
- 可重復(fù)性:在相同條件下可以重復(fù)進(jìn)行
- 可觀察性:每次實(shí)現(xiàn)的可能結(jié)果不止一個(gè),并且能事先明確實(shí)驗(yàn)的所有可能結(jié)果
- 不確定性:一次試驗(yàn)之前,不能預(yù)知會(huì)出現(xiàn)哪一個(gè)結(jié)果
這樣的試驗(yàn)是一個(gè)隨機(jī)試驗(yàn),簡(jiǎn)稱為試驗(yàn)
樣本點(diǎn)和樣本空間
每次試驗(yàn)的每一個(gè)結(jié)果成為基本事件,也稱作樣本點(diǎn),記作, 全部樣本點(diǎn)的集合成為樣本空間,記作
,則
假設(shè)擲一顆均勻骰子,觀察出現(xiàn)的點(diǎn)數(shù)。這是一個(gè)隨機(jī)試驗(yàn),樣本空間
隨機(jī)事件
基本事件是不可再分解的、最基本的事件,其他事件均可由它們復(fù)合而成,由基本事件復(fù)合而成的事件稱為隨機(jī)事件或簡(jiǎn)稱為事件。
常用大寫字母等表示事件。不如
隨機(jī)事件的概率
概率是用來描述隨機(jī)事件發(fā)生的可能性大小。比如拋硬幣的試驗(yàn),拋得次數(shù)越多,出現(xiàn)正面的 次數(shù)與投擲次數(shù)之間的比例愈加趨于。它的數(shù)學(xué)定義為:
在多次重復(fù)試驗(yàn)中,若事件發(fā)生的頻率穩(wěn)定在常數(shù)
附近擺動(dòng),且隨著試驗(yàn)次數(shù)的增加,這種擺動(dòng)的幅度是很微小的。則稱確定常數(shù)
為事件
發(fā)生的概率,記作
例子
設(shè)一年有365天,求下列事件的概率:
解
顯然事件是對(duì)立事件,有
由于每人的生日可能是365天的任意一天,因此,個(gè)人的生日有
種可能結(jié)果,而且每種結(jié)果是等可能的,因而是古典概型,事件
的發(fā)生必須是
個(gè)不同的生日,因而
的樣本點(diǎn)數(shù)為從
中取
個(gè)的排列數(shù)
,于是
條件概率
設(shè)是兩個(gè)事件,且
,則稱
為在事件發(fā)生的條件下,事件
的條件概率
表示
這兩個(gè)事件同時(shí)發(fā)生的概率。
例子
某種原件用滿未壞的概率是
,用滿
未壞的概率是
,現(xiàn)有一個(gè)此種元件,已經(jīng)用過
未壞,試求它能用到
的概率。
解
設(shè)表示
,
表示
,則
由于,因而
,因此,
解釋一下,這里由于事件包括事件
的。
事件的獨(dú)立性
如果事件發(fā)生的可能性不受事件
發(fā)生與否的影響,即
則稱事件對(duì)于事件
獨(dú)立,顯然,若
對(duì)
對(duì)立,則
對(duì)
也一定獨(dú)立,稱事件
與事件
相互獨(dú)立。
例子
口袋里裝有5個(gè)黑球與3個(gè)白球,從中有放回地取2次,每次取一個(gè),設(shè)事件表示第一次取到黑球,事件
表示第二次取到黑球,則有
因而
因此,,這表明無論
是否發(fā)生,都對(duì)
發(fā)生的概率無影響。事件
相互獨(dú)立
性質(zhì)
事件和事件
相互獨(dú)立的充分必要條件是
全概率公式
如果事件是一個(gè)完備事件組(一個(gè)事件發(fā)生的所有可能性都在這里面),并且都有正概率,則有
對(duì)于任何事件,事件
構(gòu)成最簡(jiǎn)單的完備事件組,根據(jù)全概率公式得
貝葉斯公式
設(shè)事件是一個(gè)完備事件組,則對(duì)任一事件
,
,有
以上公式就叫貝葉斯公式,可由條件概率的定義及全概率公式證明。
例子
市場(chǎng)上供應(yīng)的某種商品由甲、乙、丙3個(gè)廠商生存,甲廠占45%,乙廠占35%,丙廠占20%。如果各廠的次品率依次為4%,2%,5%?,F(xiàn)從市場(chǎng)上購買1件這種商品,發(fā)現(xiàn)是次品,試判斷它是由甲廠生產(chǎn)的概率。
解
設(shè)事件,分別表示商品由甲、乙、丙廠生產(chǎn)的,事件
表示商品為次品,得概率
根據(jù)貝葉斯公式,可得:
在購買一件商品這個(gè)試驗(yàn)中,是在試驗(yàn)以前就已經(jīng)知道的概率,所以習(xí)慣地稱為先驗(yàn)概率。試驗(yàn)結(jié)果出現(xiàn)了次品,這時(shí)條件概率
反映了在試驗(yàn)以后對(duì)
發(fā)生的來源(次品的來源)的各種可能性的大小,稱為后驗(yàn)概率。
隨機(jī)變量
把試驗(yàn)的結(jié)果與實(shí)數(shù)對(duì)應(yīng)起來,隨試驗(yàn)結(jié)果的不同而變化的量就是隨機(jī)變量,包含離散型隨機(jī)變量和連續(xù)性隨機(jī)變量。
概率分布
設(shè)離散型隨機(jī)變量的所有可能取值為
,稱
為的概率分布。
離散型隨機(jī)變量的分布律具有下列基本性質(zhì):
1.
2.
下面看一下常見的離散型概率分布。
二項(xiàng)分布
二項(xiàng)分布是一種離散型的概率分布。二項(xiàng)代表它有兩種可能的結(jié)果:成功或不成功。每次試驗(yàn)必須相互獨(dú)立,重復(fù)n次,并且每次試驗(yàn)成功的概率是相同的,為:失敗的概率也相同,為
拋硬幣就是一個(gè)典型的二項(xiàng)分布。當(dāng)我們要計(jì)算拋硬幣次,恰好有
次正面朝上的概率,可以使用二項(xiàng)分布的公式:
泊松分布
如果隨機(jī)變量的概率分布為
式中,為常數(shù),則稱隨機(jī)變量
服從參數(shù)為
的泊松分布,記為
概率密度函數(shù)
若存在非負(fù)函數(shù),使一個(gè)連續(xù)型隨機(jī)變量
取值于任一區(qū)間
的概率可以表示為
則稱為隨機(jī)變量
的概率密度函數(shù),簡(jiǎn)稱概率密度或密度函數(shù)。
正態(tài)分布
又常稱為高斯分布,其概率密度函數(shù)為
具有兩個(gè)參數(shù)和
,
代表服從正態(tài)分布的隨機(jī)變量的均值,
是此隨機(jī)變量的方差。如果一個(gè)隨機(jī)變量服從均值
,標(biāo)準(zhǔn)差為
的正太分布,記作
我們通常稱均值為,標(biāo)準(zhǔn)差為
的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布。
上圖中藍(lán)線就是標(biāo)準(zhǔn)正態(tài)分布
隨機(jī)變量的期望
對(duì)于一個(gè)隨機(jī)變量,經(jīng)常要考慮它平均取什么,期望就是概率論中的平均值,對(duì)隨機(jī)變量中心位置的一種度量。
例子
經(jīng)過長(zhǎng)期觀察積累,某射手在每次射擊命中的環(huán)數(shù)服從分布:
| 0 | 5 | 6 | 7 | 8 | 9 | 10 | |
|---|---|---|---|---|---|---|---|
| 0 | 0.05 | 0.05 | 0.1 | 0.1 | 0.2 | 0.5 |
求這個(gè)射手平均命中的環(huán)數(shù)是多少?
解
假設(shè)該射手進(jìn)行了100次射擊,那么,約有5次命中5環(huán),5次命中6環(huán),10次命中7環(huán),10次命中8環(huán),20次命中9環(huán),50次命中10環(huán),從而在一次射擊中,該射手平均命中的環(huán)數(shù)為:
我們可以看到離散型的隨機(jī)變量的期望值可以用每種取值與概率相乘之和來得到:
期望的性質(zhì)
隨機(jī)變量的方差
方差表示隨機(jī)變量的變異性,方差越大,隨機(jī)變量的結(jié)果越不穩(wěn)定。
設(shè)為一隨機(jī)變量,若
存在,則稱其為的方差,記為
,即
而稱為
的標(biāo)準(zhǔn)差或均方差
方差還可以表示為:
由方差的定義和數(shù)學(xué)期望的性質(zhì),可以推出方差的計(jì)算公式:
方差的性質(zhì)
例子
甲、乙兩車間生產(chǎn)同一種產(chǎn)品,設(shè)1000件產(chǎn)品中的次品數(shù)量分別為隨機(jī)變量,已知他們的分布律如下:
| 0 | 1 | 2 | 3 | |
|---|---|---|---|---|
| 0.2 | 0.1 | 0.5 | 0.2 |
| 0 | 1 | 2 | 3 | |
|---|---|---|---|---|
| 0.1 | 0.3 | 0.4 | 0.2 |
式討論甲、乙兩車間的產(chǎn)品質(zhì)量。
解
先計(jì)算均值
得到,甲、乙兩車間次品數(shù)的均值相同。
再計(jì)算方差
以上用到了公式
和
說明乙車間的產(chǎn)品質(zhì)量比較穩(wěn)定。
協(xié)方差
期望值分別為 與
的兩個(gè)隨機(jī)變量之間的協(xié)方差定義為:
協(xié)方差表示兩個(gè)變量的總體的誤差,這與只表示一個(gè)變量誤差的方差不同。如果兩個(gè)變量的變化趨勢(shì)一致,即其中一個(gè)大于自身的期望值,另一個(gè)是正值。如果兩個(gè)變量的變化趨勢(shì)相反,即其中一個(gè)大于自身的期望值,另一個(gè)卻小于自身的期望值,那么兩個(gè)變量之間的協(xié)方差就是負(fù)值。
如果和
式統(tǒng)計(jì)獨(dú)立的,那么二者之間的協(xié)方差就是0,因?yàn)?br>
但是反過來并不成立。
取決于協(xié)方差的線性相關(guān)性
是衡量線性獨(dú)立的無量綱數(shù),取值
之間。當(dāng)
稱為完全線性相關(guān);當(dāng)
稱為完全線性負(fù)相關(guān);當(dāng)
說兩個(gè)隨機(jī)變量是不相關(guān)的,或者說線性無關(guān)。
越接近于1表明線性相關(guān)性越好。
協(xié)方差的性質(zhì)
其中是常數(shù)。
性質(zhì)1說的是,針對(duì)同一個(gè)隨機(jī)變量,協(xié)方差就是方差。
協(xié)方差矩陣
協(xié)方差矩陣是一個(gè)矩陣,矩陣中的第個(gè)元素是
與
的協(xié)方差。這個(gè)概念是對(duì)于標(biāo)量隨機(jī)變量方差的一般化推廣。

其中,對(duì)角線上的元素為各個(gè)隨機(jī)變量的方差,非對(duì)角線上的元素為多維隨機(jī)變量各維度兩兩之間的協(xié)方差。
盡管協(xié)方差矩陣很簡(jiǎn)單,可它卻是很多領(lǐng)域里的非常有力的工具。它能導(dǎo)出一個(gè)變換矩陣,這個(gè)矩陣能使數(shù)據(jù)完全去相關(guān)(decorrelation)。從不同的角度看,也就是說能夠找出一組最佳的基以緊湊的方式來表達(dá)數(shù)據(jù)。 這個(gè)方法在統(tǒng)計(jì)學(xué)中被稱為主成分分析(principal components analysis),在圖像處理中稱為Karhunen-Loève 變換(KL-變換)。
摘自維基百科
最大似然估計(jì)
概率vs統(tǒng)計(jì)
概率研究的問題是,已知一個(gè)模型和參數(shù),怎么去預(yù)測(cè)這個(gè)模型產(chǎn)生的結(jié)果的特性(均值,方差等)。統(tǒng)計(jì)研究的問題則相反,它是有一堆數(shù)據(jù),要利用這堆數(shù)據(jù)去預(yù)測(cè)模型和參數(shù)。簡(jiǎn)單來說,概率是已知模型和參數(shù),推數(shù)據(jù)。統(tǒng)計(jì)是已知數(shù)據(jù),推模型和參數(shù)。
最大似然估計(jì)
最大似然估計(jì)是一種用來推測(cè)參數(shù)的方法,屬于統(tǒng)計(jì)領(lǐng)域的問題。
它利用已知的樣本結(jié)果信息,反推使這個(gè)結(jié)果出現(xiàn)可能性最大的模型參數(shù)值,是一種概率意義下的參數(shù)估計(jì)。
例子
假設(shè)有一種特殊的硬幣,拋這種硬幣出現(xiàn)的正反面并不相等,求它正面出現(xiàn)的概率()是多少?
解
這是一個(gè)統(tǒng)計(jì)問題,解決統(tǒng)計(jì)問題需要數(shù)據(jù)。于是我們拿這枚硬幣拋了10次,得到的數(shù)據(jù)是:反正正正正反正正正反。我們相求的正面概率
是模型參數(shù),而拋硬幣模型我們可以假設(shè)是二項(xiàng)分布。那么出現(xiàn)實(shí)驗(yàn)結(jié)果
的似然函數(shù)是多少呢?
所謂最大似然估計(jì),就是最大化這個(gè)關(guān)于的函數(shù),于是,我們畫出
的圖像:
可以看出,在時(shí),
取得最大值。
這樣,我們已經(jīng)完成了對(duì)的最大似然估計(jì)。即,拋10次硬幣,發(fā)現(xiàn)7次硬幣正面朝上,最大似然估計(jì)認(rèn)為正面朝上的概率是0.7。
更新記錄
- 2021-05-16 新增協(xié)方差和協(xié)方差矩陣。