常見概率分布
Bernoulli分布
Bernoulli分布是單個(gè)二值隨機(jī)變量分布, 單參數(shù)∈[0,1]控制,
給出隨機(jī)變量等于1的概率. 基本形式為:

其期望為:
其方差為:
Multinoulli分布也叫范疇分布, 是單個(gè)k值隨機(jī)分布,經(jīng)常用來表示對(duì)象分類的分布. 其中是有限值.Multinoulli分布由向量
參數(shù)化,每個(gè)分量
表示第
個(gè)狀態(tài)的概率, 且
.
適用范圍: 伯努利分布適合對(duì)離散型隨機(jī)變量建模.
高斯分布
高斯也叫正態(tài)分布(Normal Distribution), 概率度函數(shù)如下:
其中, 和
分別是均值和方差, 中心峰值x坐標(biāo)由
給出, 峰的寬度受
控制, 最大點(diǎn)在
處取得, 拐點(diǎn)為
正態(tài)分布中,±1、±2
、±3
下的概率分別是68.3%、95.5%、99.73%,這3個(gè)數(shù)最好記住。
此外, 令高斯分布即簡化為標(biāo)準(zhǔn)正態(tài)分布:
對(duì)概率密度函數(shù)高效求值:
其中,通過參數(shù)
來控制分布精度。
何時(shí)采用正態(tài)分布
問: 何時(shí)采用正態(tài)分布?
答: 缺乏實(shí)數(shù)上分布的先驗(yàn)知識(shí), 不知選擇何種形式時(shí), 默認(rèn)選擇正態(tài)分布總是不會(huì)錯(cuò)的, 理由如下:
- 中心極限定理告訴我們, 很多獨(dú)立隨機(jī)變量均近似服從正態(tài)分布, 現(xiàn)實(shí)中很多復(fù)雜系統(tǒng)都可以被建模成正態(tài)分布的噪聲, 即使該系統(tǒng)可以被結(jié)構(gòu)化分解.
- 正態(tài)分布是具有相同方差的所有概率分布中, 不確定性最大的分布, 換句話說, 正態(tài)分布是對(duì)模型加入先驗(yàn)知識(shí)最少的分布.
正態(tài)分布的推廣:
正態(tài)分布可以推廣到空間, 此時(shí)稱為多位正態(tài)分布, 其參數(shù)是一個(gè)正定對(duì)稱矩陣
:
對(duì)多為正態(tài)分布概率密度高效求值:
此處,是一個(gè)精度矩陣。
指數(shù)分布
深度學(xué)習(xí)中, 指數(shù)分布用來描述在點(diǎn)處取得邊界點(diǎn)的分布, 指數(shù)分布定義如下:
指數(shù)分布用指示函數(shù)來使
取負(fù)值時(shí)的概率為零。
Laplace 分布
一個(gè)聯(lián)系緊密的概率分布是 Laplace 分布(Laplace distribution),它允許我們?cè)谌我庖稽c(diǎn) 處設(shè)置概率質(zhì)量的峰值
Dirac分布和經(jīng)驗(yàn)分布
Dirac分布可保證概率分布中所有質(zhì)量都集中在一個(gè)點(diǎn)上. Diract分布的狄拉克函數(shù)(也稱為單位脈沖函數(shù))定義如下:
Dirac 分布經(jīng)常作為 經(jīng)驗(yàn)分布(empirical distribution)的一個(gè)組成部分出現(xiàn)
, 其中, m個(gè)點(diǎn)是給定的數(shù)據(jù)集, 經(jīng)驗(yàn)分布將概率密度
賦給了這些點(diǎn).
當(dāng)我們?cè)谟?xùn)練集上訓(xùn)練模型時(shí), 可以認(rèn)為從這個(gè)訓(xùn)練集上得到的經(jīng)驗(yàn)分布指明了采樣來源.
適用范圍: 狄拉克δ函數(shù)適合對(duì)連續(xù)型隨機(jī)變量的經(jīng)驗(yàn)分布.
期望、方差、協(xié)方差、相關(guān)系數(shù)
期望
在概率論和統(tǒng)計(jì)學(xué)中,數(shù)學(xué)期望(或均值,亦簡稱期望)是試驗(yàn)中每次可能結(jié)果的概率乘以其結(jié)果的總和。它反映隨機(jī)變量平均取值的大小。
- 線性運(yùn)算:
- 推廣形式:
- 函數(shù)期望:設(shè)
為
的函數(shù),則
的期望為
- 離散函數(shù):
- 連續(xù)函數(shù):
- 離散函數(shù):
注意:
- 函數(shù)的期望大于等于期望的函數(shù)(Jensen不等式),即
![]()
- 一般情況下,乘積的期望不等于期望的乘積。
- 如果
和
相互獨(dú)立,則
。
方差
概率論中方差用來度量隨機(jī)變量和其數(shù)學(xué)期望(即均值)之間的偏離程度。方差是一種特殊的期望。定義為:
方差性質(zhì):
1)
![]()
2)常數(shù)的方差為0;
3)方差不滿足線性性質(zhì);
4)如果和
相互獨(dú)立,
協(xié)方差
協(xié)方差是衡量兩個(gè)變量線性相關(guān)性強(qiáng)度及變量尺度。 兩個(gè)隨機(jī)變量的協(xié)方差定義為:
方差是一種特殊的協(xié)方差。當(dāng)時(shí),
。
協(xié)方差性質(zhì):
1)獨(dú)立變量的協(xié)方差為0。
2)協(xié)方差計(jì)算公式:
3)特殊情況:
相關(guān)系數(shù)
相關(guān)系數(shù)是研究變量之間線性相關(guān)程度的量。兩個(gè)隨機(jī)變量的相關(guān)系數(shù)定義為:
相關(guān)系數(shù)的性質(zhì):
1)有界性。相關(guān)系數(shù)的取值范圍是 [-1,1],可以看成無量綱的協(xié)方差。
2)值越接近1,說明兩個(gè)變量正相關(guān)性(線性)越強(qiáng)。越接近-1,說明負(fù)相關(guān)性越強(qiáng),當(dāng)為0時(shí),表示兩個(gè)變量沒有相關(guān)性。