概率論
我們需要描述一組數(shù)據(jù)時(shí)候,本質(zhì)上需要描述每一個(gè)點(diǎn)。但是如果我們可以用分布去表示這些數(shù)據(jù),就只需要均值或者方差分布參數(shù),大大節(jié)省了存儲(chǔ)空間。
離散型隨機(jī)分布
伯努利分布:一次實(shí)驗(yàn),結(jié)果只有兩種結(jié)果。 ,期望:
,方差:
二項(xiàng)分布:n次伯努利實(shí)驗(yàn)正好得到k次成功的概率,單次成功的概率為p。當(dāng)n=1的時(shí)候退化到伯努利分布。當(dāng)p=0.5的時(shí)候,整體上和正態(tài)分布圖形類似。,期望:
,方差:
幾何分布:進(jìn)行n次伯努利實(shí)驗(yàn),在獲取成功前需要進(jìn)行多少次實(shí)驗(yàn)。分布圖形是越往前概率越大,, 期望
, 方差是
泊松分布:?jiǎn)挝粫r(shí)間內(nèi)獨(dú)立事件發(fā)生次數(shù)的概率分布,它是二項(xiàng)分布n很大而p很小時(shí)的極限。泊松分布可以把單位時(shí)間切成n次,每次成功的概率為p,那么單位時(shí)間內(nèi)出現(xiàn)k次的概率就是二項(xiàng)分布,所以泊松分布是二項(xiàng)分布的一種極限形式。它的分布圖形也和二項(xiàng)分布類似,特別是n很大而p很小時(shí)。, 期望和方差都是
,其中k是發(fā)生的次數(shù),
是發(fā)生的平均次數(shù),當(dāng)
時(shí),泊松分布趨向于正態(tài)分布。
指數(shù)分布:對(duì)應(yīng)于泊松分布,指數(shù)分布是指兩次獨(dú)立事件發(fā)生的時(shí)間間隔的概率分布。
,其中
是指單位時(shí)間內(nèi)獨(dú)立事件發(fā)生的次數(shù)。期望=
,方差=
負(fù)二項(xiàng)分布:在一連串伯努利實(shí)驗(yàn)中,恰好在第r+k次實(shí)驗(yàn)出現(xiàn)第r次成功的概率。換句話說,是指出現(xiàn)第r次成功時(shí)所需要的總實(shí)驗(yàn)次數(shù)的概率分布。
,期望
, 方差
多項(xiàng)分布:二項(xiàng)分布的擴(kuò)展。
連續(xù)型隨機(jī)分布
均勻分布:,期望
, 方差
正態(tài)分布:,期望
,方差
。
指數(shù)分布:可以擴(kuò)展到連續(xù)隨機(jī)變量,仍然代表兩次獨(dú)立事件發(fā)生的事件間隔(實(shí)數(shù))。公式和上面一致。
最大熵
那么以上的概率分布是如何來的呢?最大熵理論提供了一種解釋的方法,概率分布是滿足一定約束條件下的最大熵概率分布。對(duì)于一個(gè)隨機(jī)變量來說,如果沒有任何約束,我們大概率傾向于該隨機(jī)變量符合均勻分布。對(duì)應(yīng)到現(xiàn)實(shí)中,如果沒有任何前提條件,我們認(rèn)為事件發(fā)生的概率是相同的。比如骰子,我們會(huì)默認(rèn)每一面的概率是1/6。最大熵概率分布滿足一下條件:
其中ai是預(yù)先定好的約束條件,比如均值、方差。 使用拉格朗日乘子得到:
其中都為正數(shù),解為:
假設(shè)y值固定在某個(gè)確定的值,對(duì)p求偏導(dǎo):
等式兩邊乘以ln2,對(duì)logp進(jìn)行換底:
得到解p*:
伯努利分布推導(dǎo)
約束條件:
其中代表事件成功的概率,也是伯努利分布的期望值,得到
同時(shí):
由以上兩式得到:
綜合以上:, 我們就得到了伯努利分布的公式,伯努利分布是在約束期望值下的最大熵概率分布。
正態(tài)分布推導(dǎo)
約束條件:均值和方差
其他分布的約束條件
其他概念
概率分布函數(shù),條件概率,聯(lián)合概率, 獨(dú)立分布,條件獨(dú)立,熵, 交
叉熵、條件熵、KL散度