熵最大原理是一種推導(dǎo)概率分布的方法,它認(rèn)為:在滿足約束條件下的概率分布中,熵最大的分布是最合適的選擇。
熵的定義:對(duì)于一個(gè)離散型隨機(jī)變量取值于
,其概率分布為
,則信息熵定義為
,對(duì)于連續(xù)型隨機(jī)變量,熵的定義為
。其中,熵越大,表示分布的信息損失越少。
1.約束條件
為推導(dǎo)正態(tài)分布,我們假設(shè)有如下約束:
- 所有點(diǎn)的概率和為1:
- 這個(gè)分布有均值,大小為
:
- 這個(gè)分布有方差,大小為
:
2.最大熵計(jì)算
使用拉格朗日乘子法求解最大熵分布
定義拉格朗日函數(shù):
開始求解:
我們對(duì) 進(jìn)行變分求導(dǎo),對(duì)
取變分為
,即
。對(duì)
逐項(xiàng)求偏導(dǎo):
熵項(xiàng):
將這些項(xiàng)相加:
整理得:
兩邊取指數(shù):
令 ,則有:
為此我們只需要求出這三個(gè)參數(shù)( )即可得到
很明顯, 為 0 。如果
,則相當(dāng)于均值進(jìn)行了偏移得到新的均值
,也就是沒有用到上述的均值約束條件
,因此很容易判斷出
為 0 。由此可以得到
的分布函數(shù):
現(xiàn)在開始計(jì)算 和
利用概率約束條件 計(jì)算
:
先求出積分:
這個(gè)積分的標(biāo)準(zhǔn)計(jì)算方法是:
所以:
解得:
利用方差約束條件 計(jì)算
:
利用高斯積分公式:
令 ,整理得:
結(jié)論,正態(tài)分布概率密度曲線為: