對于某些連續(xù)變量(比如周期變量),使用高斯分布建模并不合適。
為什么不合適?

考慮觀測數(shù)據(jù)集的均值問題,首先假設
為弧度,很明顯平均值
強烈依賴坐標系(原點)的選取。為了找一個均值不變的度量,我們將觀測當做單位圓上的點,這樣就可以被描述成一個二維的單元向量
(取值區(qū)間在-1到1),求平均也就是
根據(jù)該均值找到對應的角度
,這個定義將會保證均值的位置與極坐標原點的選擇無關(???)。另外
通常位于單位圓的內部。在笛卡爾坐標系下
,因此樣本均值的笛卡爾坐標
,帶入上面的均值公式可得:
使用公式可以求出
,也就是觀測數(shù)據(jù)集
的均值。

現(xiàn)在我們考慮高斯分布對于周期變量的一個推廣: von Mises 分布。
按照慣例我們考慮周期函數(shù)分布的周期為
,滿足下面三個條件:
我們可以很容易地得到一個類似高斯的分布,滿足這三個性質:兩個變量的高斯分布,均值為
,協(xié)方差矩陣為
,其中
是個
的單位矩陣。因此
概率為常數(shù)的輪廓線是圓形,如圖所示。

該分布沿著一個固定半徑的圓周的值。如果我們將這個分布的形式從笛卡爾坐標系轉換到極坐標系,這樣的分布具有周期性。
替換到高斯分布的公式里面,考察指數(shù)項(只有指數(shù)項與
定義
這被稱為von Mises分布,或者環(huán)形正態(tài)分布( circular normal )。其中
對于大的m值,分布逼近高斯分布。

現(xiàn)在考慮von Mises 分布中參數(shù)和
的最大似然估計,對數(shù)似然函數(shù):
求
令關于的導數(shù)為0:
使用三角恒等式
我們有
這跟我們之前在二維笛卡爾空間的觀測下求取的均值相同
-
求
這里沒看懂,直接貼圖

