我寫(xiě)的這些東西并不代表我已經(jīng)完全理解了,只是從別的地方看到的可能會(huì)用到的知識(shí)點(diǎn)mark一下,以后回想起來(lái)可能會(huì)用得到。
高斯分布就是正態(tài)分布
高斯分布在自然界非常常見(jiàn),中心極限定理很好的說(shuō)明了它,但事情往往不是那么純粹,很多時(shí)候我們得到的結(jié)果里面會(huì)混入兩個(gè)截然不同的樣本數(shù)據(jù)集,它們雖然各自都是高斯分布,但是它們的均值和方差都不一樣,如果拿到的是它們的混合數(shù)據(jù),就不能簡(jiǎn)單的使用一個(gè)高斯擬合來(lái)處理它了。
可能存在的雙重高斯分布
該文章介紹的一個(gè)R包可以做
The bimodal distribution was approximated by the ‘normalmixEM’ function in the ‘mixtools’ package of R.
需要用到mixtools包的normalmixEM函數(shù)
幫助文檔代碼如下
data(faithful)
attach(faithful)
set.seed(100)
system.time(out<-normalmixEM(waiting, arbvar = FALSE, epsilon = 1e-03))
out
hist(waiting)
plot(out,2)
可以看到,很簡(jiǎn)單一個(gè)函數(shù),就可以把faithful這個(gè)數(shù)據(jù)框里面的waiting列的數(shù)據(jù)進(jìn)行雙重高斯分布擬合!
說(shuō)到雙重正態(tài)分布,可以運(yùn)用到男女身高,em算法等等
這里貼上我的參考文章:https://cloud.tencent.com/developer/article/1508952