生信小技術(shù)(雙重高斯分布)

我寫(xiě)的這些東西并不代表我已經(jīng)完全理解了,只是從別的地方看到的可能會(huì)用到的知識(shí)點(diǎn)mark一下,以后回想起來(lái)可能會(huì)用得到。

高斯分布就是正態(tài)分布

高斯分布在自然界非常常見(jiàn),中心極限定理很好的說(shuō)明了它,但事情往往不是那么純粹,很多時(shí)候我們得到的結(jié)果里面會(huì)混入兩個(gè)截然不同的樣本數(shù)據(jù)集,它們雖然各自都是高斯分布,但是它們的均值和方差都不一樣,如果拿到的是它們的混合數(shù)據(jù),就不能簡(jiǎn)單的使用一個(gè)高斯擬合來(lái)處理它了。

可能存在的雙重高斯分布

該文章介紹的一個(gè)R包可以做

The bimodal distribution was approximated by the ‘normalmixEM’ function in the ‘mixtools’ package of R.

需要用到mixtools包的normalmixEM函數(shù)
幫助文檔代碼如下

data(faithful)
attach(faithful)
set.seed(100)
system.time(out<-normalmixEM(waiting, arbvar = FALSE, epsilon = 1e-03))
out
hist(waiting)
plot(out,2)

可以看到,很簡(jiǎn)單一個(gè)函數(shù),就可以把faithful這個(gè)數(shù)據(jù)框里面的waiting列的數(shù)據(jù)進(jìn)行雙重高斯分布擬合!

說(shuō)到雙重正態(tài)分布,可以運(yùn)用到男女身高,em算法等等

這里貼上我的參考文章:https://cloud.tencent.com/developer/article/1508952

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容