背景:
報(bào)了深藍(lán)學(xué)院的語(yǔ)音識(shí)別課程,這里做學(xué)習(xí)記錄
第三課:高斯混合模型
1.潛變量
1)觀測(cè)變量(observed variable)
?直接可以觀測(cè)到的變量
2)潛(隱)變量(latent variable )
?無(wú)法直接被觀測(cè)到,需要通過模型和觀測(cè)變量進(jìn)行推斷
?利用潛變量來(lái)解釋觀測(cè)變量的數(shù)學(xué)模型,稱為潛變量模型,GMM、HMM都是潛變量模型
?潛變量模型將不完全數(shù)據(jù)(只有觀測(cè)數(shù)據(jù))的邊緣分布轉(zhuǎn)換成容易處理的完全數(shù)據(jù)(觀測(cè)數(shù)據(jù)+潛變量)的聯(lián)合分布
2.高斯模型
- 高斯分布在自然界的數(shù)據(jù)中廣泛存在;
- 中心極限定理:在適當(dāng)?shù)臈l件下,大量相互獨(dú)立隨機(jī)變量的均值經(jīng)適當(dāng)標(biāo)準(zhǔn)化后依分布收斂于正態(tài)分布。
1)單高斯模型
2)多維高斯模型
3)混合高斯模型
4)EM
3. 代碼實(shí)踐
主要代碼在上面有詳細(xì)實(shí)現(xiàn),以下是一些實(shí)現(xiàn)的感想:
1)先要對(duì)公式有個(gè)理解,要不代碼錯(cuò)了都不知道怎么修改;
2)首先理解高斯模型的計(jì)算公式,知道概率的計(jì)算過程,
1.從一個(gè)變量理解,輸一個(gè)x,例如x=0.3,概率 p =
2.多維變量計(jì)算過程,
3.多個(gè)高斯模型混合實(shí)現(xiàn)方式,
- 3)EM算法