第九章 馬爾可夫模型——統(tǒng)計自然語言處理基礎筆記

1. 馬爾可夫模型

特征:

  1. 有限歷史假設
    該隨機變量的概率,只取決于前面一個隨機變量
  1. 時間不變性
    時間變化不影響各隨機變量的概率

但是n-gram模型是馬爾可夫模型的特殊情況,n大于等于2時候就違反了有限歷史假設。此時馬爾可夫可以改造成

馬爾可夫模型形式化表達:


分別是初始狀態(tài)概率,狀態(tài)集,轉(zhuǎn)移矩陣。其實就是個一個非確定的有限自動機。

2. 隱馬爾可夫模型

所謂隱馬爾可夫模型,就是看不見的馬爾可夫模型。馬爾可夫模型的所處的狀態(tài)是不可見的,但是狀態(tài)會以一定的概率產(chǎn)生觀測值。(可能一個狀態(tài)只對應一個觀測值,也可能對應多個)。

所以,隱馬爾可夫可以描述現(xiàn)實中很多情況。我們有一個黑箱(馬爾可夫模型),不知道內(nèi)部的運行機制,只能看到黑箱的輸出(觀測值)。隱馬爾可夫主要需要解決的問題就是如何從觀測值推知黑箱的運行機制(即馬爾可夫模型的各個參數(shù))。

2.1 隱馬爾可夫模型形式化定義

Q:狀態(tài)集合
V:觀測集合

π:初始狀態(tài)概率矩陣
A:轉(zhuǎn)移概率矩陣(Aij,就是從狀態(tài) i 轉(zhuǎn)移到狀態(tài) j 的概率)
B:觀測概率矩陣(Bij,就是從狀態(tài) i 產(chǎn)生觀測 j 的概率)

2.2 隱馬兩個基本假設

  1. 齊次馬爾可夫假設:當前狀態(tài)只和上一狀態(tài)有關


  2. 觀測獨立性假設:任意時刻的觀測只依賴于該時刻的馬爾可夫鏈狀態(tài)


2.3 隱馬三個基本問題

  1. 概率計算問題:就是在此模型下,輸出某觀測序列概率
  1. 學習問題:已知觀測序列求模型參數(shù)
  1. 預測問題:知道模型和觀測序列求狀態(tài)序列
最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內(nèi)容