卡爾曼濾波|機(jī)器學(xué)習(xí)推導(dǎo)系列(十八)

一、概述

HMM 模型適用于隱變量是離散的值的時(shí)候,對(duì)于連續(xù)隱變量的 HMM,常用卡爾曼濾波(Kalman Filtering)描述線性高斯模型的態(tài)變量,使用粒子濾波(Particle Filter)來表述非高斯非線性的態(tài)變量。

線性體現(xiàn)在上一時(shí)刻和這一時(shí)刻的隱變量以及隱變量和觀測(cè)變量之間,它們的關(guān)系可以表示為:

z_{t}=A\cdot z_{t-1}+B+\varepsilon \\ x_{t}=C\cdot z_{t}+D+\delta \\ \varepsilon \sim N(0,Q)\\ \delta \sim N(0,R)

類比HMM中幾個(gè)參數(shù),我們也可以寫出類似初始概率、轉(zhuǎn)移概率或發(fā)射概率的形式:

P(z_{t}|z_{t-1})\sim N(A\cdot z_{t-1}+B,Q)\\ P(x_{t}|z_{t})\sim N(C\cdot z_{t}+D,R)\\ z_{1}\sim N(\mu _{1},\Sigma _{1})

所有的參數(shù)為:

\theta =(A,B,C,D,Q,R,\mu _{1},\Sigma _{1})

二、Filtering問題

在多個(gè)inference問題中,卡爾曼濾波更關(guān)心Filtering問題,即求邊緣概率:

P(z_{t}|x_{1},x_{2},\cdots ,x_{t})

類似HMM的前向算法,我們需要找到一個(gè)遞推關(guān)系:

P(z_{t}|x_{1},x_{2},\cdots ,x_{t})\\ =\frac{P(x_{1},x_{2},\cdots ,x_{t},z_{t})}{P(x_{1},x_{2},\cdots ,x_{t})}\\ \propto P(x_{1},x_{2},\cdots ,x_{t},z_{t})\\ =\underset{P(x_{t}|z_{t})}{\underbrace{P(x_{t}|x_{1},x_{2},\cdots ,x_{t-1},z_{t})}}\cdot P(x_{1},x_{2},\cdots ,x_{t-1},z_{t})\\ =P(x_{t}|z_{t})\cdot P(x_{1},x_{2},\cdots ,x_{t-1},z_{t})\\ =P(x_{t}|z_{t})\cdot \underset{prediction問題} {\underbrace{P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})}}\cdot P(x_{1},x_{2},\cdots ,x_{t-1})\\ \propto P(x_{t}|z_{t})\cdot P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})

上式結(jié)果中,P(x_{t}|z_{t})已知,而另一項(xiàng)可做以下轉(zhuǎn)化:

P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})\\ =\int _{z_{t-1}}P(z_{t},z_{t-1}|x_{1},x_{2},\cdots ,x_{t-1})\mathrmu0z1t8osz_{t-1}\\ =\int _{z_{t-1}}\underset{P(z_{t}|z_{t-1})}{\underbrace{P(z_{t}|z_{t-1},x_{1},x_{2},\cdots ,x_{t-1})}}\cdot \underset{Filtering問題}{\underbrace{P(z_{t-1}|x_{1},x_{2},\cdots ,x_{t-1})}}\mathrmu0z1t8osz_{t-1}\\ =\int _{z_{t-1}}P(z_{t}|z_{t-1})\cdot P(z_{t-1}|x_{1},x_{2},\cdots ,x_{t-1})\mathrmu0z1t8osz_{t-1}

因此,我們找到了Filtering問題的遞推式:

{\color{Red}{P(z_{t}|x_{1},x_{2},\cdots ,x_{t})}}=C\cdot P(x_{t}|z_{t})\cdot \int _{z_{t-1}}P(z_{t}|z_{t-1})\cdot {\color{Red}{P(z_{t-1}|x_{1},x_{2},\cdots ,x_{t-1})}}\mathrmu0z1t8osz_{t-1}

因此,我們可以確定求解Filtering問題的步驟如下:

t=1\left\{\begin{matrix} P(z_{1}|x_{1})\rightarrow update\\ P(z_{2}|x_{1})\rightarrow prediction \end{matrix}\right.\\ t=2\left\{\begin{matrix} P(z_{2}|x_{1},x_{2})\rightarrow update\\ P(z_{3}|x_{1},x_{2})\rightarrow prediction \end{matrix}\right.\\ \vdots \\ t\left\{\begin{matrix} P(z_{t}|x_{1},x_{2},\cdots ,x_{t})\rightarrow update\\ P(z_{t+1}|x_{1},x_{2},\cdots ,x_{t})\rightarrow prediction \end{matrix}\right.

很明顯這是一個(gè)online的過程。

三、Filtering問題求解

通過上述轉(zhuǎn)化我們可以確定Filtering問題的計(jì)算是通過以下兩步迭代計(jì)算進(jìn)行的:

Step1 Prediction:
P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})=\int _{z_{t-1}}P(z_{t}|z_{t-1})\cdot P(z_{t-1}|x_{1},x_{2},\cdots ,x_{t-1})\mathrmu0z1t8osz_{t-1}
Step2 Update:
P(z_{t}|x_{1},x_{2},\cdots ,x_{t})=C\cdot P(x_{t}|z_{t})\cdot P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})

我們可以確定的是幾個(gè)高斯分布經(jīng)過相乘或者積分運(yùn)算后仍然是高斯分布,所以我們假設(shè):

Prediction:P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})=N(z_{t}|\mu _{t}^{*},\Sigma _{t}^{*})\\ Update:P(z_{t}|x_{1},x_{2},\cdots ,x_{t})=N(z_{t}|\mu _{t},\Sigma _{t})

代入高斯分布的形式可以得到:

Prediction:N(z_{t}|\mu _{t}^{*},\Sigma _{t}^{*})=\int _{z_{t-1}}N(z_{t}|A\cdot z_{t-1}+B,Q)\cdot N(z_{t-1}|\mu _{t-1},\Sigma _{t-1})\cdot \mathrmu0z1t8osz_{t-1} \\ Update:N(z_{t}|\mu _{t},\Sigma _{t})=C\cdot N(x_{t}|C\cdot z_{t}+D,R)\cdot N(z_{t}|\mu _{t}^{*},\Sigma _{t}^{*})

接下來的求解需要用到高斯分布|機(jī)器學(xué)習(xí)推導(dǎo)系列(二)第六部分內(nèi)容中我們得到的結(jié)論,即已知P(x)P(y|x)來求P(y)P(x|y),這里我們直接套用公式即可。

首先,在Prediction過程中:

\underset{P(y)}{\underbrace{P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})}}=\int _{z_{t-1}}\underset{P(y|x)}{\underbrace{P(z_{t}|z_{t-1})}}\cdot \underset{P(x)}{\underbrace{P(z_{t-1}|x_{1},x_{2},\cdots ,x_{t-1})}}\mathrmu0z1t8osz_{t-1}

代入計(jì)算P(y)的公式可得:

\mu _{t}^{*}=A\mu _{t-1}+B\\ \Sigma _{t}^{*}=Q+A\Sigma _{t-1}A^{T}

在update過程中:

\underset{P(x|y)}{\underbrace{P(z_{t}|x_{1},x_{2},\cdots ,x_{t})}}=C\cdot \underset{P(y|x)}{\underbrace{P(x_{t}|z_{t})}}\cdot \underset{P(x)}{\underbrace{P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})}}

代入計(jì)算P(x|y)的的公式也可以得出結(jié)果,過程比較復(fù)雜,所以省略。

注意這里將x_{1},x_{2},\cdots ,x_{t-1}看做已知即可,然后再套用p(x)、p(y|x)等形式。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容