一、推斷的動機和困難
- 推斷的動機
推斷問題是在概率圖模型中經(jīng)常遇到的問題,也就是給定觀測變量的情況下求解后驗
,這里的
是隱變量(注意原來我們常用
和
來表示隱變量和觀測變量,不過在深度學習中我們更傾向于使用
和
來表示隱變量和觀測變量)。
那么為什么推斷問題是重要的呢?也就是說推斷的動機是什么呢?推斷的動機主要包括以下兩個方面:
①推斷本身是有意義的。推斷問題事實上是一種對原因的追溯,在給定觀測的情況下來求解它的原因,因此推斷本身是有意義的。
②為參數(shù)的學習提供幫助?;叵隕M算法中,我們期待引入的分布能近似后驗分布
,然后才能利用求解參數(shù)
,因此推斷問題能夠幫助求解參數(shù)。
- 推斷的困難
不幸的是推斷問題往往是困難的,在大多數(shù)情況下,精確推斷往往計算復雜度過高以致于幾乎不可能進行,因此我們很多時候需要采用一些近似推斷的方法。
舉例來說,像下圖中的玻爾茲曼機,作為無向圖模型其節(jié)點之間是相互聯(lián)系和影響的,難以求解,也就是mutual interaction,而只有對模型進行一些限制,比如受限玻爾茲曼機,才可以有求解的方法,然而這樣的限制必定會限制模型的能力。另外對于深度玻爾茲曼機,以下圖中三層結(jié)構(gòu)為例,在給定其中兩層時另外一層才會條件獨立,否則仍然會有復雜度過高的問題。而對于有向圖模型,比如sigmoid信念網(wǎng)絡(luò),其中存在head-to-head結(jié)構(gòu),又會造成explain away問題,僅僅在一些特殊情況下可解比如線性高斯模型:

二、推斷即優(yōu)化
在前面的EM算法和變分推斷的章節(jié)中我們已經(jīng)感受過了,求解推斷問題的過程是引入一個分布并且將
似然轉(zhuǎn)化成
和KL散度的和,目標是讓
盡可能地大,于是推斷問題就成了一個優(yōu)化問題。具體的,有數(shù)據(jù)
,對于
似然:
對于,我們有: