????LSTM的本質使用三個門分別來表示“需要多少輸入”,“需要記住前一個時刻隱藏單元多少內容”,“需要輸出多少東西”。
????整個模型用圖像表示如下圖:

????三個門用公式表示如下

????其中三個門的輸入就是當前時刻的輸入xt和上一個時刻的隱藏狀態(tài),套在外面的函數(shù)為非線性激活函數(shù),如logistic函數(shù)。輸出區(qū)間為(0,1)。

????更新完記憶單元后,再根據(jù)輸出門來決定當前時刻的隱狀態(tài)ht


這里上面橫的一條是C,下面橫的一條是H
總結一下,三個門都有各自的參數(shù),他們的輸入均是本時刻的輸入矩陣Xt和上時刻的隱藏單元Ht-1。這里引入新的名粗“記憶單元”,這個也會對后續(xù)產(chǎn)生影響,但是有別于隱藏單元。
? ? 隱藏門和上時刻的記憶單元Ct-1點乘,? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?A
? ? 輸入門和本時刻的候選記憶向量點乘? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? B
? ? A+B組成新的記憶單元Ct
? ? 輸出門再與Ct點乘生成新的隱藏單元Ht