反向傳播算法

卷積網(wǎng)絡(luò)

這里討論通過卷積的方式表達(dá)CNN反向傳播

池化層

假設(shè)我們的池化區(qū)域大小是2x2,并且下一層的梯度為:

如果是MAX,假設(shè)我們之前在前向傳播時記錄的最大值位置分別是左上,右下,右上,左下,則還原后的梯度為:

如果是AVG,則上一層的梯度為:

卷積層

前向傳播

反向傳播

此處卷積的padding為"full"

簡單證明

可得

這上面9個式子其實可以用一個矩陣卷積的形式表示,即

卷積核/偏置

卷積核梯度

證明的方法與上面類似,偏置梯度為對每個通道的梯度求和

循環(huán)網(wǎng)絡(luò)

RNN

從時間軸的角度看(從左至右),如果循環(huán)次數(shù)特別多,意味著網(wǎng)絡(luò)太深,梯度難以傳回。LSTM通過改進(jìn)隱藏層結(jié)構(gòu)來解決這個問題。

LSTM

前向傳播

輸入門和輸入
遺忘門
細(xì)胞狀態(tài)
輸出和輸出門
標(biāo)簽預(yù)測

反向傳播

這里假設(shè)L是均方損失

為什么LSTM能解決梯度爆炸和消失的問題
https://www.zhihu.com/question/34878706

參考

劉建平的博客園

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容