李宏毅深度學(xué)習(xí)(二):計(jì)算圖與反向傳播

最近看了李宏毅老師的深度學(xué)習(xí)視頻課程,真的是講得十分細(xì)致,從頭到尾看下來一遍,對深度學(xué)習(xí)模型有了一個(gè)基本的認(rèn)識,趁著腦子還能記著一些東西,趕緊把學(xué)到的東西記錄下來,以備后用。
視頻地址:https://www.bilibili.com/video/av9770302/from=search&seid=905421046757750252
ppt地址:http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLDS17.html

下面開始正題吧!

1、計(jì)算圖(Computational Graph)

計(jì)算圖是用來描述一個(gè)函數(shù)的語言,有兩種基本的要素:
Node:變量,Edge:邊
如下圖所示:

根據(jù)計(jì)算圖和鏈?zhǔn)椒▌t,我們可以很直觀計(jì)算偏導(dǎo)數(shù):

在計(jì)算圖上,有可能出現(xiàn)變量共享的情況,比如x^2,此時(shí)要把兩個(gè)x拆開,當(dāng)成不同的x對待,如下面的例子:

2、計(jì)算圖在前向神經(jīng)網(wǎng)絡(luò)中的應(yīng)用

我們首先回顧下反向傳播方法:

上圖中的倒三角表示梯度的意思。

將前饋神經(jīng)網(wǎng)絡(luò)寫成計(jì)算圖的形式,大概如下圖所示:

這里涉及到了向量之間的偏導(dǎo)數(shù)計(jì)算,使用如下的雅可比矩陣:

根據(jù)雅可比矩陣的定義,我們可以隊(duì)上面需要計(jì)算的項(xiàng)進(jìn)行逐項(xiàng)分解計(jì)算:

3、計(jì)算圖在循環(huán)神經(jīng)網(wǎng)絡(luò)中的應(yīng)用

我們先來回顧一下循環(huán)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu):

畫出循環(huán)神經(jīng)網(wǎng)絡(luò)的計(jì)算圖如下圖所示:

假設(shè)我們的序列長度為三,三層的計(jì)算圖如下圖所示:

使用梯度下降來訓(xùn)練我們的循環(huán)神經(jīng)網(wǎng)絡(luò),我們可以使用計(jì)算圖:


可以得到如下的計(jì)算結(jié)果,可以看到,使用計(jì)算圖計(jì)算循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度是不是十分的方便,而且也十分容易理解循環(huán)神經(jīng)網(wǎng)絡(luò)中經(jīng)常出現(xiàn)的梯度爆炸或梯度消失的問題。
注意下圖中的梯度計(jì)算是分三部分的,圖中只顯示了第一部分。


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 第二個(gè)Topic講深度學(xué)習(xí),承接前面的《淺談機(jī)器學(xué)習(xí)基礎(chǔ)》。 深度學(xué)習(xí)簡介 前面也提到過,機(jī)器學(xué)習(xí)的本質(zhì)就是尋找最...
    我偏笑_NSNirvana閱讀 16,201評論 7 49
  • 去年過年回老家高中同學(xué)聚會(huì),吃完喝完,準(zhǔn)備來個(gè)愉快的大合影。我叫,誰有蘋果6以上的,快拿來拍照!大家全部搖頭,最好...
    梅小塵閱讀 261評論 3 2
  • 01 三歲多的時(shí)候,翩翩忽然開始關(guān)心生死問題,一天在衛(wèi)生間里看著我問:“媽媽,將來你老了的話,很快就會(huì)死的,是嗎?...
    楊詩遠(yuǎn)閱讀 2,168評論 4 7
  • 當(dāng)你覺得不想活著的時(shí)候最好去醫(yī)院看一看,生命是多么寶貴。 現(xiàn)在的我們怎么啦!為什么總要在經(jīng)...
    愛在進(jìn)行時(shí)閱讀 180評論 0 0
  • 甘五閱讀 335評論 2 6

友情鏈接更多精彩內(nèi)容