久久人妻偷拍视频,亚洲精品中文AV

參數(shù)定義.jpg

一階動(dòng)量定義梯度下降的方向，二階動(dòng)量定義下降的步長(zhǎng)。

1、SGD（不含動(dòng)量常用的梯度下降法）

m = g（梯度）， v = 1（常量）

參數(shù)更新
w1.assign_sub(lr * grad[0])
b1.assign_sub(lr * grad[1])

2、SGDM（在SGD的基礎(chǔ)上增加了一階動(dòng)量)

m = βm + (1-β)g（梯度方向上的指數(shù)滑動(dòng)平均值），v = 1（常量）

w和b初始一階動(dòng)量均為0
m_w, m_b = 0, 0
β超參數(shù)，經(jīng)驗(yàn)值是0.9
beta = 0.9
一階動(dòng)量計(jì)算公式
m_w = beta * m_w + (1 - beta) * grads[0]
m_b = beta * m_b + (1 - beta) * grads[1]
參數(shù)更新
w1.assign_sub(lr * m_w)
b1.assign_sub(lr * m_b)

3、Adagrad （在SGD的基礎(chǔ)上增加了二階動(dòng)量）

m = g（梯度），v = Σg2（梯度平方的累計(jì)和）

設(shè)二階動(dòng)量初始值為0
v_w, v_b = 0, 0
計(jì)算二階動(dòng)量梯度平方的累計(jì)和
v_w += tf.square(grads[0])
v_b += tf.square(grads[1])
參數(shù)更新
w1.assign_sub(lr * grads[0] / tf.sqrt(v_w))
b1.assign_sub(lr * grads[1] / tf.sqrt(v_b))

4、RMSProp（在SGD的基礎(chǔ)上增加了二階動(dòng)量）

m = g（梯度），v = βv +（1-β）g2（各時(shí)刻梯度方向的指數(shù)滑動(dòng)平均）

設(shè)二階動(dòng)量初始值為0
v_w, v_b = 0, 0
β超參數(shù)，經(jīng)驗(yàn)值是0.9
beta = 0.9
計(jì)算指數(shù)滑動(dòng)平均
v_w = beta * v_w + (1 - beta) * tf.square(grads[0])
v_b = beta * v_b + (1 - beta) * tf.square(grads[1])
參數(shù)更新
w1.assign_sub(lr * grads[0] / tf.sqrt(v_w))
b1.assign_sub(lr * grads[1] / tf.sqrt(v_b))

5、Adam（同時(shí)結(jié)合了SGDM的一階動(dòng)量和RMSProp二階動(dòng)量，并增加了兩個(gè)修正項(xiàng)，把修正后的一階動(dòng)量和二階動(dòng)量帶入?yún)?shù)更新公式）

m = βm + (1-β)g，v = βv +（1-β）g2
m(修正項(xiàng))=m/1-β^t，v(修正項(xiàng))=m/1-β^t

初始化參數(shù)
m_w, m_b = 0, 0
v_w, v_b = 0, 0
beta1, beta2 = 0.9, 0.999
delta_w, delta_b = 0, 0
更新的總batch數(shù)
global_step = 0
計(jì)算一階動(dòng)量
m_w = beta1 * m_w + (1 - beta1) * grads[0]
m_b = beta1 * m_b + (1 - beta1) * grads[1]
計(jì)算二階動(dòng)量
v_w = beta2 * v_w + (1 - beta2) * tf.square(grads[0])
v_b = beta2 * v_b + (1 - beta2) * tf.square(grads[1])
計(jì)算修正項(xiàng)
m_w_correction = m_w / (1 - tf.pow(beta1, int(global_step)))
m_b_correction = m_b / (1 - tf.pow(beta1, int(global_step)))
v_w_correction = v_w / (1 - tf.pow(beta2, int(global_step)))
v_b_correction = v_b / (1 - tf.pow(beta2, int(global_step)))
將修正項(xiàng)代入公式，參數(shù)更新
w1.assign_sub(lr * m_w_correction / tf.sqrt(v_w_correction))
b1.assign_sub(lr * m_b_correction / tf.sqrt(v_b_correction))

結(jié)果對(duì)比

loss及acc曲線.jpg

訓(xùn)練耗時(shí).png

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

NN_5種參數(shù)優(yōu)化器

NN_5種參數(shù)優(yōu)化器

1、SGD（不含動(dòng)量常用的梯度下降法）

2、SGDM（在SGD的基礎(chǔ)上增加了一階動(dòng)量)

3、Adagrad （在SGD的基礎(chǔ)上增加了二階動(dòng)量）

4、RMSProp（在SGD的基礎(chǔ)上增加了二階動(dòng)量）

5、Adam（同時(shí)結(jié)合了SGDM的一階動(dòng)量和RMSProp二階動(dòng)量，并增加了兩個(gè)修正項(xiàng)，把修正后的一階動(dòng)量和二階動(dòng)量帶入?yún)?shù)更新公式）

結(jié)果對(duì)比

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

NN_5種參數(shù)優(yōu)化器

1、SGD（不含動(dòng)量常用的梯度下降法）

2、SGDM（在SGD的基礎(chǔ)上增加了一階動(dòng)量)

3、Adagrad （在SGD的基礎(chǔ)上增加了二階動(dòng)量）

4、RMSProp（在SGD的基礎(chǔ)上增加了二階動(dòng)量）

5、Adam（同時(shí)結(jié)合了SGDM的一階動(dòng)量和RMSProp二階動(dòng)量，并增加了兩個(gè)修正項(xiàng)，把修正后的一階動(dòng)量和二階動(dòng)量帶入?yún)?shù)更新公式）

結(jié)果對(duì)比

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

1、SGD（不含動(dòng)量常用的梯度下降法）

2、SGDM（在SGD的基礎(chǔ)上增加了一階動(dòng)量)

4、RMSProp（在SGD的基礎(chǔ)上增加了二階動(dòng)量）

5、Adam（同時(shí)結(jié)合了SGDM的一階動(dòng)量和RMSProp二階動(dòng)量，并增加了兩個(gè)修正項(xiàng)，把修正后的一階動(dòng)量和二階動(dòng)量帶入?yún)?shù)更新公式）