- 梯度下降法(Gradient Desence)不用多說
- 然后就是Deep Learning中常用的Stochastic Gradient, 提出這個是因為每一次更新計算全部樣本對應梯度不劃算。而且實驗表明每次隨機選甚至結(jié)果比直接全部算出來要好。
- 接著就是NSG,從算法來看是隨機梯度每次加了一點噪聲
-
PNSG,比起NSG多了個投影的步驟
Noisy Stochastic Gradient
Projected Noisy Stochastic Gradient
之前的都屬于線性搜索,一般步驟是先確定一個方向,然后確定最優(yōu)步長。
而信賴域方法(Trust Region Method)則是不斷改變搜索區(qū)域,使得優(yōu)化方向也改變,進而使下降盡可能多。

