4.高斯牛頓方程

相較于第2節(jié)的直接對函數(shù)進行二階泰勒展開,然后求函數(shù)一階導(dǎo)為零來進行迭代求極小值的方法

高斯牛頓法采用的是,只對函數(shù)進行一階泰勒展開,然后對一階泰勒展開進行平方,求其平方的一階導(dǎo)為0來進行迭代

上面這段話翻譯成公式就是
寫出函數(shù)的一階泰勒展開式
F(X^{(K+1)})=F(X^{(K)})+J(X^{(k)})^T\Delta X

求其最小二乘\frac{1}{2}||F(X^{(K)})+J(X^{(k)})^T\Delta X||^2

求全微分
\frac{\partial (\frac{1}{2}||F(X^{(K)})+J(X^{(k)})^T\Delta X||^2)}{\partial \Delta X}

=J(X^{(k)})\Big(F(X^{(K)})+J(X^{(k)})^T\Delta X\Big)
=J(X^{(k)})(F(X^{(K)})+J(X^{(k)})J(X^{(k)})^T\Delta X

J(X^{(k)})(F(X^{(K)})+J(X^{(k)})J(X^{(k)})^T\Delta X=0

\Rightarrow \Delta X=-(J(X^{(k)}).J(X^{(k)})^T)^{-1}J(X^{(k)})F(X^{(K)}).

習(xí)慣上會讓
H_0(X^{(k)})=J(X^{(k)}).J(X^{(k)})^T
g(X^{(k)})=-J(X^{(k)})F(X^{(K)})

于是\Delta X=H_0(X^{(k)})^{-1}g(X^{(k)})

我們比較一下第二節(jié)的二階泰勒法計算極小值
\Delta X=-H(X^{(0)})^{-1}J(X^{(0)})
這里相當(dāng)于用一階的雅可比矩陣對海瑟矩陣進行了近似,相對于使用來說,減少了計算量

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容