18、HS 共軛梯度法

本節(jié)我們將介紹另外一種經(jīng)典的共軛梯度法,即是~\rm{HS}~共軛梯度法。

1、引言

??HS 共軛梯度法是由\rm{Hestenes}~~\rm{Stiefe}~于1952 年在求解線性共軛梯度法中提出,后來被用于求解非線性無約束優(yōu)化問題。
??共軛梯度法的一般形式為:
x_{k+1}=x_k+\alpha_k d_k,\tag{1}
d_k=\begin{cases} -g_k,\quad & k=1,\\ -g_k+\beta_k d_k, &k\ge 2,\end{cases}\tag{2}
其中參數(shù)~\beta_k~由以下公式計(jì)算:
\beta_k^{HS}=\frac{g_k^T(g_k-g_{k-1})}{d_{k-1}^T(g_k-g_{k-1})}.\tag{3}

2、收斂性分析

??我們把方法~(1)-(3)~稱為~\rm{HS}~方法。與~\rm{PRP}~方法相比,\rm{HS}方法一個(gè)重要的性質(zhì)是,我們令~y_{k-1}=g_k-g_{k-1}~,則有如下共軛關(guān)系式成立
d_{k}^Ty_{k-1}=0\tag{4}
證明:\begin{align}d_{k}^Ty_{k-1}&=(-g_k+\beta_k^{HS} d_{k-1})^Ty_{k-1}\\ &=-g_k^Ty_{k-1}+\frac{g_k^T y_{k-1}}{d_{k-1}^Ty_{k-1}}d_{k-1}^Ty_{k-1}=0\end{align}
??上面~(4)~式不論線搜索是否精確,總是成立的。但~\rm{HS}~方法的理論性質(zhì)和計(jì)算表現(xiàn)與~\rm{PRP}~方法很類似。如果線搜索是精確的,因?yàn)?img class="math-inline" src="https://math.jianshu.com/math?formula=~d_%7Bk-1%7D%5ET%20y_%7Bk-1%7D%3D%5CVert%20g_%7Bk-1%7D%5CVert%5E2~" alt="~d_{k-1}^T y_{k-1}=\Vert g_{k-1}\Vert^2~" mathimg="1">,于是有
\beta_k^{HS}=\beta_k^{PRP}\tag{5}
??同樣也有,采取精確線搜索的~\rm{HS}~方法對(duì)一般非凸目標(biāo)函數(shù)不一定收斂。如果線搜索滿足
f(x_k+\alpha_k d_k)\le f(x_k)+\rho\alpha_k g_k^T d_k\tag{6}

g(x_k+\alpha_k d_k)^T d_k\ge\sigma g_k^T d_k\tag{7}
其中~0<\rho<\sigma<1~,以及線搜索使得充分下降條件成立,即存在~c>0~,使得
-g_k^T d_k\ge c\Vert g_k\Vert^2\tag{8}
則顯然有下式成立
d_{k-1}^T y_{k-1}\ge(1-\sigma)\vert g_{k-1}^T d_{k-1}\vert\ge (1-\sigma)c\Vert g_{k-1}\Vert^2\tag{9}
設(shè)存在~\gamma~~\overline{\gamma}~使得下式成立,即
0<\gamma\le\Vert g_k\Vert\le\overline{\gamma}\tag{10}
對(duì)于~\rm{HS}~方法,可以取
b=\frac{2\overline{\gamma}^2}{(1-\sigma)c\gamma^2}\tag{11}
以及
\lambda=\frac{(1-\sigma)c\gamma^2}{2L\overline{\gamma}b}\tag{12}
因?yàn)?img class="math-inline" src="https://math.jianshu.com/math?formula=~(11)~" alt="~(11)~" mathimg="1">和~(12)~,使得性質(zhì)(*)成立,令
\beta_k=\left\{\beta_k^{HS},0\right\}\tag{13}
則我們便有如下定理,證明過程類似與~\rm{PRP}~方法,故省略。

定理 1:設(shè)目標(biāo)函數(shù)~f(x)~水平集有界,且導(dǎo)數(shù)~\rm{Lipschitz}~連續(xù),考慮~\rm{HS}^+~方法(1)-(3),其中步長(zhǎng)因子~\alpha_k~滿足~\rm{Wolfe}~條件~(6)~~(7)~以及充分下降條件~(8)~,則方法給出~\lim\inf\Vert g_k\Vert=0~

??在線搜索滿足強(qiáng)~\rm{Wolfe}~條件的假定下,我們知道可以將~\rm{PRP}^{+}~共軛梯度法中的充分下降條件改為下降條件。戚后鐸^{[1]} 考慮了如下修正的~\rm{HS}~方法:
\beta_k=\max\left\{0,\min\left\{\beta_k^{HS},\frac{1}{\Vert g_k\Vert}\right\}\right\}
并在無充分下降條件下,建立了方法的全局收斂性。

3、參考文獻(xiàn)

[1] 戚后鐸, 韓繼頁(yè), 劉光輝. 修正~\rm{Hestense-Stiefel}~共軛梯度法. 數(shù)學(xué)年刊, 1996(3): 277-284.
[2] 戴彧虹. 非線性共軛梯度法. 2000, 科學(xué)出版社.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • ??今天,應(yīng)該是正式研究共軛梯度法的開始。如果只是運(yùn)用共軛梯度法,而不去了解其算法的內(nèi)在含義,這也不是我在《簡(jiǎn)書》...
    多情劍客無情劍yu閱讀 3,455評(píng)論 0 3
  • 這篇文章很早就在 CSCD 上面發(fā)表過,所以我就直接復(fù)制過來了。DY 共軛梯度法是由中國(guó)學(xué)者 戴彧虹 和 袁亞湘 ...
    多情劍客無情劍yu閱讀 1,608評(píng)論 0 2
  • ??前面介紹了 FR 共軛梯度法,給出了其他不同線搜素下的全局收斂性。本節(jié)將講述 CD 共軛梯度法,與 FR 的性...
    多情劍客無情劍yu閱讀 942評(píng)論 0 1
  • 1 共軛方向的定義 對(duì)于正定二次函數(shù),其中是對(duì)角陣,對(duì)角元均為正數(shù),這種情況下函數(shù)關(guān)于原點(diǎn)中心對(duì)稱,每列由一...
    HarmoniaLeo閱讀 4,263評(píng)論 0 2
  • 本文與之前的 FR 共軛梯度法的一般性理論相類似,旨在建立 DY 共軛梯度法的一般性理論。這些工作也是由 戴彧虹 ...
    多情劍客無情劍yu閱讀 653評(píng)論 0 1

友情鏈接更多精彩內(nèi)容