最優(yōu)控制

最優(yōu)控制

最優(yōu)控制理論研究的是在給定系統(tǒng)模型的條件下找到一個控制律,使得該控制系統(tǒng)達(dá)到一定的最優(yōu)性指標(biāo)的問題。它是變分(variations)的擴(kuò)展,是一種用于推導(dǎo)(求解)最優(yōu)控制策略的數(shù)學(xué)優(yōu)化方法

對一個受控的動力系統(tǒng),從一類允許的控制方案中尋找一個最優(yōu)的控制方案,使得系統(tǒng)的運(yùn)動從由某個初始狀態(tài)轉(zhuǎn)移到目標(biāo)狀態(tài)的同時其性能指標(biāo)值為最優(yōu)。

例如,對于一個給定的系統(tǒng)(狀態(tài)空間模型)和二次型性能指標(biāo),設(shè)計(jì)一個控制器u,不僅使得閉環(huán)系統(tǒng)漸近穩(wěn)定,且使得二次型性能指標(biāo)J最小化的問題稱為二次型最優(yōu)控制問題,并且具有這樣性質(zhì)的控制器u稱為是二次型最優(yōu)控制問題的最優(yōu)控制器

性質(zhì)
  • 一般情況下,由極大值原理計(jì)算出的(根據(jù)系統(tǒng)模型離線規(guī)劃出的)最優(yōu)控制是關(guān)于時間t的函數(shù)u(t),稱為開環(huán)控制。已知初始狀態(tài)x_0求得u_0=k_0*x_0,根據(jù)系統(tǒng)動態(tài)轉(zhuǎn)移到x_1依次前向傳遞,規(guī)劃出控制作用u_k,這是一種開環(huán)控制方式。

  • 開環(huán)控制的主要缺點(diǎn)是,不能消除或抑制由于系統(tǒng)建模不確定性或環(huán)境變化對系統(tǒng)造成的擾動,在實(shí)際的控制過程中很可能不是最優(yōu)的,也就是魯棒性較差。

這里需要注意的是,在有限時域的情況,求出的k_t是時變的,因?yàn)橄到y(tǒng)經(jīng)歷動態(tài)過程,當(dāng)系統(tǒng)達(dá)到穩(wěn)態(tài),此時k_t也將收斂到定值。而MPC只用了第一個控制量,基于當(dāng)前時刻的,因此可以認(rèn)為是一種閉環(huán)控制。

  • 最優(yōu)控制的另一種形式是表示為狀態(tài)變量x(t)的函數(shù)u(x),實(shí)際上是引入了反饋,因此稱為閉環(huán)控制,其優(yōu)點(diǎn)是能有效抑制擾動。
求解方法
  • 最優(yōu)控制問題的本質(zhì)是變分為題,經(jīng)典變分理論只能解決一類簡單的最優(yōu)控制問題。
  • 現(xiàn)代變分理論最常用的就是極大值原理和動態(tài)規(guī)劃(dynamic programming)。
  • 按照控制作用的實(shí)現(xiàn)方式分為,開環(huán)控制和閉環(huán)控制。

古典變分法研究對泛函求極值的一種數(shù)學(xué)方法,只能用在控制變量的取值范圍不受限的情況。
極大值原理(Lev Pontryagin)是分析力學(xué)中哈密爾頓方法的推廣,其突出優(yōu)點(diǎn)是可以用于控制變量受限的情況。
動態(tài)規(guī)劃(Bellman)為數(shù)學(xué)規(guī)劃的一種,同樣可用于控制變量受限的情況,一種適合在計(jì)算機(jī)上進(jìn)行計(jì)算的有效的方法,應(yīng)用十分廣泛。

線性二次型最優(yōu)控制

考慮如下線性時不變系統(tǒng)的狀態(tài)空間模型:
\left\{ {\begin{array}{*{20}{c}} {\dot x = Ax + Bu} \\ {y = Cx} \end{array}} \right.

其中,x是系統(tǒng)的n維狀態(tài)空間,u是系統(tǒng)的m維控制輸入,y是系統(tǒng)的r維測量輸出,A、BC分別是適當(dāng)維數(shù)的已知常數(shù)矩陣,系統(tǒng)的初始狀態(tài)是x(0)= x_0。

系統(tǒng)的性能指標(biāo)為:
J=\int _0^\infty \left[{x^{\rm T}Qx + u^{\rm T}Ru}\right] dt

這里關(guān)心的問題是:對給定的系統(tǒng)和性能指標(biāo),設(shè)計(jì)一個控制器u,使得給定的性能指標(biāo)J最小,具有這樣性質(zhì)的控制器u稱為是二次型最優(yōu)控問題的最優(yōu)控制器。

若系統(tǒng)的狀態(tài)都是可以直接測量,且考慮的控制器是狀態(tài)反饋控制器,則可以證明,使得性能指標(biāo)最小化的最優(yōu)控制器具有以下的線性狀態(tài)反饋形式:
u= -Kx

本節(jié)將基于李雅普諾夫穩(wěn)定性理論給出最優(yōu)狀態(tài)反饋控制器的設(shè)計(jì)方法。將控制器代入系統(tǒng)方程,可得:
\dot x = (A-BK)x

若系統(tǒng)是漸近穩(wěn)定的,則根據(jù)線性時不變系統(tǒng)李雅普諾夫穩(wěn)定性定理,閉環(huán)系統(tǒng)一定存在一個二次型的李雅普諾夫函數(shù)V(x)= x^{\rm T}Px,其中P是一個對稱正定矩陣。

利用系統(tǒng)的穩(wěn)定性,作如下推導(dǎo):
\begin{aligned} J &= \int ({{x}^{\rm T}}Qx + {u^{\rm T}}Ru)dt \\ &= \int ({{x}^{\rm T}}Qx + {u^{\rm T}}Ru+\fracu0z1t8os{{dt}}V\left( x \right))dt - \int \fracu0z1t8os{{dt}}V\left( x \right))dt \\ &= \int( {{x}^{\rm T}}Qx + {u^{\rm T}}Ru+ x^{\rm T} \left[ {P(A-BK)+(A-BK)^{\rm T}P} \right]x ) dt - V\left. {\left[ {x\left( t \right)} \right]} \right|_{t = 0}^{t = \infty } \\ &= \int{{x}^{\rm T}}(Q +K^{\rm T}RK +PA+A^{\rm T}P-PBK-K^{\rm T}B^{\rm T}P )x dt+ x_0^{^{\rm T}}Px_0 \\ \end{aligned}

以上通過分別加上和減去一項(xiàng)\int _0^{\infty}\fracu0z1t8os{{dt}}V\left( x \right))dt,并沿閉環(huán)系統(tǒng)的軌跡求V(x)關(guān)于時間的導(dǎo)數(shù),其目的是通過引入更多包含反饋增益矩陣K的信息,采用配平方的方法來確定使得性能指標(biāo)J最小化的反饋增益矩陣K,根據(jù):
\begin{aligned} &K^{\rm T}RK-PBK-K^{\rm T}B^{\rm T}P \\ &= K^{\rm T}RK-PBK-K^{\rm T}B^{\rm T}P +PBR^{-1}B^{\rm T}P-PBR^{-1}B^{\rm T}P \\ &= (K-R^{-1}B^{\rm T}P)^{\rm T}R(K-R^{-1}B^{\rm T}P)- PBR^{-1}B^{\rm T}P\\ \end{aligned}

可得:
\begin{aligned} J= \int &x^{\rm T}(PA+A^{\rm T}P-PBR^{-1}B^{\rm T}P+Q)xdt \\ &+ x_0^{^{\rm T}}Px_0 + \int x^{\rm T}(K-R^{-1}B^{\rm T}P)^{\rm T}R(K-R^{-1}B^{\rm T}P)xdt \\ \end{aligned}

求解最優(yōu)控制問題就是要尋找一個增益矩陣K,使得上述性能指標(biāo)J最小。由于上式中只有第三項(xiàng)依賴于矩陣K,而且還是非負(fù)的。只有當(dāng)該項(xiàng)等于零時,J才能最小,而這項(xiàng)等于零當(dāng)且僅當(dāng)K=R^{-1}B^{\rm T}P(控制器增益取決于李雅普諾夫矩陣P),此時性能指標(biāo)的最小值為:
\begin{aligned} J= \int &x^{\rm T}(PA+A^{\rm T}P-PBR^{-1}B^{\rm T}P+Q)xdt +x_0^{^{\rm T}}Px_0 \\ \end{aligned}

顯然,增益矩陣K和性能指標(biāo)J依賴于待定的對稱正定李雅普諾夫矩陣P。特別是當(dāng)可以找到一個對稱正定陣P使得:
PA+A^{\rm T}P-PBR^{-1}B^{\rm T}P+Q=0

則,此時性能指標(biāo)J^{\star}=x_0^{^{\rm T}}Px_0 = V(x_0),上述方程稱為黎卡提矩陣方程。這里也可以看出李雅普諾夫函數(shù)也就是最優(yōu)值函數(shù)。

總結(jié)以上分析給出以下定理:

定理:(A,B)能控,則線性二次型最優(yōu)控制問題可解,最優(yōu)狀態(tài)反饋控制器為:
u = -Kx = -R^{-1}B^{\rm T}Px性能指標(biāo)的最小值J^{\star}=x_0^{^{\rm T}}Px_0。其中的P是黎卡提方程的一個對稱正定解。

性能指標(biāo)最小值依賴于系統(tǒng)初始狀態(tài)x_0和黎卡提方程的一個解矩陣。

由于最優(yōu)狀態(tài)反饋控制器一定是系統(tǒng)的一個穩(wěn)定化控制器,故線性二次型最優(yōu)控制問題提供了求解系統(tǒng)穩(wěn)定化控制器的一種新方法。用該方法設(shè)計(jì)的穩(wěn)定化控制器,不僅能夠使系統(tǒng)漸近穩(wěn)定,而且還能保證控制系統(tǒng)具有最優(yōu)的動態(tài)性能。


參考文獻(xiàn)

1.https://blog.csdn.net/u012267725/article/details/77986517
2.https://en.wikipedia.org/wiki/Optimal_control

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容