数学物理学报, 2022, 42(4): 1256-1264 doi:

论文

一类带指数权最优控制问题的Turnpike性质

崔骁勇,, 张灿,

武汉大学数学与统计学院 武汉 430072

Turnpike Properties of a Class of Optimal Control Problems with Exponential Weights

Cui Xiaoyong,, Zhang Can,

School of Mathematical and Statistics, Wuhan University, Wuhan 430072

通讯作者: 崔骁勇, E-mail: XiaoyongCui@whu.edu.cn

收稿日期: 2021-09-10  

基金资助: 国家自然科学基金.  11971363

Received: 2021-09-10  

Fund supported: the NSFC.  11971363

作者简介 About authors

张灿,E-mail:zhangcansx@163.com , E-mail:zhangcansx@163.com

Abstract

In this paper, we consider the long-term asymptotic behavior of a class of finite-dimensional optimal control problems with exponential weights. The main method of this article is to decouple the Hamilton system of optimal control problems, based on the Pontryagin maximum principle and the algebraic Riccati theory. The exponential turnpike properties of optimal trajectory and optimal control are established under two different conditions.

Keywords: Optimal controls ; Turnpike property ; Pontryagin maximum principle

PDF (323KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

崔骁勇, 张灿. 一类带指数权最优控制问题的Turnpike性质. 数学物理学报[J], 2022, 42(4): 1256-1264 doi:

Cui Xiaoyong, Zhang Can. Turnpike Properties of a Class of Optimal Control Problems with Exponential Weights. Acta Mathematica Scientia[J], 2022, 42(4): 1256-1264 doi:

1 引言

Turnpike性质在研究数学物理方程的长时间最优控制问题的最优解中具有十分重要的作用[13]. 一般来说, 希望采用直接方法找到最优控制问题的最优解是不容易的[4, 5]. 而turnpike性质揭示了对一类时间区域足够大的最优控制问题, 它的最优解在大部分时间会逼近一个对应的静态解.

1963年, Mckenzie在文献[6]中首次发现并提出turnpike性质, 揭示了经济学中有限维离散时间的一类最优控制问题最优解与对应静态解的渐近性. 随后的几十年里, 有限维最优控制问题的turnpike性质或定理陆续被证明, 包括离散时间以及连续时间的常微分控制系统[78].

近年来, 无穷维的线性二次最优控制问题, 其中包括线性热传导方程和波动方程的turnpike性质已经建立[7, 9]. 特别值得一提的是, 2015年Trélat和Zuazua建立了具有一般终端约束条件的有限维非线性控制系统中的turnpike性质, 同时发现了Pontryagin最大值原理对应的伴随向量与对应静态最优控制问题的指数逼近性[5]. 之后, 探讨如何将turnpike性质推广到更加一般的最优控制问题成为一个研究热点. 2018年, Trélat, Zhang和Zuazua将文献[5]中的结果推广到自治的分布参数控制系统, 并且建立了最优控制问题的指数turnpike性质[10].

本文探讨了性能指标具有指数权的情形下, 有限维控制系统的Turnpike性质. 在诸多实际问题, 比如生物种群模型、金融、经济模型, 特别是疫情防治等方面, 会考虑这类性能指标, 因此这一问题的研究具有一定的实际意义. 我们的主要目的是期望分别在Kalman秩条件[8]和能稳条件[7]下建立最优解的指数turnpike性质.

2 问题阐述与预备知识

我们先介绍带有指数权的线性最优控制问题, 其数学形式可以如下描述

$ \begin{array}{l}\min \limits_{(y, u)}\;\;\frac{1}{2}\int_{0}^{T}{\rm e}^{-\rho{t}}(\left\|C(y(t)-y_d)\right\|^2+\left\|R(u(t)-u_d)\right\|^2){\rm d}t, \\\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \left\{ \begin{array}{lll} y'=Ay+Bu, \quad t\in[0, T], \\ y(0)=y_0. \end{array}\right. \end{array} $

其中$ \rho\geq0 $, $ A $$ C $$ n\times{n} $阶的矩阵, $ B $$ R $$ n\times{m} $阶的矩阵($ n, m\in\mathbb{N}^{+} $), 其中$ T>0 $为该最优控制问题的时间尺度, $ u\in{L^2(0, T;{{\Bbb R}} ^{m})} $为控制函数, 且$ y_d\in{{\Bbb R}} ^{n}, u_d\in{{\Bbb R}} ^m $是事先给定的跟踪向量.

我们期望对两种常见的终端状态情形考虑其最优解的指数turnpike性质. 第一种是在Kalman秩条件下考虑终端约束$ y(T) $是自由的; 第二种是在能稳性条件下, 考虑终端约束$ y(T)=y_1 $ (即终点固定), 这里$ y_1\in{{{\Bbb R}} ^{n}} $是任意给定的状态.

关于一般的最优控制问题解的存在与唯一性已经有诸多研究[1114]. 对本文所研究的问题, 我们令Hamilton函数为

并且有

$ \begin{equation} \left\{ \begin{array}{lll} { } \frac{\partial{H}}{\partial{u}}=B^{*}p-{\rm e}^{-\rho{t}}R^{*}R(u-u_d), \\ [3mm] { } \frac{\partial{H}}{\partial{y}}=A^{*}p-{\rm e}^{-\rho{t}}C^{*}C{(y-y_d)}, \\ { } \frac{\partial{H}}{\partial{p}}=Ay+Bu. \end{array}\right. \end{equation} $

设该最优控制问题的最优解为$ (y(\cdot), u(\cdot)) $. 由Pontryagin最大值原理[9, 1112], 存在$ p(\cdot)\in{C([0, T];{{\Bbb R}} ^{n})} $, 使得$ u(t)={\rm e}^{\rho{t}}(R^{*}R)^{-1}B^{*}p(t)+u_d $, 且$ (y(\cdot), p(\cdot)) $满足最优Hamilton系统

$ \begin{equation} \left\{ \begin{array}{lll} { } y'=\frac{\partial{H}}{\partial{p}}=Ay+Bu=Ay+{\rm e}^{\rho{t}}B(R^{*}R)^{-1}B^{*}p+u_d, \\ [3mm] { } p'=-\frac{\partial{H}}{\partial{y}}={\rm e}^{-\rho{t}}C^{*}C{(y-y_d)}-A^{*}p. \end{array}\right. \end{equation} $

$ \lambda(t)={\rm e}^{\rho{t}}p(t) $, 则有

$ U=R^{*}R $$ Q=C^{*}C $. 于是

$ \begin{equation} \left\{ \begin{array}{lll} y'=Ay+BU^{-1}B^{*}\lambda+Bu_d, \\ {\lambda}'=-(A^{*}-\rho{I})\lambda+Q(y-y_d). \end{array}\right. \end{equation} $

$ (y_s, {\lambda}_s) $为(2.4)式的平衡点[15], 即

$ \begin{equation} \left\{ \begin{array}{lll} Ay_s+BU^{-1}B^{*}{\lambda}_s+Bu_d=0, \\ -(A^{*}-\rho{I}){\lambda}_s+Q(y_s-y_d)=0. \end{array}\right. \end{equation} $

我们引入下面的扰动变量

$ \begin{equation} \left\{ \begin{array}{lll} \delta{y(t)}=y(t)-y_s, \\ \delta{\lambda(t)}={\lambda}(t)-{\lambda}_s, \quad t\in[0, T]. \end{array}\right. \end{equation} $

从而

$ \begin{equation} \frac{{\rm d}}{{\rm d}t} \left( \begin{array}{c} \delta{y} \\ \delta{\lambda} \end{array} \right) = \left( \begin{array}{cc} A & BU^{-1}B^{*} \\ Q & -(A^{*}-{\rho}I) \end{array} \right) \left( \begin{array}{c} \delta{y} \\ \delta{\lambda} \end{array} \right). \end{equation} $

接下来, 我们令

$ \begin{equation} \left( \begin{array}{c} \alpha(t) \\ \beta(t) \end{array} \right) = \left( \begin{array}{c} {\rm e}^{-\frac{{\rho}t}{2}}\delta{y(t)} \\ {\rm e}^{-\frac{{\rho}t}{2}}\delta{\lambda(t)} \end{array} \right), {\quad} t\in[0, T], \end{equation} $

因此

$ \begin{eqnarray} {\alpha}'(t)&=&-\frac{\rho}{2} {\rm e}^{-\frac{{\rho}t}{2}}\delta{y(t)}+ {\rm e}^{-\frac{{\rho}t}{2}}\delta{y'(t)}{}\\ &=&-\frac{\rho}{2} {\rm e}^{-\frac{{\rho}t}{2}}\delta{y(t)}+ {\rm e}^{-\frac{{\rho}t}{2}}(A{\delta}y(t) +BU^{-1}B^{*}\delta{\lambda(t)}){}\\ &=&(A-\frac{\rho}{2}I)\alpha(t)+BU^{-1}B^{*}\beta(t), \end{eqnarray} $

以及

$ \begin{eqnarray} {\beta}'(t)&= &{\rm e}^{-\frac{{\rho}t}{2}}(-\frac{\rho}{2}\delta{\lambda(t)}+\delta{\lambda}'(t)){}\\ &=& {\rm e}^{-\frac{{\rho}t}{2}}(-\frac{\rho}{2}\delta{\lambda(t)}+ Q\delta{y(t)}-(A^{*}-\rho{I})\delta{\lambda(t)}){}\\ &=&Q\alpha(t)-(A^{*}-\frac{\rho}{2}I)\beta(t), \end{eqnarray} $

那么

$ \begin{equation} \frac{{\rm d}}{{\rm d}t} \left( \begin{array}{c} \alpha(t) \\ \beta(t) \end{array} \right) = \left( \begin{array}{cc} { } A-\frac{\rho}{2}I{\quad} & BU^{-1}B^{*} \\ Q {\quad}&{ } -(A^{*}-\frac{\rho}{2}I) \end{array} \right) \left( \begin{array}{c} \alpha(t) \\ \beta(t) \end{array} \right). \end{equation} $

若设$ Z(t)=\left( \begin{array}{c} \alpha(t) \\ \beta(t) \end{array} \right) $, 微分系统(2.11)可写作$ \dot{Z}(t)=MZ(t) $, 其中$ M $定义为

这里, $ \widetilde{A}= A-\frac{\rho}{2}I $, 其中$ Q $$ U $都是正定的. 那么$ M $的性质与$ A $$ B $的结构密切相关. 我们将在下节中考虑$ (A, B) $在两种不同的假设条件下, 建立最优控制问题(2.1) 的最优解的指数turnpike性质.

3 主要结果及证明

定理3.1  假设$ (A, B) $满足$ \rm Kalman $秩条件, 即

那么存在常数$ \varepsilon>{0} $, $ C_1>{0} $, $ C_2>{0} $以及时间$ T_0>{0} $, 当$ \rho\leqslant{2\varepsilon{C_2}} $, $ T\geqslant{T_0} $时, 最优控制问题$ (2.1) $的最优解$ (y(t), u(t)) $满足

其中$ t\in[0, T].$

在证明定理3.1之前, 我们先给出几个引理.

引理3.1  若$ (A, B) $满足$ \rm Kalman $秩条件, 则$ (\widetilde{A}, B) $也满足$ \rm Kalman $秩条件, 即

  由矩阵的基本变换性质我们有

引理3.1得证.

引理3.2  如果$ (A, B) $满足$ \rm Kalman $秩条件, 则矩阵$ M $具有$ \rm Hamilton $性质[17], 即$ M $的所有特征值的实部非零, 并且若$ \eta $是一个特征值, 则$ -\bar{\eta} $也是其特征值.

引理$ 3.2 $的证明可参考文献[3, 引理2].

运用上面的两个引理, 我们可以给出定理3.1的证明.

定理3.1的证明  根据文献[1819]中的代数Riccati理论, 设$ E_- $是下面Riccati方程的最小的负定矩阵解, 且$ E_+ $是其最大的正定矩阵解

$ \begin{equation} X\widetilde{A}+\widetilde{A}^{*}X+XBU^{-1}B^{*}X-C^{*}C=0. \end{equation} $

易知$ P $为可逆矩阵, 此外

$ \begin{equation} P^{-1}MP=\left( \begin{array}{cc} \widetilde{A}+BU^{-1}B^{*}E_-{\quad} & 0 \\ 0{\quad} & \widetilde{A}+BU^{-1}B^{*}E_+ \end{array} \right). \end{equation} $

$ \begin{equation} Z(t)=\left( \begin{array}{cc} I_n{\quad} & I_n \\ E_-{\quad} & E_+ \end{array} \right)Z_1(t). \end{equation} $

从而有

$ \begin{equation} \dot{Z_1}(t)= \left( \begin{array}{cc} \widetilde{A}+BU^{-1}B^{*}E_-{\quad} & 0 \\ 0{\quad} & \widetilde{A}+BU^{-1}B^{*}E_+ \end{array} \right)\dot{Z_1}(t). \end{equation} $

微分系统(3.4)是纯粹的双曲系统.

更进一步, 令$ Z_1(t)= \left( \begin{array}{c} v(t) \\ w(t) \end{array} \right), $

$ \begin{equation} \left\{ \begin{array}{lll} v'(t)=(\widetilde{A}+BU^{-1}B^{*}E_-)v(t), \\ w'(t)=(\widetilde{A}+BU^{-1}B^{*}E_+)w(t). \end{array}\right. \end{equation} $

根据引理$ 3.2 $, 我们得到$ \widetilde{A}+BU^{-1}B^{*}E_- $的所有特征值具有负实部, 并且$ \widetilde{A}+BU^{-1}B^{*}E_+ $的特征值为$ A+BU^{-1}B^{*}E_- $的特征值的共轭数, 因此对$ t\in[0, T]$, 有

$ \begin{equation} \left\{ \begin{array}{lll} \left\|v(t)\right\|\leq{\left\|v(0)\right\|}{\rm e}^{-C_2{t}}, \\ \left\|w(t)\right\|\leq{\left\|w(T)\right\|}{\rm e}^{-C_2{(T-t)}}, \end{array}\right. \end{equation} $

其中$ C_2=-\max\left\{{R(\mu)|\mu\in{Spec(\widetilde{A}+BU^{-1}B^{*}E_-)}}\right\}>{0}. $

上述结果表明, 对某些$ \tau>0 $, 当$ t\in[\tau, T-\tau]$时, 有$ v(t)\simeq{0} $$ w(t)\simeq{0} $. 根据方程(3.3)和(3.6), 我们有$ \alpha(t)=v(t)+w(t) $$ {\beta(t)}=E_-v(t)+E_+w(t) $. 于是

$ \begin{equation} \left\{ \begin{array}{lll} \left\|\alpha(t)\right\|\leq{\left\|v(0)\right\|}{\rm e}^{-C_2{t}}+{\left\|w(T)\right\|}{\rm e}^{-C_2{(T-t)}}, \\ \left\|\beta(t)\right\|\leq{\left\|E_-\right\|\left\|v(0)\right\|}{{\rm e}^{-C_2{t}}+\left\|E_+\right\|\left\|w(T)\right\|}{\rm e}^{-C_2{(T-t)}}. \end{array}\right. \end{equation} $

为了得到更加准确的估计并完成证明, 下面我们需要终端条件的性质. 我们将根据终端条件来确定$ v(t) $$ w(t) $的值, 这里初始点是确定的并且终端点是自由的. 其中, $ y(0)=y_0 $, $ y(T) $自由, 因此$ \lambda(T)=0 $. 我们就有$ \delta{y(0)}=y_0-y_s $$ \delta{\lambda(T)}=-\lambda_s $. 进而可以得到

$ \begin{equation} \left\{ \begin{array}{lll} \left\|v(0)-(y_0-y_s)\right\|\leq{\left\|w(T)\right\|}{\rm e}^{-C_2{T}}, \\ \left\|w(T)\right\|\leq{\left\|E_+^{-1}E_-\right\|\left\|v(0)\right\|{\rm e}^{-C_2{T}}}. \end{array}\right. \end{equation} $

并且因此

$ \begin{equation} \left\{ \begin{array}{lll} \left\|v(0)-(y_0-y_s)\right\|\leq{\left\|E_+^{-1}E_-\right\|\left\|v(0)\right\|{\rm e}^{-2C_2{T}}}, \\ \left\|w(T)\right\|\leq{\left\|E_+^{-1}E_-\right\|\left\|y_0-y_s\right\|{\rm e}^{-C_2{T}}}+\left\|E_+^{-1}E_-\right\|\left\|w(T)\right\|{\rm e}^{-2C_2{T}}. \end{array}\right. \end{equation} $

到这一步, 我们就得到了关于$ v(0) $$ w(T) $值的估计. 再根据(2.8)式, 回到$ \delta{\lambda} $$ \delta{y} $, 我们就有$ \delta{y(t)}={\rm e}^{\frac{\rho{t}}{2}}(v(t)+w(t)) $$ \delta{\lambda(t)}={\rm e}^{\frac{\rho{t}}{2}}(E_{-}v(t)+E_{+}w(t)) $, 结合(3.6)式, 得到

$ \begin{equation} \left\{ \begin{array}{lll} \left\|\delta{y(t)}\right\|\leq{\left\|v(0)\right\|}{\rm e}^{-C_2{t}+\frac{\rho{t}}{2}}+{\left\|w(T)\right\|{\rm e}^{-C_2{(T-t)+\frac{\rho{t}}{2}}}}, \\ \left\|\delta{\lambda(t)}\right\|\leq{\left\|E_-\right\|\left\|v(0)\right\|}{{\rm e}^{-C_2{t}+\frac{\rho{t}}{2}}+\left\|E_+\right\|\left\|w(T)\right\|}{\rm e}^{-C_2{(T-t)}+\frac{\rho{t}}{2}}. \end{array}\right. \end{equation} $

再根据(3.9)式的估计结果, 就有

$ \begin{equation} \left\{ \begin{array}{lll} \left\|\delta{y(t)}\right\|\leq{\left\|y_0-y_s\right\|}{\rm e}^{-C_2{t}+\frac{\rho{t}}{2}}+{\left\|{E_+^{-1}E_-}\right\|\left\|y_0-y_s\right\|}{\rm e}^{-C_2{(T-t)+\frac{\rho{t}}{2}}}, \\ \left\|\delta{\lambda(t)}\right\|\leq{\left\|E_-\right\|\left\|y_0-y_s\right\|}{{\rm e}^{-C_2{t}+\frac{\rho{t}}{2}}+\left\|E_-\right\|\left\|y_0-y_s\right\|}{\rm e}^{-C_2{(T-t)}+\frac{\rho{t}}{2}}. \end{array}\right. \end{equation} $

$ \rho\leq{2\varepsilon{C_2}} $时, 可以得出

$ \begin{equation} \left\{ \begin{array}{lll} \left\|\delta{y(t)}\right\|\leq{\left\|y_0-y_s\right\|}{\rm e}^{-(1-\varepsilon)C_2{t}}+{\left\|E_+^{-1}E_-\right\|\left\|y_0-y_s\right\|}{\rm e}^{-C_2{(T-(1-\varepsilon)t)}}, \\ \left\|\delta{\lambda(t)}\right\|\leq{\left\|E_-\right\|\left\|y_0-y_s\right\|}{{\rm e}^{-(1-\varepsilon)C_2{t}}+\left\|E_-\right\|\left\|y_0-y_s\right\|}{\rm e}^{-C_2{(T-(1-\varepsilon)t)}}. \end{array}\right. \end{equation} $

关于控制的估计有$ \delta{u(t)}=u(t)-u_s=U^{-1}B^{*}\delta{\lambda(t)} $, 结合(3.12)式, 可以得到: 存在常数$ C_1>{0} $, 使得下式成立

这样便完成了定理3.1的证明.

正如上面提到的, 矩阵$ M $的结构在最优解的turnpike性质的分析中是至关重要的. 接下来我们将考虑更弱的条件, 即假设$ (A, B) $是能稳的, 且$ (A, C) $是可测的[9]. 在这种情况下, 我们首先证明矩阵$ M $是可分块对角化, 并且可逆的.

定理3.2  若$ (A, B) $是能稳的, 并且$ (A, C) $是可测的. 那么存在常数$ \varepsilon>{0} $, $ c>{0} $, $ v>{0} $以及时间$ T_0>{0} $, 当$ \rho\leqslant{2\varepsilon{v}} $, $ T\geqslant{T_0} $时, 最优控制问题$ (2.1) $的最优解$ (y(\cdot), u(\cdot)) $满足

其中$ t\in[0, T].$

在给出该定理的证明之前,我们先考察下面的三个重要的引理.

引理3.3  若$ (A, B) $是能稳的, 那么$ (\widetilde{A}, B) $也是能稳的, 这里$ \widetilde{A}=A-\frac{\rho}{2}I $.

  根据$ (A, B) $能稳的性质, 我们知道存在常数$ c>{0} $$ v>0 $使得

进而, 我们可以得到

引理3.3得证.

同理, 根据可测的定义, 若$ (A, C) $是可测的, 那么$ (\widetilde{A}, C) $也是可测的.

引理3.4  若$ (\widetilde{A}, B) $是能稳的, 并且$ (\widetilde{A}, C) $是可测的. 那么矩阵$ M $是可分块对角化, 并且是可逆的.

  在引理的假设条件下, 根据文献[20, 第四章定理4.4]的结果, 下面的代数Riccati方程$ \widetilde{A}^{*}P+P\widetilde{A}-PBQ^{-1}B^{*}P+C^{*}C=0 $有唯一的半正定自伴矩阵解$ P $, 且存在常数$ c>{0} $$ v>0 $, 使得

因此, $ \widetilde{A}-BQ^{-1}B^{*}P $的谱半径满足

$ E $满足下面的李雅普诺夫方程[18]

$ \begin{equation} (\widetilde{A}-BU^{-1}B^{*}P)E+E(\widetilde{A}-BU^{-1}B^{*}P)^{*}-BU^{-1}B^{*}=0. \end{equation} $

根据矩阵$ P $$ E $的定义, 我们构造下面的线性变换

易知, 矩阵$ T_{1} $是可逆的, 并且

$ \begin{equation} T_{1}^{-1}MT_{1}= \left( \begin{array}{cc} \widetilde{A}-BU^{-1}B^{*}P{\quad} &BU^{-1}B^{*}\\ 0{\quad} &-(\widetilde{A}-BU^{-1}B^{*}P)^{*} \end{array} \right). \end{equation} $

下面, 我们令

容易验证矩阵$ T_{2} $也是可逆的. 因此我们可以得到

$ \begin{equation} T_{2}^{-1}T_{1}^{-1}MT_{1}T_{2}= \left( \begin{array}{cc} \widetilde{A}-BU^{-1}B^{*}P{\quad} &0\\ 0{\quad} &-(\widetilde{A}-BU^{-1}B^{*}P)^{*} \end{array} \right). \end{equation} $

经过上面的矩阵变换, 我们知道$ M $可以被可逆矩阵$ T $对角化, 其中$ T=T_{2}T_{1} $, 即

引理3.4得证.

下面我们引用文献[3, 引理2].

引理3.5  若$ (\widetilde{A}, B) $是能稳的, 并且$ (\widetilde{A}, C) $是可测的, 那么存在与$ T $无关的常数$ k>0 $, 使得

$ \begin{equation} \left\|\alpha(T)\right\|+\left\|\beta(0)\right\|\leq{k\left\|\alpha(0)\right\|+\left\|\beta(T)\right\|}, \end{equation} $

其中$ (\alpha(\cdot), \beta(\cdot)) $满足下面的方程组

$ \begin{equation} \left\{ \begin{array}{lll} \alpha'(t)=\widetilde{A}\alpha(t)+BU^{-1}B^{*}\beta(t), \\ {\beta}'(t)=Q\alpha(t)-{\widetilde{A}}^{*}\beta(t), \quad t\in\left[0, T\right]. \end{array}\right. \end{equation} $

现在, 我们可以给出定理3.2的证明.

定理3.2的证明  从(2.11)式我们可以得到

根据引理3.4, 通过运用如下的线性变换

$ \begin{equation} \left( \begin{array}{c} v(t) \\ w(t) \end{array} \right)= \left( \begin{array}{cc} I+EP{\quad} & E \\ P{\quad} & I \end{array} \right) \left( \begin{array}{c} \alpha(t)\\ \beta(t) \end{array} \right), \quad t\in\left[0, T\right]. \end{equation} $

我们从(3.15)式中推得

$ \begin{equation} \frac{{\rm d}}{{\rm d}t} \left( \begin{array}{c} v(t) \\ w(t) \end{array} \right) = \left( \begin{array}{cc} \widetilde{A}-BU^{-1}B^{*}P{\quad} &0\\ 0{\quad}&-(\widetilde{A}-BU^{-1}B^{*}P)^{*} \end{array} \right) \left( \begin{array}{c} v(t) \\ w(t) \end{array} \right). \end{equation} $

于是

$ \begin{equation} \left\{ \begin{array}{lll} v(t)=v(0){\rm e}^{(\widetilde{A}-BU^{-1}B^{*}P)t}, \\ w(t)=w(T){\rm e}^{-(\widetilde{A}-BU^{-1}B^{*}P)^{*}(T-t)}. \end{array}\right. \end{equation} $

从而, 我们能够得出如下的不等式成立

$ \begin{equation} \left\{ \begin{array}{lll} \left\|v(t)\right\|\leq{C_1\left\|v(0)\right\|}{\rm e}^{-C_2{t}}, \\ \left\|w(t)\right\|\leq{C_3\left\|w(T)\right\|}{\rm e}^{-C_4{(T-t)}}. \end{array}\right. \end{equation} $

回到(3.18)式, 我们有

$ \begin{equation} v(0)=(I+EP)\alpha(0)+E \beta(0), w(T)=P\alpha(T)+\beta(T). \end{equation} $

根据引理3.5, 我们有如下估计

$ \begin{equation} \left\|\alpha(T)\right\|+\left\|\beta(0)\right\|\leq{k(\left\|\alpha(0)\right\|+\left\|\beta(T)\right\|)}, \end{equation} $

其中$ k $为不依赖于$ T $的正常数. 令$ v=\max\left\{c_2, c_4\right\} $, 结合(3.21)式, (3.22)式, 以及线性变换(3.18)式的有界可逆性, 得到下面的估计

$ \begin{equation} \left\|\alpha(t)\right\|+\left\|\beta(t)\right\|\leq{k(\left\|\alpha(0)\right\|+\left\|\beta(T)\right\|)({\rm e}^{-vt}+{\rm e}^{-v(T-t)})}. \end{equation} $

在这里, 就得到了关于$ \alpha(t) $$ \beta(t) $的估计. 结合终端条件, 这里初始点和终端点都是确定的. 其中, $ y(0)=y_0 $, $ y(T)=y_1 $, $ \lambda(T)=\lambda_T $. 再根据(2.8)式, 回到$ \delta{y} $$ \delta{\lambda} $, 有$ \delta{y(t)}={\rm e}^{\frac{\rho{t}}{2}}\alpha(t) $, $ \delta{\lambda(t)}={\rm e}^{\frac{\rho{t}}{2}}\beta(t) $. 代入(3.24)式, 计算得到

$ \begin{equation} \left\|\delta{y(t)}\right\|+\left\|\delta{\lambda(t)}\right\|\leq{k(y_0+{\rm e}^{\frac{\rho{T}}{2}}\lambda_{T})({\rm e}^{-vt+\frac{\rho{t}}{2}}+{\rm e}^{-v(T-t)+\frac{\rho{t}}{2}})}. \end{equation} $

$ \rho\leq{2\varepsilon{C_2}} $时, 存在不依赖于时间$ t $的常数$ c $, 使得下式成立

$ \begin{equation} \left\|\delta{y(t)}\right\|+\left\|\delta{\lambda(t)}\right\|\leq{c({\rm e}^{-(1-\varepsilon)v{t}}+ {\rm e}^{-v{(T-(1-\varepsilon)t)}})}. \end{equation} $

注意到$ \delta{u(t)}=u(t)-u_s=U^{-1}B^{*}\delta{\lambda(t)} $, 这样我们就完成了定理3.2的证明.

参考文献

Damm T , Grüne L , Stieler M , Worthmann K .

An exponential turnpike theorem for dissipative discrete time optimal control problems

SIAM Journal on Control and Optimization, 2014, 52 (3): 1935- 1957

DOI:10.1137/120888934      [本文引用: 1]

Anderson B , Kokotovic P V .

Optimal control problems over large time intervals

Automatica, 1987, 23 (3): 355- 363

DOI:10.1016/0005-1098(87)90008-2     

Trélat E , Zhang C , Zuazua E .

Steady-state and periodic exponential turnpike property for optimal control problems in Hilbert spaces

SIAM Journal on Control and Optimization, 2018, 56 (2): 1222- 1252

DOI:10.1137/16M1097638      [本文引用: 3]

Carlson D A , Leizarowitz A , Haurie A . Infinite Horizon Optimal Control. Berlin: Springer, 1991

[本文引用: 1]

Trélat E , Zuazua E .

The turnpike property in finite-dimensional nonlinear optimal control

Journal of Differential Equations, 2015, 258 (1): 81- 114

DOI:10.1016/j.jde.2014.09.005      [本文引用: 3]

Mckenzie W .

Turnpike theorems for a generalized Leontief model

Econometrica, 1963, 31: 165- 180

DOI:10.2307/1910955      [本文引用: 1]

Zuazua E .

Large time control and turnpike properties for wave equations

Annual Reviews in Control, 2017, 44: 199- 210

DOI:10.1016/j.arcontrol.2017.04.002      [本文引用: 3]

Faulwasser T , Korda M , Jones C N , Bonvin D .

On turnpike and dissipativity properties of continuous-time optimal control problems

Automatica, 2017, 81: 297- 304

DOI:10.1016/j.automatica.2017.03.012      [本文引用: 2]

Gugat M , Trélat E , Zuazua E .

Optimal Neumann control for the 1D wave equation: finite horizon, infinite horizon, boundary tracking terms and the turnpike property

Systems Control Letters, 2016, 90: 61- 70

DOI:10.1016/j.sysconle.2016.02.001      [本文引用: 3]

Trélat E , Zhang C .

Integral and measure-turnpike property for infinite dimensional optimal control problems

Mathematics of Control, Signals, and Systems, 2018, 30 (1): 3- 37

DOI:10.1007/s00498-018-0209-1      [本文引用: 1]

Weglarz J .

Optimization-Theory and applications: Problems with ordinary differential equations

European Journal of Operational Research, 1984, 16 (2): 277

[本文引用: 2]

Li X , Yong J . Optimal Control Theory for Infinite Dimensional Systems. Boston: Birkhauser, 1995

[本文引用: 1]

Lukes D L .

Optimal regulation of nonlinear dynamical systems

Society for Industrial and Applied Mathematics, 1968, 7 (1): 37

Sakamoto , Noboru .

Analysis of the Hamilton-Jacobi Equation in Nonlinear Control Theory by Simplectic Geometry

SIAM Journal on Control and Optimization, 2002, 40 (6): 1924- 1937

DOI:10.1137/S0363012999362803      [本文引用: 1]

Agrachev A A , Sachkov Y . Control Theory from the Geometric Viewpoint. Berlin: Springer, 2004

[本文引用: 1]

Pontryagin L S , Boltyanskii V G , Gamkrelidza R V , Mishchenko E F . The Mathematical Theory of Optimal Processes. New York: John Wiley, 1962

Allaire G , Münch A , Periago F .

Long time behavior of a two-phase optimal design for the heat equation

Society for Industrial and Applied Mathematics, 2010, 48 (8): 5333- 5356

[本文引用: 1]

Kwakernaak H , Sivan R .

Linear optimal control systems

Journal of Dynamic Systems Measurement and Control, 1974, 96 (3): 373- 374

[本文引用: 2]

Abou-Kandil H , Freiling G , Ionescu V , Jank G . Matrix Riccati Equations in Control and Systems Theory. Basel: Birkhauser, 2003: 551- 572

[本文引用: 1]

Zabczyk J . Mathematical Control Theory: An Introduction. Boston: Birkhauser, 1992

[本文引用: 1]

/