迭代学习控制由Arimoto等人[1]首次提出完整的控制算法后,已成为近年来控制理论研究的热点问题,并引起人们的广泛关注.在迭代学习控制设计中,采用较多的是D型学习律[1, 2, 3, 4]和P型学习律[5, 6, 7],根据系统所满足的性质,在重复受控时间内,用D型学习律或P型学习律进行控制设计.
由于很多实际问题通常要用偏微分方程所代表的分布参数系统模型描述,近年来,分布参数系统的应用已经渗透到各个领域,相应的研究工作也取得了不少成果[8, 9, 10, 11]. 然而,由于分布参数系统变量涉及无穷维函数空间,所以到目前为止将迭代学习方法应用于分布参数系统的研究成果并不多,且多集中于抛物型分布参数系统上,文献[]研究了抛物型分布参数系统的迭代学习控制问题,在输入、输出有直输通道的情况下,用P型学习律设计出了迭代学习控制器.文献[16]则将迭代学习控制应用到了二阶双曲型分布参数系统上,得到了输出跟踪误差于$L^2$空间内沿迭代轴方向收敛的结论.
研究偏微分方程时,常需研讨其弱解问题,而Sobolev空间是讨论偏微分方程弱解比较合适的空间,所以,于Sobolev空间$W^{1,2}$中研究分布参数系统的迭代学习控制问题是有意义的,然相关的研究成果尚甚少. 文献[12]针对一类抛物型分布参数系统,在证明了输出跟踪误差于$L^2$空间内沿迭代轴方向收敛的定理后,给出了输出跟踪误差于$W^{1,2}$空间内收敛的结论,但限于篇幅,文献[12]略去了其证明过程.
本文研究一类分布参数系统于$W^{1,2}$空间中的迭代学习控制问题,该系统由抛物型偏微分方程或由双曲型偏微分方程构成.当输入,输出有直输通道时,用P型学习律设计出迭代学习控制器,证明这种学习律能使得系统的输出跟踪误差于$W^{1,2}$空间内沿迭代轴方向收敛,并进一步研究输出跟踪误差于$W^{2,2}$空间内的收敛性问题.
本文给出如下符号约定: 用$\left\| \cdot\right\|$表示向量或矩阵的2范数,对向量$Q(x,t)\in {\Bbb R}^n\cap L^2[0, 1]$,$x\in [0, 1]$,$t\in [0,T]$,记
定义$\left\| {Q(x,t)} \right\|_{L^2[0, 1],s} =\sup\limits_{t\in [0,T]} \left\| {Q(x,t)} \right\|_{L^2[0, 1]}^2 $,对给定的$\lambda>0$,定义$\left\| {Q(x,t)} \right\|_{L^2[0, 1],\lambda } = \sup\limits_{t\in [0,T]} {\rm e}^{-\lambda t}\left\| {Q(x,t)}\right\|_{L^2[0, 1]}^2 $. 由文献[7]可知,可用$\left\| {Q(x,t)}\right\|_{L^2[0, 1],s} $与$\left\| {Q(x,t)}\right\|_{L^2[0, 1],\lambda } $其中任一个来证明收敛性结果. 记$\Omega =[0, 1]\times [0,T],$
考虑如下形式的分布参数系统
假设2.1 对于给定的初值$Q(x,0)(\alpha =1,2)$,$\left.{\frac{\partial Q(x,t)}{\partial t}} \right|_{t=0} (\alpha =2)$,边值$Q(0,t)$($\alpha =1)$,或$\left. {\frac{\partial Q(x,t)}{\partial x}} \right|_{x=0}(\alpha =1,2)$; $Q(1,t)(\alpha =1)$,或${\left. {\frac{{\partial Q(x,t)}}{{\partial x}}} \right|_{x = 1}}(\alpha = 1,2)$,控制输入$u(x,t)$,系统(2.1)的解$Q(x,t)$在$(0,1)\times [0,T]$内存在唯一.
假设2.2 对$\forall t\in [0,T]$,有$0 < {\alpha _1} \leqslant E(t) \leqslant {\alpha _2}$,即输入、输出有直输通道,而 $ \left\| {A(t)}\right\|\le A,$ $ \left\| {B(t)} \right\|\le B,$ $\left\|{C(t)} \right\|\le C. $
假设2.3 对于给定的理想轨迹$y_r (x,t)$,存在唯一的控制输入$u_r (x,t)$,使得
设动态系统(2.1)在有限区间$t\in [0,T]$内是可重复的,在迭代学习过程中,重写系统(2.1)为
假设2.4 系统的初值定位条件为: $Q_k (x,0)=Q_r(x,0)$ ($\alpha =1,2$),${\left. {\frac{{\partial {Q_k}(x,t)}}{{\partial t}}} \right|_{t = 0}} = {\left. {\frac{{\partial {Q_r}(x,t)}}{{\partial t}}} \right|_{t = 0}}$ $(\alpha =2)$; 边值定位条件为: $Q_k (0,t)=Q_r (0,t)(\alpha=1)$,或$\left. {\frac{\partial Q_k (x,t)}{\partial x}}\right|_{x=0} =\left. {\frac{\partial Q_r (x,t)}{\partial x}}\right|_{x=0}$ $(\alpha =1,2)$; $Q_k (1,t)=Q_r (1,t)(\alpha=1)$,或$\left. {\frac{\partial Q_k (x,t)}{\partial x}} \right|_{x=1}=\left. {\frac{\partial Q_r (x,t)}{\partial x}} \right|_{x=1}(\alpha =1,2)$. $k=0,1,2,\cdots $.
学习控制的目的是寻找适当的学习律,使得迭代学习序列$y_k(x,t)$于$W^{1,2}[0, 1]$空间中一致收敛于理想的输出$y_r (x,t)$,即
引理2.1 [17] 设$\left\{ {a_k } \right\}$,$\left\{ {b_k } \right\}$是满足
对假设2.2中的$\alpha _1 ,\alpha _2 $,取正数$\varepsilon $,使其满足
对系统(2.2)构建P型学习律
选取学习增益$q$,使得
定理3.1 若假设2.1-2.4及(3.3)式成立,则抛物型($\alpha=1)$系统(2.2)在P型学习律(3.2)作用下于$W^{1,2}[0, 1]$空间内是收敛的,即
证 (1) 证$\lim \limits_{k\to \infty }\left\| {e_k (x,t)} \right\|_{L^2[0, 1],s} =0$.
对(3.13)式两端用向量$\delta Q_k (x,t)$作内积,得
将(3.17)式代入(3.7)式,有
(2) 证$\mathop {\lim }\limits_{k\to \infty } \left\|{\frac{\partial e_k (x,t)}{\partial x}} \right\|_{L^2[0, 1],s} =0$.
对(3.13)式两端用向量$\frac{{{\partial ^2}(\delta {Q_k}(x,t))}}{{\partial {x^2}}}$作内积,得
(3) 证$\mathop {\lim }\limits_{k\to \infty } \left\|{\frac{\partial ^2e_k (x,t)}{\partial x^2}} \right\|_{L^2(\Omega )}=0$.
(3.26)式两端对变量$t$从$0$到$T$积分,结合假设2.4中的初值定位条件,有
注3.1 针对抛物型系统,文献[12]使用的是高阶学习律[18],通过先证控制变量$u_k$收敛($L^2$意义下)于理想控制$u_r $,然后再证得输出变量$y_k$收敛($L^2$意义下)于理想控制$y_r $. 相对于高阶学习律,本文使用的是一阶学习律[18],采用的是直接证明输出变量$y_k$收敛($L^2$意义下)于理想控制$y_r $. 由此,本文中的控制器设计和定理3.1中的第1部分证明过程与文献[12]是不同的.
定理3.2 若假设2.1-2.4及(3.3)式成立,则双曲型($\alpha=2)$系统(2.2)在P型学习律(3.2)作用下于$W^{2,2}[0, 1]$空间内是收敛的,即\[\mathop {\lim }\limits_{k\to \infty } \left\| {e_k (x,t)}\right\|_{L^2[0, 1],s} =0,\mathop {\lim }\limits_{k\to \infty }\left\| {\frac{\partial e_k (x,t)}{\partial x}}\right\|_{L^2[0, 1],s} =0,\mathop {\lim }\limits_{k\to \infty }\left\| {\frac{\partial ^2e_k (x,t)}{\partial x^2}}\right\|_{L^2[0, 1],s} =0.\]
证 (1) 由于双曲型($\alpha=2)$系统(2.1)包含于文献[16]研究的系统类型中,由文献[16]的结论有
对(3.13)式两端用向量$\frac{\partial }{\partial t}\left({\frac{\partial ^2(\delta Q_k (x,t))}{\partial x^2}} \right)$作内积,得
将(3.40)式代入(3.9)式,有
(3) 证$\mathop {\lim }\limits_{k\to \infty } \left\|{\frac{\partial ^2e_k (x,t)}{\partial x^2}} \right\|_{L^2[0, 1],s}=0$.
由(3.37)式有
注3.2 (3.35)式的成立,必须用到第二边值的边值定位条件,所以对于双曲型系统,本文得到的结论仅适用于第二边值的情形.
注3.3 [16] 由假设2.2,选取学习增益$q$,使其满足$\frac{{\sqrt {1 + \varepsilon } - 1}}{{{\alpha _1}\sqrt {1 + \varepsilon } }} < q < \frac{{\sqrt {1 + \varepsilon } + 1}}{{{\alpha _2}\sqrt {1 + \varepsilon } }}$,则收敛性条件(3.3)式就能成立,再由(3.1)式可知,满足条件的学习增益$q$总是存在的.
注3.4 本文中偏微分方程的解,可以是弱解,也可以是强解.有关弱解,强解的定义及保证其存在的充分性条件等可见文献[19].
下分别就抛物型和双曲型系统给出算例,并利用数学软件Mathematica进行仿真分析.
(1) 构建如下形式的抛物型系统
构建迭代
取初始控制$u_0 (x,t)=1$,构建迭代控制
(2) 构建如下形式的双曲型系统
取初始控制$u_0 (x,t)\mbox{=}1$,构建迭代控制
本文研究了一类分布参数系统于$W^{1,2}$空间中的迭代学习控制问题,该系统由抛物型偏微分方程或由双曲型偏微分方程构成,并具有适定的初值、边值(抛物型: 第一边值或第二边值; 双曲型:第二边值)定解条件. 当输入,输出有直输通道时,用P型学习律设计出迭代学习控制器,证明了这种学习律能使得系统的输出跟踪误差于$W^{1,2}$空间内沿迭代轴方向收敛,并进一步给出了输出跟踪误差于$W^{2,2}$空间内的收敛性结论,得到了很好的结果.仿真算例也说明如此.