Loading [MathJax]/jax/output/HTML-CSS/jax.js
  数学物理学报  2015, Vol. 35 Issue (1): 131-150   PDF (451 KB)    
扩展功能    
加入收藏夹
复制引文信息
加入引用管理器
Email Alert
RSS
本文作者相关文章    
彭卓华
矩阵约束下矩阵方程组的双对称最小二乘解
彭卓华    
湖南科技大学 数学与计算科学学院 湖南 湘潭 411201
摘要    :矩阵方程组lj=1AijXjBij=Ci(i=1,2,,t)在控制与系统领域中具有广泛应用.该文构造了一种算法求解这个矩阵方程组, 其中 XjRnj×nj(j=1,2,,l)为带有特殊中心主子矩阵约束的双对称矩阵. 在没有舍入误差的情况下, 该算法经过有限步迭代得到[X1,X2,,Xl], 使得ti=1lj=1AijXjBijCi=min.实例表明这种方法是有效的.
关键词矩阵方程组     中心主子矩阵     双对称解     子矩阵约束     最小二乘解    
The Bisymmetric Least Squares Solutions of the General Coupled |Matrix Equations with A Submatrix Constraint
PENG Zhuo-Hua    
School of Mathematics and Computing Science, Hunan University of Science and Technology, Hunan Xiangtan 411201
Abstract    : The general coupled matrix equations lj=1AijXjBij=Ci,i=1,2,,t, have numerous applications in control and system theory. In this paper, an algorithm is constructed to solve the general coupled matrix equations where XjRnj×nj(j=1,2,,l) is a bisymmetric matrix with a specified central principal submatrix. The algorithm produces suitable [X1,X2,,Xl] such that ti=1lj=1AijXjBijCi is minimized within a finite iteration steps in the absence of roundoff errors.The algorithm requires little storage capacity. Numerical examples are given to show that the algorithm is efficient.
Key words: General coupled matrix equations      Central principal submatrix     Bisymmetric solution     Submatrix constraint     Least squares solution    
1 引言

RRm×nSRn×nARn×n 分别表示实数、m×n实矩阵、 n×n实对称矩阵和n×n 实反对称矩阵集合. In表示n阶单位矩阵. Sn(Sn=(en,en1,,e1)) 表示n×n反序单位矩阵(ei表示n×n 单位矩阵的第i列). AT和tr(A) 分别表示矩阵A的转置和迹. 定义矩阵AB的内积为A,B=tr(BTA),那么,由这种内积生成的范数, 显然就是Frobenius范数,即A2=A,A.

定义1.1     矩阵A=(aij)Rn×n被称为双对称矩阵,如果A=AT=SnASn,即,aij=aji=an+1j,n+1i,(i,j=1,2,,n). 用BRn×n表示n阶实双对称矩阵集合.

定义1.2     矩阵A=(aij)Rn×n被称为双反对称矩阵,如果AT=A=SnASn,即,aij=aji=an+1j,n+1i,(i,j=1,2,,n). 用SCRn×n表示n阶实双反对称矩阵集合.

双对称矩阵在信息理论[1]、马尔可夫过程[2]和物理工程问题[3]等很多领域中有广泛应用,并且已被广泛研究.

线性矩阵方程组已经成为数值计算中的热门课题,已有很多的研究成果. 例如,Yuan和Wang[4]利用四元数矩阵的复表示和Moore-Penrose广 义逆给出了矩阵方程AXB+CXD=E 带有最小范数的最小二乘η-Hermitian和η-anti-Hermitian解 的表达式. Wang[5]在正则环上研究了矩阵方程组A1XB1=C1,A2XB2=C2,得到了这个方程组一般解 存在的充分必要条件和表达式. Wang[6]也在冯诺伊曼正则 环上研究了矩阵方程组. Wang等[7]给出了矩阵方程组 AiXYBi=Ci(i=1,2,,s), AiXBiCiYDi=Ei(i=1,2,,s)双(反) 对称解的充分必要条件. Wang和Li[8]在四元数代数中求出了矩 阵方程组A1X=C1,A2X2=C2,A3X1B1+A4X2B2=C3的最大最小秩解和最小范数解. Wang和Yu[9]给出了四元数矩阵方程AX=B广义双对称和双 反对称解的条件以及解的表达式,并且求出了最大最小秩解. Wang和Yu[10]也得到了四元数矩阵方程XA=B的最小二乘 解的充分必要条件和解的表达式.

迭代方法经常应用于解矩阵方程组. 例如,Lin和Wang[11]用 迭代法求出了矩阵方程组A1X1B1+A2X2B2=E,C1X1D1+C2X2D2=F 的解. Li和Wang[12, 13] 用迭代法求出了四元数矩阵方程的自反和广义(P,Q)自反解. Yin等[15, 16]用迭代法求出了广义Sylvester矩阵方程组的广义自反解. Ding等[17]用两种方法求解了 矩阵方程组A1XB1=F1A2XB2=F2. 在[18, 19, 20, 21]中, Ding等利用基于层次识别原理[22, 23]的迭代法研究了矩阵方程组. Ding和Chen[24]利用基于 梯度搜索原理的迭代法求解了矩阵方程组 pj=1AijXjBij=Mi,i=1,2,,p.(1.1) 值得注意的是,矩阵方程组(1.1)包含了很多的矩阵方程组.

近年来,人们对双对称矩阵、中心对称矩阵等子矩阵约束问题产生 了浓厚兴趣. 然而,由于这些矩阵的特殊结构,在给定的子矩阵约束 条件下讨论 子矩阵约束问题是不适合的,因为这种特殊结构被破坏. 因此, 为了解决这个问题,引入一个定义.

定义1.3    [25] 给定MRn×n, 如果nq是一个偶数,那么通过删掉M的前后nq2行和列, 得到M的一个q阶中心主子矩阵, 用Mc(q)表示,即,Mc(q)=[mij]nq2i,jnnq2.

如果MRn×n的中心主子矩阵为Mc(q)=X, 其他元素为0,那么M就被这个中心主子矩阵完全确定. 在这种情况下, 用¯Xq表示这种矩阵,即, ¯Xq=M=(0  0  00X0000). 显然,奇数(偶数)阶矩阵仅有奇数(偶数)阶中心主子矩阵.

子矩阵约束问题最初来源于子系统扩充问题,并且已被广泛地研究. 例如, Yin等[14]对一个逆特征值问题给出了顺序主子矩阵约束的(R,S)对称解. Liao和Lei[26] 研究了带有子矩阵约束的双对称解的逆特征值问题. Bai[27]研究了 带有子矩阵约束的中心对称解的逆特征值问题. Deift和Nanda[28]讨论了在子矩阵约束下三对角 矩阵的逆特征值问题. Gong等[29]讨论了矩阵方程AXAT=BX 带有顺序主子矩阵约束的反对称解. Zhao等[30]研究了矩阵方程AX=BX带有中心主子矩阵约束的 双对称解.

然而,矩阵方程组(1.1)中X1,X2,,Xp带有相关的中心主子 矩阵约束的双对称解的问题还没有相关的结论,而且,使用上面文献中的方法,不能解决这个问题. 还应该指出,矩阵方程组(1.1)的系数矩阵经常来自实验, 可能不满足方程组的可解条件. 因此,本文研究以下问题.

问题 I    给定AijRpi×nj,BijRnj×mi,CiRpi×miXqjRqj×qj (i=1,2,,t, j=1,2,,l). 设 Dj={XjRnj×nj|(Xj)c(qj)=Xqj,Xj¯XqjBRnj×nj}.(1.2) 求矩阵组[X1,X2,,Xl]D1×D2××Dl,使得 ti=1lj=1AijXjBijCi=min[X1,X2,,Xl]D1×D2××Dlti=1lj=1AijXjBijCi.

问题 II    设SE表示问题I的解集. 给定矩阵组[ˆX1,ˆX2,,ˆXl]D1×D2××Dl,求[ˆX1,ˆX2,,ˆXl]SE,使得 lj=1ˆXjˆXj2=min[X1,X2,Xl]SElj=1XjˆXj2.

2 预备知识

引理2.1     如果矩阵XSRn×n,那么 X+SnXSnBRn×n,XSnXSnSCRn×n.

     由定义(1.1)和定义(1.2)容易得到这个证明.

定义2.1    定义以下两个集合 BRn×n={X|XBRn×n,  Xc(q)=0}, BRn×n={X|X=(0000 Xq 0000),XBRn×n, Xq=Xc(q)BRq×q}. 显然,BRn×nBRn×n都是Rn×n的线性子空间.

引理2.2     (1)~ Rn×n=SRn×nARn×n; (2)~ SRn×n=BRn×nSCRn×n; (3)~ BRn×n=BRn×nBRn×n, \\ 其中 表示直和.

     (1)式是显然的. 下证(2)式. 证明需要以下3步.

第1步 XSRn×n,令 Xa=X+SnXSn2,Xb=XSnXSn2,(2.1) 那么 XaBRn×n, XbSCRn×n,以及 X=Xa+Xb.(2.2)

第2步 如果存在XaBRn×n, XbSCRn×n满足 X=Xa+Xb,(2.3) (2.3)式减去(2.2)式得 XaXa=XbXb.(2.4) (2.4)式两边乘以SnSnXaSnSnXaSn=SnXbSnSnXbSn,XaXa=Xb+Xb.(2.5) 由(2.4)式和(2.5)式知,Xa=Xa, Xb=Xb.

第3步 XaBRn×n, XbSCRn×n, Xa,Xb=tr(XTbXa)=tr(SnXTbSnSnXaSn)=tr(XTbXa)=Xa,Xb.Xa,Xb=0.

因此,由以上3步可知,(2)式成立.

(3)式的证明与(2)式的证明类似.

推论2.1     ZRn×n,则存在唯一的Z1BRn×n,Z2BRn×n,Z3SCRn×nZ4ARn×n,使得 Z=Z1+Z2+Z3+Z4,其中Zi,Zj=0,ij,i,j=1,2,3,4.

定义2.2     定义Ψ是从Rn×nBRn×n的线性投影算子. Ψ:Rn×nBRn×n ZZ1,即,Ψ(Z)=Z1.

ZRn×n, WBRn×n,则 Z,W=Z1+Z2+Z3+Z4,W=Z1,W=Ψ(Z),W.(2.6)

引理2.3    [31]M表示有限维内积空间,NM的一个子空间,N 表示N的正交补空间. xM,总存在y0N,使得xy0xy(yN),其中. 是定义在M上,与内积空间相关的范数. 而且,y0N中唯一最小向量的充分必要条件是(xy0)N, 即(xy0)N.

3 用迭代法解问题I
3.1 与问题I等价的最小二乘问题

问题 A     设Aij,Bij,Ci,Xqj (i=1,2,,t,j=1,2,,l)与问题I中的一致. 求[˜X1,˜X2,,˜Xl]BRn1×n1×BRn2×n2××BRnl×nl,使得 ti=1lj=1Aij˜XjBijFi=min[X1,X2,,Xl]BRn1×n1×BRn2×n2××BRnl×nlti=1lj=1AijXjBijFi, 其中 Fi=Cilj=1Aij¯XjBij,

¯Xj=¯Xqj=(0000 Xqj 0000),j=1,2,,l. (3.1)

引理3.1     问题I的解可表示为[X1,X2,,Xl]=[˜X1+¯X1,˜X2+¯X2,,˜Xl+¯Xl],其中 [˜X1,˜X2,,˜Xl]是问题A的解.

     由(1.2)式可得Dj=¯Xj+BRnj×nj. 这表明Dj是一个线性流形. ti=1lj=1AijXjBijCiti=1lj=1Aij(¯Xj+˜Xj)BijCiti=1lj=1Aij˜XjBij(Cilj=1Aij¯XjBij)ti=1lj=1Aij˜XjBijFi. 故引理3.1成立.

注1     由于Dj是一个线性流形,不能确保得到的解满足给定的子矩阵要求,所以,不能直接构造迭代法解问题I. 因此,把线性流形上的问题I转化为线性子空间上的问题A, 达到求解问题I的目的.

求解问题A,也就是求矩阵方程组

lj=1AijXjBij=Fi,i=1,2,,t. (3.2)
BRn1×n1×BRn2×n2××BRnl×nl上的最小二乘解 [˜X1,˜X2,,˜Xl].

引理3.2     设˜Ri表示方程组(3.2)相应于[˜X1,˜X2, ,˜Xl]的残量,即, ˜Ri=Filj=1Aij˜XjBij. 如果Ψ(ti=1ATij˜RiBTij)=0 (j=1,2,,l)同时成立, 那么,[˜X1,˜X2,,˜Xl] 就是问题A的解.

     设L ={L|L=diag(lj=1A1jXjB1j,lj=1A2jXjB2j,,lj=1AtjXjBtj)}, 其中XjBRnj×nj (j=1,2,,l). 显然,L是一个线性子空间. 对于[˜X1,˜X2,,˜Xl],记 ˜F=diag(lj=1A1j˜XjB1j,lj=1A2j˜XjB2j,,lj=1Atj˜XjBtj),˜FL. 设F=diag(F1,F2,,Ft). 由引理2.3知, [˜X1,˜X2,,˜Xl] 是问题A的解,当且仅当(F˜F)L,即, [X1,X2,,Xl]BRn1×n1×BRn2×n2××BRnl×nl,

F˜F,diag(lj=1A1jXjB1j,lj=1A2jXjB2j,,lj=1AtjXjBtj)=diag(˜R1,˜R2,,˜Rt),diag(lj=1A1jXjB1j,lj=1A2jXjB2j,,lj=1AtjXjBtj)=0, (3.3)
由(2.6)式知 diag(˜R1,˜R2,,˜Rt),diag(lj=1A1jXjB1j,lj=1A2jXjB2j,,lj=1AtjXjBtj)=ti=1˜Ri,lj=1AijXjBij=ti=1lj=1˜Ri,AijXjBij=lj=1ti=1ATij˜RiBTij,Xj=lj=1Ψ(ti=1ATij˜RiBTij),Xj. 因此,如果Ψ(ti=1ATij˜RiBTij)=0 (j=1,2,,l)同时成立,那么(3.3)式成立,表明 [˜X1,˜X2, ,˜Xl]是问题A的解.

引理3.3    [32]f(Z)是子空间Y上连续、可微的凸函数. 那么存在ZY,使得f(Z)=minZYf(Z),当且仅当梯度 f(Z)Y上的投影等于0.

注2     引理3.2与引理3.3是一致的. 事实上, 设f(X1,X2,,Xl)=ti=1lj=1AijXjBijFi2,那么f是可微的. 构造辅助函数g(s)=f(X1+sE1,X2+sE2,,Xl+sEl), 其中E1,E2,,El是具有适当大小的任意矩阵. 于是可得

g(0)=lj=1Xjf(X1,X2,,Xl),Ej. (3.4)
Ri=Filj=1AijXjBij,那么,又可以得到
g(0)=2lj=1ti=1ATijRiBTij,Ej. (3.5)
由(3.4)式和(3.5)式知
Xjf(X1,X2,,Xl)=2ti=1ATijRiBTij,j=1,2,,l. (3.6)
根据(3.6)式,Ψ(ti=1ATijRiBTij)=0 (j=1,2,,l)当且仅当 Xjf(X1,X2,,Xl)的投影等于0 (j=1,2,,l), 这表明引理3.2与引理3.3是一致的.
3.2 用迭代法解问题A

算法 3.1     任给初始矩阵组[X0,1,X0,2,,X0,l]BRn1×n1×BRn2×n2××BRnl×nl.

1)~ R0,i=Filj=1AijX0,jBij,i=1,2,,t; P0,j=Ψ(ti=1ATijR0,iBTij), j=1,2,,l; Q0,j=P0,j, j=1,2,,l; k:=0;

2)~ 如果ti=1Rk,i2=0lj=1Pk,j2=0,那么停止,否则,计算

3)~ αk=lj=1Pk,j2ti=1lj=1AijQk,jBij2; Xk+1,j=Xk,j+αkQk,j, j=1,2,,l; Rk+1,i=Rk,iαklj=1AijQk,jBij, i=1,2,,t; Pk+1,j=Ψ(ti=1ATijRk+1,iBTij)=Pk,jαkΨ(ti=1ATij(lv=1AivQk,vBiv)BTij), j=1,2,,l; βk=lj=1Pk+1,j2lj=1Pk,j2;  Qk+1,j=Pk+1,j+βkQk,j, j=1,2,,l;

4)~ k:=k+1,转 2).

注3     1)~ 在算法3.1中,由Pk+1,j=Ψ(ti=1ATijRk+1,iBTij)知,对所有的k,Pk+1,jBRnj×nj. 因为 Q0,j=P0,j,所以 对所有的k, Qk+1,jBRnj×nj,故 Xk+1,jBRnj×nj.

2)~ 如果ti=1Rk,i2=0,那么相应的 [Xk,1,Xk,2,,Xk,l]就是矩阵方程组 lj=1AijXjBij=Fi (i=1,2,,t) 在线性子空间BRn1×n1×BRn2×n2××BRnl×nl上的解. 如果ti=1Rk,i20,而lj=1Pk,j2=0,那么相应的 [Xk,1,Xk,2,,Xk,l]就是问题A的解.

引理3.4     假定序列{Pi,v}{Qi,v} (v=1,2,,l)由算法3.1生成. 如果存在一个正整数k, 使得对i=0,1,2,,k, lv=1Pi,v20,αi0以 及αi,那么

(1)~ lv=1Pi,v,Pj,v=0, i,j=0,1,2,,k,ij,

(2)~ tw=1lu=1AwuQi,uBwu,lu=1AwuQj,uBwu=0, i,j=0,1,2,,k,ij,

(3)~ lv=1Qi,v,Pj,v=0, i,j=0,1,2,,k,ij.

     (用数学归纳法) 第一步证明,当k=1时, (1)-(3)成立. lv=1P0,v,P1,v=lv=1P0,v,P0,vα0Ψ(tu=1ATuv(lw=1AuwQ0,wBuw)BTuv)=lv=1(P0,v2α0tu=1AuvP0,vBuv,lw=1AuwQ0,wBuw)=lv=1P0,v2α0tu=1lv=1AuvP0,vBuv,lw=1AuwQ0,wBuw=lv=1P0,v2α0tu=1lv=1AuvQ0,vBuv,lw=1AuwQ0,wBuw=0. tw=1lu=1AwuQ0,uBwu,lu=1AwuQ1,uBwu=tw=1lu=1AwuQ0,uBwu,lu=1Awu(P1,u+β0Q0,u)Bwu=tw=1(β0lu=1AwuQ0,uBwu2+lu=1AwuQ0,uBwu,lu=1AwuP1,uBwu)=β0tw=1lu=1AwuQ0,uBwu2+1α0lu=1Ψ(tw=1ATwu(R0,wR1,w)BTwu),P1,u=β0tw=1lu=1AwuQ0,uBwu21α0lu=1P1,u,P1,u=0. lv=1Q0,v,P1,v=lv=1P0,v,P1,v=0. 因此,当k=1时,(1)-(3)成立.

第二步证明,假定当k=s, is1时,(1)-(3)成立,即, lv=1Pi,v,Ps,v=0, tw=1lu=1AwuQi,uBwu,lu=1AwuQs,uBwu=0, lv=1Qi,v,Ps,v=0, 那么需要证明:当k=s+1, is时,(1)-(3)成立. 证明过程如下:

k=s+1, is1时,

lv=1Pi,v,Ps+1,v=lv=1Pi,v,Ps,vαsΨ(tw=1ATwv(lu=1AwuQs,uBwu)BTwv)=αstw=1lv=1AwvPi,vBwv,lu=1AwuQs,uBwu=αstw=1lv=1Awv(Qi,vβi1Qi1,v)Bwv,lu=1AwuQs,uBwu=0. tw=1lu=1AwuQi,uBwu,lu=1AwuQs+1,uBwu=tw=1lu=1AwuQi,uBwu,lu=1Awu(Ps+1,u+βsQs,u)Bwu=1αitw=1Ri,wRi+1,w,lu=1AwuPs+1,uBwu=1αilu=1Ψ(tw=1ATwuRi,wBTwu)Ψ(tw=1ATwuRi+1,wBTwu),Ps+1,u=1αilu=1Pi+1,u,Ps+1,u. (3.7)
lv=1Qi,v,Ps+1,v=lv=1Qi,v,Ps,vαsΨ(tw=1ATwv(lu=1AwuQs,uBwu)BTwv)=αstw=1lv=1AwvQi,vBwv,lu=1AwuQs,uBwu=0.

由算法3.1知,矩阵Qi,v (is,v=1,2,,l)可表示为 Qi,v=Pi,v+βi1Qi1,v=Pi,v+βi1Pi1,v+βi1βi2Pi2,v++βi1β0P0,v, 于是可得

lv=1Ps,v,Qs,v=lv=1Ps,v2. (3.8)
k=s+1, i=s时, lv=1Ps,v,Ps+1,v=lv=1Ps,v,Ps,vαsΨ(tw=1ATwv(lu=1AwuQs,uBwu)BTwv)=lv=1(Ps,v2αsPs,v,Ψ(tw=1ATwv(lu=1AwuQs,uBwu)BTwv))=lv=1Ps,v2αstw=1lv=1AwvPs,vBwv,lu=1AwuQs,uBwu=lv=1Ps,v2αstw=1lv=1AwvQs,vBwv,lu=1AwuQs,uBwu=0. tw=1lu=1AwuQs,uBwu,lu=1AwuQs+1,uBwu=tw=1lu=1AwuQs,uBwu,lu=1Awu(Ps+1,u+βsQs,u)Bwu=tw=1(βslu=1AwuQs,uBwu2+1αsRs,wRs+1,w,lu=1AwuPs+1,uBwu)=βstw=1lu=1AwuQs,uBwu2+1αslu=1Ψ(tw=1ATwu(Rs,wRs+1,w)BTwu),Ps+1,u=βstw=1lu=1AwuQs,uBwu2+1αslu=1Ps,uPs+1,u,Ps+1,u=0. lv=1Qs,v,Ps+1,v=lv=1Qs,v,Ps,vαsΨ(tw=1ATwv(lu=1AwuQs,uBwu)BTwv)=lv=1Ps,v2αslv=1Qs,v,tw=1ATwv(lu=1AwuQs,uBwu)BTwv=lv=1Ps,v2αstw=1lv=1AwvQs,vBwv,lu=1AwuQs,uBwu=lv=1Ps,v2αstw=1lv=1AwvQs,vBwv2=0. 由结论lv=1Ps,v,Ps+1,v=0、 假设tw=1lu=1AwuQi,uBwu,lu=1AwuQs,uBwu=0(is1)以及(3.7)式可知,当is1时, tw=1lu=1AwuQi,uBwu,lu=1AwuQs+1,uBwu=0.

因此,由第一步和第二步知,引理3.4成立.

引理3.4表明,算法3.1生成的矩阵列{diag(Pi,1,Pi,2,,Pi,l)}R(n1++nl)×(n1++nl)上相互正交. 设rj表示子空间 BRnj×nj的维数,那么存在正整数 kr1+r2++rl, 使得lj=1Pk,j2=0,即, 在没有舍入误差的情况下算法3.1至多经过r1+r2++rl迭代停止.

在算法3.1中,如果αi=0,那么 lv=1Pi,v2=0. 如果αi=, 那么 tw=1lv=1AwvQi,v Bwv2=0. 于是 lv=1AwvQi,vBwv=0,w=1,2,,t. 在上式两边用Ri,w做内积可得 lv=1AwvQi,vBwv,Ri,w=0. 从而, tw=1lv=1AwvQi,vBwv,Ri,w=lv=1Qi,v,tw=1ATwvRi,wBTwv=lv=1Qi,v,Ψ(tw=1ATwvRi,wBTwv)=lv=1Qi,v,Pi,v=lv=1Pi,v2=0. 因此,如果存在一个正整数i使得αi=0αi=, 那么相应的[X1,X2,,Xl]就是问题A的解.

由引理3.4和以上讨论,可得以下定理.

定理3.1     任给初始矩阵组[X0,1,X0,2,,X0,l]BRn1×n1×BRn2×n2××BRnl×nl,通过算法3.1, 至多经过r1+r2++rl迭代可得问题A的一个解.

注4     理论上,任给初始矩阵组,通过算法3.1,至多经过r1+r2++rl 迭代可得问题A的一个解. 但实际上,舍入误差是不可避免的,因而问题A的解有时要超过 r1+r2++rl迭代才能得到.

W={[M1,M2,,Ml]|Mj=Ψ(ti=1ATijHiBTij),j=1,2,,l}, 其中HiRpi×mi. 显然,WBRn1×n1×BRn2×n2××BRnl×nl 的一个线性子空间.

引理3.5     假设[˜X1,˜X2,,˜Xl] 是问题A的解. 那么问题A的任意解可表示为 [˜X1+M1,˜X2+M2,,˜Xl+Ml],当且仅当

lj=1AijMjBij=0,i=1,2,,t, (3.9)
其中[M1,M2,,Ml]BRn1×n1×BRn2×n2××BRnl×nl.

     设[M1,M2,,Ml]BRn1×n1×BRn2×n2××BRnl×nl. 如果[˜X1+M1,˜X2+M2,,˜Xl+Ml] 是问题A的一个解,那么由引理3.2的证明可知

ti=1lj=1Aij˜XjBijFi2=ti=1lj=1Aij(˜Xj+Mj)BijFi2=ti=1lj=1AijMjBij˜Ri2=diag(lj=1A1jMjB1j˜R1,lj=1A2jMjB2j˜R2,,lj=1AtjMjBtj˜Rt)2=diag(lj=1A1jMjB1j,lj=1A2jMjB2j,,lj=1AtjMjBtj)(˜R1,˜R2,,˜Rt)2=(lj=1A1jMjB1j,lj=1A2jMjB2j,,lj=1AtjMjBtj)2+(˜R1,˜R2,,˜Rt)2=ti=1lj=1AijMjBij2+ti=1˜Ri2.% (3.10)
于是可得lj=1AijMjBij=0.

反过来,如果[˜X1+M1,˜X2+M2,,˜Xl+Ml]BRn1×n1×BRn2×n2××BRnl×nl,lj=1AijMjBij=0,(i=1,2,,t),那么

ti=1lj=1Aij(˜Xj+Mj)BijFi2=ti=1lj=1Aij˜XjBijFi2, (3.11)
表明[˜X1+M1,˜X2+M2,,˜Xl+Ml]是问题A的一个解.

定理3.2     如果选取初始的矩阵组[X0,1,X0,2,,X0,l]W,那么,通过算法3.1可得问题A的最小范数解.

     由算法3.1和定理3.1知,如果选取初始矩阵组[X0,1,X0,2,,X0,l]W,可得问题A的一个解[˜X1,˜X2,,˜Xl],并且存在˜HiRpi×mi,使得˜Xj=Ψ(ti=1ATij˜HiBTij),j=1,2,,l. 由引理3.5知,问题A的任意解可表示为[˜X1+M1,˜X2+M2,,˜Xl+Ml], 其中 [M1,M2,,Ml]BRn1×n1×BRn2×n2××BRnl×nl,并且满足(3.9)式,而且 lj=1˜Xj,Mj=lj=1Ψ(ti=1ATij˜HiBTij),Mj=ti=1˜Hi,lj=1AijMjBij=0. 因此 lj=1˜Xj+Mj2=lj=1˜Xj+Mj,˜Xj+Mj=lj=1˜Xj2+lj=1Mj2lj=1˜Xj2.[˜X1,˜X2,,˜Xl]是问题A的最小范数解.

注5     问题A的解集是非空的,由引理3.5知,这个解集是一个闭凸锥. 因此,问题A存在唯一解. 如果[˜X1,˜X2,,˜Xl]W 是问题A的解,那么它就是唯一最小范数解.

3.3 算法3.1的最优性质

定理3.3     对任意初始矩阵组[X0,1,X0,2,,X0,l]BRn1×n1×BRn2×n2××BRnl×nl,算法3.1第k步生成的矩阵组 [Xk,1,Xk,2,,Xk,l]满足以下优化问题 ti=1lj=1AijXk,jBijFi2=min[X1,X2,,Xl]Uti=1lj=1AijXjBijFi2, 其中U表示仿射子空间,具有如下形式 U=[X0,1,X0,2,,X0,l]+span{[Q0,1,Q0,2,,Q0,l],,[Qk1,1,Qk1,2,,Qk1,l]}.

     对任意初始矩阵组[X1,X2,,Xl]U,存在实数列{ti}k10,使得 [X1,X2,,Xl]=[X0,1,X0,2,,X0,l]+k1i=0ti[Qi,1,Qi,2,,Qi,l].g(to,t1,,tk1)=tw=1lj=1Awj(X0,j+k1i=0tiQi,j)BwjFw2. 由引理3.4知 g(to,t1,,tk1)=tw=1lj=1AwjX0,jBwjFw+k1i=0tilj=1AwjQi,jBwj2=tw=1R0,w+k1i=0tilj=1AwjQi,jBwj2=tw=1(R0,w2+k1i=0t2ilj=1AwjQi,jBwj22k1i=0tilj=1AwjQi,jBwj,R0,w), 其中R0,w(w=1,2,,t)是初始矩阵组[X0,1,X0,2,,X0,l]对应的残量. 由算法3.1知,R0,w可表示为

R0,w=Ri,w+αi1lj=1AwjQi1,jBwj++α0lj=1AwjQ0,jBwj. (3.12)
由于g(to,t1,,tk1)是连续可微函数, 所以使g(to,t1,,tk1)最小,当且仅当 g(to,t1,,tk1)ti=0. 由引理3.4、(3.8)式以及(3.12)式知 ti=tw=1lj=1AwjQi,jBwj,R0,wtw=1lj=1AwjQi,jBwj2=tw=1lj=1AwjQi,jBwj,Ri,wtw=1lj=1AwjQi,jBwj2=lj=1Qi,j,Ψ(tw=1ATwjRi,wBTwj)tw=1lj=1AwjQi,jBwj2=lj=1Qi,j,Pi,jtw=1lj=1AwjQi,jBwj2=lj=1Pi,j2tw=1lj=1AwjQi,jBwj2=αi. 因为 mintig(to,t1,,tk1)=min[X1,X2,,Xl]Uti=1lj=1AijXjBijFi2, 所以定理3.3成立.

定理3.3表明,如果[Xk1,1,Xk1,2,,Xk1,l]U,[Xk,1,Xk,2,,Xk,l]U,那么 ti=1lj=1AijXk,jBijFiti=1lj=1AijXk1,jBijFi, 表明残量序列{ti=1lj=1AijXk,jBijFi}(k=1,2,)单调递减. 这个单调递减的性质确保 算法3.1快速的收敛.

4 问题II的解

由于问题I的解集是一个非空的闭凸锥,所以问题II存在唯一解. 给定矩阵组[ˆX1,ˆX2, ,ˆXl]D1×D2××Dl,那么 minti=1lj=1AijXjBijCi=minti=1lj=1Aij(XjˆXj)Bij(Cilj=1AijˆXjBij).

Nj=XjˆXj(j=1,2,,l), ˆFi=Cilj=1AijˆXjBij,则 求问题II的唯一解等价于求下述最小二乘问题的最小Frobenius范数解 min[N1,N2,,Nl]ti=1lj=1AijNjBijˆFi.(4.1) 应用算法3.1,设初始矩阵组[N0,1,N0,2,,N0,l]=[0,0,,0],可得问题(4.1)唯一最小Frobenius范数解[N1,N2,,Nl], 从而得到问题II的唯一解[ˆX1,ˆX2,,ˆXl]. 在这种情况下, ˆX1,ˆX2,,ˆXl可表示为ˆX1=N1+ˆX1,ˆX2=N2+ˆX2,,ˆXl=Nl+ˆXl.

5 数值试验

例 5.1     求解矩阵方程组 {A11X1B11+A12X2B12=C1,A21X1B21+A22X2B22=C2,(5.1) 其中 A11=(132514223718294832445354116127104127515233629463758383935672),B11=(14141415151515121212139393937878787353535346464647272727), A12=(341378214132426122354664431341752356133621564352812371125235114),B12=(9494949232323235353532626262939393941341341341151151151137373736161616), A21=(3108294732445354116127104127515234627463758313935674),B21=(314142151515312121836382874747435352646464132626), A22=(313131522232323411353535123131313221313131112353535433),B22=(535361626262848484181818323232121212474747312312312252525), C1=(2621446262144626214462621521246152124615212461521224450122445012244501224211020922110209221102092211077080077080077080077018761106187611061876110618761696520169652016965201696), C2=(11041050259064262868282210348144398195285217049541690113264406156418178430422308246380218450154418476514418550). toeplitz(1:n)表示第1行为(1,2,,n)n阶Toeplitz矩阵. hilb(n)表示n阶Hilbert矩阵. 设中心主子矩阵为 Xq1=toeplitz(1:4),Xq2=hilb(5). 首先计算Fi=CiAi1¯X1Bi1Ai2¯X2Bi2(i=1,2),其中¯Xj (j=1,2)为形如(3.1)式具有适当大小的矩阵. 于是可得以下方程组 {A11X1B11+A12X2B12=F1,A21X1B21+A22X2B22=F2.(5.2). 设初始矩阵为[X0,1,X0,2]=[zeros(8),zeros(9)]. 应用算法3.1, 迭代69步可得方程组(5.2)在子空间BR8×8×BR9×9 上的最小Frobenius范数最小二乘解(˜X1,˜X2) {\scriptsize ˜X1=(3.411620.151213.83368.82172.946413.393526.062910.809420.151222.19816.10239.75457.96944.10948.855926.062913.83366.102300004.109413.39358.82179.754500007.96942.94642.94647.969400009.75458.821713.39354.109400006.102313.833626.06298.85594.10947.96949.75456.102322.198120.151210.809426.062913.39352.94648.821713.833620.15123.4116), ˜X2=(25.10956.901826.654611.818815.91201.60257.57092.595215.47066.901832.46964.22547.141611.28478.863811.241820.17412.595226.65464.22540000011.24187.570911.81887.1416000008.86381.602515.912011.28470000011.284715.91201.60258.8638000007.141611.81887.570911.2418000004.225426.65462.595220.174111.24188.863811.28477.14164.225432.46966.901815.47062.59527.57091.602515.912011.818826.65466.901825.1095),} 残量范数为 F1A11˜X1B11A12˜X2B12+F2A21˜X1B21A22˜X2B22=709.9595. 同样的,应用算法3.1,可以计算序列{(Xk,1,Xk,2)}. 设 δk=(Xk,1,Xk,2)(˜X1,˜X2)(˜X1,˜X2) 表示解的相对误差,rk=2i=1||FiAi1Xk,1Bi1Ai2Xk,2Bi2||表示残量范数. 求得的结果如图 1. 从图 1上可见,随着迭代次数的增加,rk逐渐下降,δk逐渐下降并趋向于0.

图 1 例5.1的数值结果

矩阵方程组(5.1)的最小Frobenius范数最小二乘解为 {\scriptsize X1=(3.411620.151213.83368.82172.946413.393526.062910.809420.151222.19816.10239.75457.96944.10948.855926.062913.83366.102312344.109413.39358.82179.754521237.96942.94642.94647.969432129.75458.821713.39354.109443216.102313.833626.06298.85594.10947.96949.75456.102322.198120.151210.809426.062913.39352.94648.821713.833620.15123.4116), X2=(25.10956.901826.654611.818815.91201.60257.57092.595215.47066.901832.46964.22547.141611.28478.863811.241820.17412.595226.65464.22541.00000.50000.33330.25000.200011.24187.570911.81887.14160.50000.33330.25000.20000.16678.86381.602515.912011.28470.33330.25000.20000.16670.142911.284715.91201.60258.86380.25000.20000.16670.14290.12507.141611.81887.570911.24180.20000.16670.14290.12500.11114.225426.65462.595220.174111.24188.863811.28477.14164.225432.46966.901815.47062.59527.57091.602515.912011.818826.65466.901825.1095).}

例 5.2     矩阵A11,B11,A12,B12,A21,B21,A22,B22,C1C2分别为 A11=(hilb(n/2) ones(n/2)hankel(1:n/2) zeros(n/2)),B11=eye(n), A12=(toeplitz(1:n/2) ones(n/2)zeros(n/2) ones(n/2)),B12=ones(n), A21=(hankel(1:n/2) ones(n/2)toeplitz(1:n/2) zeros(n/2)),B21=eye(n), A22=hankel(1:n),B22=hadamard(n), C1=tridiag([1,5,1],n),C2=toeplitz(1:n)×hankel(1:n), 其中 hankel(1:n)表示第1行为(1,2,,n)n阶Hankel矩阵. C1是由向量[1,5,1]生成的三对角矩阵. Xq1=toeplitz(1:8)Xq2=hilb(8)为给定的中心主子 矩阵. 应用算法3.1,分别求解当n=12,24,48,96时所对应的矩阵方程组(5.1). 首先计算Fi=CiAi1¯X1Bi1Ai2¯X2Bi2(i=1,2), 其中¯Xj (j=1,2)是形如(3.1)式具有适当大小的矩阵. 设[X0,1,X0,2]=[zeros(n),zeros(n)],应用算法(3.1), 得到矩阵方程组 (5.2)在BRn×n×BRn×n上的 最小Frobenius范数最小二乘解. 表 1列出了有关的数值结果, 即列出了当n=12,24,48,96时矩阵A11,A12, A21,A22的秩,以及在停止标准为 2j=1Pk,j210e010的条件下的迭代次数 (IT),停止条件2j=1Pk,j2(TER), 残量范数2i=1FiAi1Xk,1Bi1Ai2Xk,2Bi2(RES)和CPU时间.

表 1 不同矩阵大小的数值结果

尽管A11,A12A21的条件数很大,但是从表 1可以看出,算法3.1的收敛速度是很快的. 为了节省篇幅,我们仅给出当n=12时方程组(5.1)最小范数最小 二乘解. {\tiny X1=(7.181810.01015.33027.12628.63688.87019.22799.47988.40076.194810.20408.582010.010117.433210.29407.52557.90867.60427.45579.278510.450315.686223.855810.20405.330210.29401234567815.68626.19487.12627.52552123456710.45038.40078.63687.9086321234569.27859.47988.87017.6042432123457.45579.22799.22797.4557543212347.60428.87019.47989.2785654321237.90868.63688.400710.4503765432127.52557.12626.194815.68628765432110.29405.330210.204023.855815.686210.45039.27857.45577.60427.90867.525510.294017.433210.01018.582010.20406.19488.40079.47989.22798.87018.63687.12625.330210.01017.1818),} {\tinyX2=(6.61410.91700.58481.56920.73670.71893.29312.49960.47441.66020.09413.54300.91700.34550.91431.44650.42981.02870.74140.25720.68620.40000.17540.09410.58480.91431.00000.50000.33330.25000.20000.16670.14290.12500.40001.66021.56921.44650.50000.33330.25000.20000.16670.14290.12500.11110.68620.47440.73670.42980.33330.25000.20000.16670.14290.12500.11110.10000.25722.49960.71891.02870.25000.20000.16670.14290.12500.11110.10000.09090.74143.29313.29310.74140.20000.16670.14290.12500.11110.10000.09090.08331.02870.71892.49960.25720.16670.14290.12500.11110.10000.09090.08330.07690.42980.73670.47440.68620.14290.12500.11110.10000.09090.08330.07690.07141.44651.56921.66020.40000.12500.11110.10000.09090.08330.07690.07140.06670.91430.58480.09410.17540.40000.68620.25720.74141.02870.42981.44650.91430.34550.91703.54300.09411.66020.47442.49963.29310.71890.73671.56920.58480.91706.6141).}

图 2描述了当n=12,24,48,96时停止条件2j=1Pk,j2的收敛曲线. 从图 2中可以看到, 随着迭代次数的增加,2j=1Pk,j2逐渐趋向于0.

图 2n=12,24,48,96时停止条件的收敛曲线

图 3描述了当n=24时残量范数的收敛曲线. 图 3表明残量范数是平稳下降的.

图 3n=24时残量范数的收敛曲线

下面求解问题II. 不失一般性,令n=24. 设ˆX1是 ones(24)带有中心主子矩阵为toeplitz(1:8)的矩阵, ˆX2是eye(24)带有中心主子矩阵为hilb(8)的矩阵. 为了求与[ˆX1,ˆX2]相关的最佳逼近解 [ˆX1,ˆX2],设Nj=XjˆXj(j=1,2), ^Fi=CiAi1ˆX1Bi1Ai2ˆX2Bi2, 初始矩阵为[N0,1,N0,2]=[zeros(24),zeros(24)], 应用算法3.1,迭代910步,可得方程组Ai1N1Bi1+Ai2N2Bi2=^Fi(i=1,2) 的最小范数解[N1,N2]. 因而与 [ˆX1,ˆX2]相关的最佳逼近解为 ˆX1=N1+ˆX1,ˆX2=N2+ˆX2.

6 结论

本文提出了一种算法,即,算法3.1求解问题I. 首先,把问题I转化为等价的问题A. 然后,构造了算法3.1求解问题A,并且证明了此算法的收敛性. 本文还应用此算法求解问题II. 最后,给出了数值试验说明此算法是有效的.

参考文献
[1] Gersho A. Adaptive equalization of higuly dispersive channels for date transmisson. BSTJ, 1969, 48:55–70
[2] Weaver J. Centrosymmetric (cross-symmetric) matrices, their basic properties, eigenvalues and eigenvectors. Am. Math. Monthly, 1985, 92: 711–717
[3] Datta L, Morgera S. On the reducibility of centrosymmetric matrices applications in engineering problems.Ciruits Systems Signal Process, 1989, 8: 71–96
[4] Yuan S F, Wang Q W. Twe special kinds of least squares solutions for the quaternion matrix equation AXB + CXD = E. Electronic Journal of Linear Algebra, 2012, 23: 257–274
[5] Wang Q W. A system of matrix equations and a linear matrix equation over arbitrary regular rings with identity. Linear Algebra Appl. 2004, 384: 43–54
[6] Wang Q W. A system of four matrix equations over von Neumann regular rings and its applications. Acta Math Sin, 2005, 21: 323–334
[7] Wang Q W, Sun J H, Li S Z. Consistency for bi(skew)symmetric solutions to systems of generalized Sylvester equations over a finite central algebra. Linear Algebra Appl. 2002, 353: 169–182
[8] Wang Q W, Li C K. Ranks and the least-norm of the general solution to a system of quaternion matrix equations. Linear Algebra Appl, 2009, 430: 1626–1640
[9] Wang Q W, Yu J. On the generalized bi (skew-)symmetric solutions of a linear matrix equation and its Procrust problems. Applied Mathematics and Computation, 2013, 219: 9872–9884
[10] Wang Q W, Yu G H. The least-square bisymmetric solution to a quaternion matrix equation with applications. Bulletin of the Iranian Mathematical Society, 2013, 39(2): 239–257
[11] Lin Y, Wang Q W. Iterative solution to a system of matrix equations. Abstract and Applied Analysis,2013, 2013, Article ID 124979
[12] Li N, Wang Q W. Iterative algorithm for solving a class of quaternion matrix equation over the generalized(P, Q)-reflexive matrices. Abstract and Applied Analysis, 2013. 2013, Article ID 831656
[13] Li N, Wang Q W, Jiang J. An efficient algorithm for the reflexive solution of the quaternion matrix equation AXB + CXHD = F . Journal of Applied Mathematics, 2013, 2013, Article ID 217540
[14] Yin F, Guo K, Huang G X, et al. The inverse eigenproblem with a submatrix constraint and the associated approximation problem for (R, S)-symmetric matrices. Journal of Computational and Applied Mathematics, 2014, 268: 23–33
[15] Yin F, Guo K, Huang G X. An iterative algorithm for the generalized reflexive solutions of the general coupled matrix equations. Journal of Inequalities and Applications, 2013, 2013(280): 1–15
[16] Yin F, Huang G X. An iterative algorithm for the generalized reflexive solutions of the generalized coupled Sylvester matrix equations. Journal of Applied Mathematics, 2012, 2012, Article ID 152805
[17] Ding J, Liu Y J, Ding F. Iterative solutions to matrix equations of form AiXBi = Fi. Computers and Mathematics with Applications, 2010, 59 (11): 3500–3507
[18] Xie L, Ding J, Ding F. Gradient based iterative solutions for general linear matrix equations. Computers and Mathematics with Applications, 2009, 58(7): 1441–1448
[19] Ding F. Hierarchical multi-innovation stochastic gradient algorithm for Hammerstein nonlinear system modeling. Applied Mathematical Modelling, 2013, 37(4): 1694–1704
[20] Ding F, Chen T. Gradient based iterative algorithms for solving a class of matrix equations. IEEE Trans Automat Control, 2005, 50: 1216–1221
[21] Ding F, Chen T. Iterative least squares solutions of coupled Sylvester matrix equations. Systems Control Lett, 2005, 54: 95–107
[22] Ding F, Chen T. Hierarchical gradient-based identification of multivariable discrete-time systems. Automatica, 2005, 41: 315–325
[23] Ding F, Chen T. Hierarchical least squares identification methods for multivariable systems. IEEE Trans Automat Control, 2005, 50: 397–402
[24] Ding F, Chen T. On iterative solutions of general coupled matrix equations. SIAM J Control Optim, 2006,44: 2269–2284
[25] Yin Q X. Construction of real antisymmetric and bi-antisymmetric matrices with prescribed spectrum data. Linear Algebra Appl, 2004, 389: 95–106
[26] Liao A P, Lei Y. Least squares solutions of matrix inverse problem for bisymmetric matrices with a submatrix constraint. Numer Linear Algebra Appl, 2007, 14: 425–444
[27] Bai Z J. The inverse eigen problem of centrosymmetric matrices with a submatrix constraint and its approximation. SIAM J Matrix Anal Appl, 2005, 26: 1100–1114
[28] Deift P, Nanda T. On the determination of a tridiagonal matrix from its spectrum and a submatrix. Linear Algebra Appl, 1984, 60: 43–55
[29] Gong L S, Hu X Y, Zhang L. The expansion problem of anti-symmetric matrix under a linear consraint and the optimal approximation. J Comput Appl Math, 2006, 197: 44–52
[30] Zhao L J, Hu X Y, Zhang L. Least squares solutions to AX = B for bi-symmetric matrix under a central principal submatrix constraint and the optimal approximation. Linear Algebra Appl, 2008, 428: 871–880
[31] Wang R S. Functional analysis and optimization theory[D]. Beijing: Beijing Univ of Aeronautics Astronautics, 2003
[32] Kelley C T. Iterative Methods for Linear and Nonlinear Equations. Philadelphia, PA: SIAM, 1995
矩阵约束下矩阵方程组的双对称最小二乘解
彭卓华