设R、Rm×n、SRn×n和ARn×n 分别表示实数、m×n实矩阵、 n×n实对称矩阵和n×n 实反对称矩阵集合. In表示n阶单位矩阵. Sn(Sn=(en,en−1,⋯,e1)) 表示n×n反序单位矩阵(ei表示n×n 单位矩阵的第i列). AT和tr(A) 分别表示矩阵A的转置和迹. 定义矩阵A与B的内积为⟨A,B⟩=tr(BTA),那么,由这种内积生成的范数, 显然就是Frobenius范数,即‖A‖2=⟨A,A⟩.
定义1.1 矩阵A=(aij)∈Rn×n被称为双对称矩阵,如果A=AT=SnASn,即,aij=aji=an+1−j,n+1−i,(i,j=1,2,⋯,n). 用BRn×n表示n阶实双对称矩阵集合.
定义1.2 矩阵A=(aij)∈Rn×n被称为双反对称矩阵,如果AT=A=−SnASn,即,aij=aji=−an+1−j,n+1−i,(i,j=1,2,⋯,n). 用SCRn×n表示n阶实双反对称矩阵集合.
双对称矩阵在信息理论[1]、马尔可夫过程[2]和物理工程问题[3]等很多领域中有广泛应用,并且已被广泛研究.
线性矩阵方程组已经成为数值计算中的热门课题,已有很多的研究成果. 例如,Yuan和Wang[4]利用四元数矩阵的复表示和Moore-Penrose广 义逆给出了矩阵方程AXB+CXD=E 带有最小范数的最小二乘η-Hermitian和η-anti-Hermitian解 的表达式. Wang[5]在正则环上研究了矩阵方程组A1XB1=C1,A2XB2=C2,得到了这个方程组一般解 存在的充分必要条件和表达式. Wang[6]也在冯⋅诺伊曼正则 环上研究了矩阵方程组. Wang等[7]给出了矩阵方程组 AiX−YBi=Ci(i=1,2,⋯,s), AiXBi−CiYDi=Ei(i=1,2,⋯,s)双(反) 对称解的充分必要条件. Wang和Li[8]在四元数代数中求出了矩 阵方程组A1X=C1,A2X2=C2,A3X1B1+A4X2B2=C3的最大最小秩解和最小范数解. Wang和Yu[9]给出了四元数矩阵方程AX=B广义双对称和双 反对称解的条件以及解的表达式,并且求出了最大最小秩解. Wang和Yu[10]也得到了四元数矩阵方程XA=B的最小二乘 解的充分必要条件和解的表达式.
迭代方法经常应用于解矩阵方程组. 例如,Lin和Wang[11]用 迭代法求出了矩阵方程组A1X1B1+A2X2B2=E,C1X1D1+C2X2D2=F 的解. Li和Wang[12, 13] 用迭代法求出了四元数矩阵方程的自反和广义(P,Q)自反解. Yin等[15, 16]用迭代法求出了广义Sylvester矩阵方程组的广义自反解. Ding等[17]用两种方法求解了 矩阵方程组A1XB1=F1和A2XB2=F2. 在[18, 19, 20, 21]中, Ding等利用基于层次识别原理[22, 23]的迭代法研究了矩阵方程组. Ding和Chen[24]利用基于 梯度搜索原理的迭代法求解了矩阵方程组 p∑j=1AijXjBij=Mi,i=1,2,⋯,p.(1.1) 值得注意的是,矩阵方程组(1.1)包含了很多的矩阵方程组.
近年来,人们对双对称矩阵、中心对称矩阵等子矩阵约束问题产生 了浓厚兴趣. 然而,由于这些矩阵的特殊结构,在给定的子矩阵约束 条件下讨论 子矩阵约束问题是不适合的,因为这种特殊结构被破坏. 因此, 为了解决这个问题,引入一个定义.
定义1.3 [25] 给定M∈Rn×n, 如果n−q是一个偶数,那么通过删掉M的前后n−q2行和列, 得到M的一个q阶中心主子矩阵, 用Mc(q)表示,即,Mc(q)=[mij]n−q2≤i,j≤n−n−q2.
如果M∈Rn×n的中心主子矩阵为Mc(q)=X, 其他元素为0,那么M就被这个中心主子矩阵完全确定. 在这种情况下, 用¯Xq表示这种矩阵,即, ¯Xq=M=(0 0 00X0000). 显然,奇数(偶数)阶矩阵仅有奇数(偶数)阶中心主子矩阵.
子矩阵约束问题最初来源于子系统扩充问题,并且已被广泛地研究. 例如, Yin等[14]对一个逆特征值问题给出了顺序主子矩阵约束的(R,S)对称解. Liao和Lei[26] 研究了带有子矩阵约束的双对称解的逆特征值问题. Bai[27]研究了 带有子矩阵约束的中心对称解的逆特征值问题. Deift和Nanda[28]讨论了在子矩阵约束下三对角 矩阵的逆特征值问题. Gong等[29]讨论了矩阵方程AXAT=B中X 带有顺序主子矩阵约束的反对称解. Zhao等[30]研究了矩阵方程AX=B中X带有中心主子矩阵约束的 双对称解.
然而,矩阵方程组(1.1)中X1,X2,⋯,Xp带有相关的中心主子 矩阵约束的双对称解的问题还没有相关的结论,而且,使用上面文献中的方法,不能解决这个问题. 还应该指出,矩阵方程组(1.1)的系数矩阵经常来自实验, 可能不满足方程组的可解条件. 因此,本文研究以下问题.
问题 I 给定Aij∈Rpi×nj,Bij∈Rnj×mi,Ci∈Rpi×mi和 Xqj∈Rqj×qj (i=1,2,⋯,t, j=1,2,⋯,l). 设 Dj={Xj∈Rnj×nj|(Xj)c(qj)=Xqj,Xj−¯Xqj∈BRnj×nj}.(1.2) 求矩阵组[X∗1,X∗2,⋯,X∗l]∈D1×D2×⋯×Dl,使得 t∑i=1‖l∑j=1AijX∗jBij−Ci‖=min[X1,X2,⋯,Xl]∈D1×D2×⋯×Dlt∑i=1‖l∑j=1AijXjBij−Ci‖.
问题 II 设SE表示问题I的解集. 给定矩阵组[ˆX1,ˆX2,⋯,ˆXl]∈D1×D2×⋯×Dl,求[ˆX∗1,ˆX∗2,⋯,ˆX∗l]∈SE,使得 l∑j=1‖ˆX∗j−ˆXj‖2=min[X1,X2⋯,Xl]∈SEl∑j=1‖Xj−ˆXj‖2.
引理2.1 如果矩阵X∈SRn×n,那么 X+SnXSn∈BRn×n,X−SnXSn∈SCRn×n.
证 由定义(1.1)和定义(1.2)容易得到这个证明.
定义2.1 定义以下两个集合 BRn×n∗={X|X∈BRn×n, Xc(q)=0}, BRn×n⋄={X|X=(0000 Xq 0000),X∈BRn×n, Xq=Xc(q)∈BRq×q}. 显然,BRn×n∗和BRn×n⋄都是Rn×n的线性子空间.
引理2.2 (1)~ Rn×n=SRn×n⊕ARn×n; (2)~ SRn×n=BRn×n⊕SCRn×n; (3)~ BRn×n=BRn×n∗⊕BRn×n⋄, \\ 其中 ⊕表示直和.
证 (1)式是显然的. 下证(2)式. 证明需要以下3步.
第1步 ∀X∈SRn×n,令 Xa=X+SnXSn2,Xb=X−SnXSn2,(2.1) 那么 Xa∈BRn×n, Xb∈SCRn×n,以及 X=Xa+Xb.(2.2)
第2步 如果存在X′a∈BRn×n, X′b∈SCRn×n满足 X=X′a+X′b,(2.3) (2.3)式减去(2.2)式得 X′a−Xa=Xb−X′b.(2.4) (2.4)式两边乘以Sn得 SnX′aSn−SnXaSn=SnXbSn−SnX′bSn, 即 X′a−Xa=−Xb+X′b.(2.5) 由(2.4)式和(2.5)式知,X′a=Xa, X′b=Xb.
第3步 ∀Xa∈BRn×n, Xb∈SCRn×n, ⟨Xa,Xb⟩=tr(XTbXa)=tr(−SnXTbSnSnXaSn)=−tr(XTbXa)=−⟨Xa,Xb⟩. 故 ⟨Xa,Xb⟩=0.
因此,由以上3步可知,(2)式成立.
(3)式的证明与(2)式的证明类似.
推论2.1 ∀Z∈Rn×n,则存在唯一的Z1∈BRn×n∗,Z2∈BRn×n⋄,Z3∈SCRn×n和Z4∈ARn×n,使得 Z=Z1+Z2+Z3+Z4,其中⟨Zi,Zj⟩=0,i≠j,i,j=1,2,3,4.
定义2.2 定义Ψ是从Rn×n到BRn×n∗的线性投影算子. Ψ:Rn×n→BRn×n∗ ⇒ Z→Z1,即,Ψ(Z)=Z1.
∀Z∈Rn×n, W∈BRn×n∗,则 ⟨Z,W⟩=⟨Z1+Z2+Z3+Z4,W⟩=⟨Z1,W⟩=⟨Ψ(Z),W⟩.(2.6)
引理2.3 [31] 设M表示有限维内积空间,N是M的一个子空间,N⊥ 表示N的正交补空间. ∀x∈M,总存在y0∈N,使得‖x−y0‖≤‖x−y‖(∀y∈N),其中‖.‖ 是定义在M上,与内积空间相关的范数. 而且,y0为N中唯一最小向量的充分必要条件是(x−y0)⊥N, 即(x−y0)∈N⊥.
问题 A 设Aij,Bij,Ci,Xqj (i=1,2,⋯,t,j=1,2,⋯,l)与问题I中的一致. 求[˜X1,˜X2,⋯,˜Xl]∈BRn1×n1∗×BRn2×n2∗×⋯×BRnl×nl∗,使得 t∑i=1‖l∑j=1Aij˜XjBij−Fi‖=min[X1,X2,⋯,Xl]∈BRn1×n1∗×BRn2×n2∗×⋯×BRnl×nl∗t∑i=1‖l∑j=1AijXjBij−Fi‖, 其中 Fi=Ci−l∑j=1Aij¯XjBij,
引理3.1 问题I的解可表示为[X∗1,X∗2,⋯,X∗l]=[˜X1+¯X1,˜X2+¯X2,⋯,˜Xl+¯Xl],其中 [˜X1,˜X2,⋯,˜Xl]是问题A的解.
证 由(1.2)式可得Dj=¯Xj+BRnj×nj∗. 这表明Dj是一个线性流形. t∑i=1‖l∑j=1AijX∗jBij−Ci‖⇔t∑i=1‖l∑j=1Aij(¯Xj+˜Xj)Bij−Ci‖⇔t∑i=1‖l∑j=1Aij˜XjBij−(Ci−l∑j=1Aij¯XjBij)‖⇔t∑i=1‖l∑j=1Aij˜XjBij−Fi‖. 故引理3.1成立.
注1 由于Dj是一个线性流形,不能确保得到的解满足给定的子矩阵要求,所以,不能直接构造迭代法解问题I. 因此,把线性流形上的问题I转化为线性子空间上的问题A, 达到求解问题I的目的.
求解问题A,也就是求矩阵方程组
引理3.2 设˜Ri表示方程组(3.2)相应于[˜X1,˜X2, ⋯,˜Xl]的残量,即, ˜Ri=Fi−l∑j=1Aij˜XjBij. 如果Ψ(t∑i=1ATij˜RiBTij)=0 (j=1,2,⋯,l)同时成立, 那么,[˜X1,˜X2,⋯,˜Xl] 就是问题A的解.
证 设L ={L|L=diag(l∑j=1A1jXjB1j,l∑j=1A2jXjB2j,⋯,l∑j=1AtjXjBtj)}, 其中Xj∈BRnj×nj∗ (j=1,2,⋯,l). 显然,L是一个线性子空间. 对于[˜X1,˜X2,⋯,˜Xl],记 ˜F=diag(l∑j=1A1j˜XjB1j,l∑j=1A2j˜XjB2j,⋯,l∑j=1Atj˜XjBtj), 则 ˜F∈L. 设F=diag(F1,F2,⋯,Ft). 由引理2.3知, [˜X1,˜X2,⋯,˜Xl] 是问题A的解,当且仅当(F−˜F)⊥L,即, ∀[X1,X2,⋯,Xl]∈BRn1×n1∗×BRn2×n2∗×⋯×BRnl×nl∗,
引理3.3 [32] 设f(Z)是子空间Y上连续、可微的凸函数. 那么存在Z∗∈Y,使得f(Z∗)=minZ∈Yf(Z),当且仅当梯度 ∇f(Z)在Y上的投影等于0.
注2 引理3.2与引理3.3是一致的. 事实上, 设f(X1,X2,⋯,Xl)=t∑i=1‖l∑j=1AijXjBij−Fi‖2,那么f是可微的. 构造辅助函数g(s)=f(X1+sE1,X2+sE2,⋯,Xl+sEl), 其中E1,E2,⋯,El是具有适当大小的任意矩阵. 于是可得
算法 3.1 任给初始矩阵组[X0,1,X0,2,⋯,X0,l]∈BRn1×n1∗×BRn2×n2∗×⋯×BRnl×nl∗.
1)~ R0,i=Fi−l∑j=1AijX0,jBij,i=1,2,⋯,t; P0,j=Ψ(t∑i=1ATijR0,iBTij), j=1,2,⋯,l; Q0,j=P0,j, j=1,2,⋯,l; k:=0;
2)~ 如果t∑i=1‖Rk,i‖2=0 或 l∑j=1‖Pk,j‖2=0,那么停止,否则,计算
3)~ αk=l∑j=1‖Pk,j‖2t∑i=1‖l∑j=1AijQk,jBij‖2; Xk+1,j=Xk,j+αkQk,j, j=1,2,⋯,l; Rk+1,i=Rk,i−αkl∑j=1AijQk,jBij, i=1,2,⋯,t; Pk+1,j=Ψ(t∑i=1ATijRk+1,iBTij)=Pk,j−αkΨ(t∑i=1ATij(l∑v=1AivQk,vBiv)BTij), j=1,2,⋯,l; βk=l∑j=1‖Pk+1,j‖2l∑j=1‖Pk,j‖2; Qk+1,j=Pk+1,j+βkQk,j, j=1,2,⋯,l;
4)~ k:=k+1,转 2).
注3 1)~ 在算法3.1中,由Pk+1,j=Ψ(t∑i=1ATijRk+1,iBTij)知,对所有的k,Pk+1,j∈BRnj×nj∗. 因为 Q0,j=P0,j,所以 对所有的k, Qk+1,j∈BRnj×nj∗,故 Xk+1,j∈BRnj×nj∗.
2)~ 如果t∑i=1‖Rk,i‖2=0,那么相应的 [Xk,1,Xk,2,⋯,Xk,l]就是矩阵方程组 l∑j=1AijXjBij=Fi (i=1,2,⋯,t) 在线性子空间BRn1×n1∗×BRn2×n2∗×⋯×BRnl×nl∗上的解. 如果t∑i=1‖Rk,i‖2≠0,而l∑j=1‖Pk,j‖2=0,那么相应的 [Xk,1,Xk,2,⋯,Xk,l]就是问题A的解.
引理3.4 假定序列{Pi,v}和{Qi,v} (v=1,2,⋯,l)由算法3.1生成. 如果存在一个正整数k, 使得对i=0,1,2,⋯,k, l∑v=1‖Pi,v‖2≠0,αi≠0以 及αi≠∞,那么
(1)~ l∑v=1⟨Pi,v,Pj,v⟩=0, i,j=0,1,2,⋯,k,i≠j,
(2)~ t∑w=1⟨l∑u=1AwuQi,uBwu,l∑u=1AwuQj,uBwu⟩=0, i,j=0,1,2,⋯,k,i≠j,
(3)~ l∑v=1⟨Qi,v,Pj,v⟩=0, i,j=0,1,2,⋯,k,i≠j.
证 (用数学归纳法) 第一步证明,当k=1时, (1)-(3)成立. l∑v=1⟨P0,v,P1,v⟩=l∑v=1⟨P0,v,P0,v−α0Ψ(t∑u=1ATuv(l∑w=1AuwQ0,wBuw)BTuv)⟩=l∑v=1(‖P0,v‖2−α0t∑u=1⟨AuvP0,vBuv,l∑w=1AuwQ0,wBuw⟩)=l∑v=1‖P0,v‖2−α0t∑u=1⟨l∑v=1AuvP0,vBuv,l∑w=1AuwQ0,wBuw⟩=l∑v=1‖P0,v‖2−α0t∑u=1⟨l∑v=1AuvQ0,vBuv,l∑w=1AuwQ0,wBuw⟩=0. t∑w=1⟨l∑u=1AwuQ0,uBwu,l∑u=1AwuQ1,uBwu⟩=t∑w=1⟨l∑u=1AwuQ0,uBwu,l∑u=1Awu(P1,u+β0Q0,u)Bwu⟩=t∑w=1(β0‖l∑u=1AwuQ0,uBwu‖2+⟨l∑u=1AwuQ0,uBwu,l∑u=1AwuP1,uBwu⟩)=β0t∑w=1‖l∑u=1AwuQ0,uBwu‖2+1α0l∑u=1⟨Ψ(t∑w=1ATwu(R0,w−R1,w)BTwu),P1,u⟩=β0t∑w=1‖l∑u=1AwuQ0,uBwu‖2−1α0l∑u=1⟨P1,u,P1,u⟩=0. l∑v=1⟨Q0,v,P1,v⟩=l∑v=1⟨P0,v,P1,v⟩=0. 因此,当k=1时,(1)-(3)成立.
第二步证明,假定当k=s, i≤s−1时,(1)-(3)成立,即, l∑v=1⟨Pi,v,Ps,v⟩=0, t∑w=1⟨l∑u=1AwuQi,uBwu,l∑u=1AwuQs,uBwu⟩=0, l∑v=1⟨Qi,v,Ps,v⟩=0, 那么需要证明:当k=s+1, i≤s时,(1)-(3)成立. 证明过程如下:
当k=s+1, i≤s−1时,
由算法3.1知,矩阵Qi,v (i≤s,v=1,2,⋯,l)可表示为 Qi,v=Pi,v+βi−1Qi−1,v=Pi,v+βi−1Pi−1,v+βi−1βi−2Pi−2,v+⋯+βi−1⋯β0P0,v, 于是可得
因此,由第一步和第二步知,引理3.4成立.
引理3.4表明,算法3.1生成的矩阵列{diag(Pi,1,Pi,2,⋯,Pi,l)}在R(n1+⋯+nl)×(n1+⋯+nl)上相互正交. 设rj表示子空间 BRnj×nj∗的维数,那么存在正整数 k≤r1+r2+⋯+rl, 使得l∑j=1‖Pk,j‖2=0,即, 在没有舍入误差的情况下算法3.1至多经过r1+r2+⋯+rl迭代停止.
在算法3.1中,如果αi=0,那么 l∑v=1‖Pi,v‖2=0. 如果αi=∞, 那么 t∑w=1‖l∑v=1AwvQi,v Bwv‖2=0. 于是 l∑v=1AwvQi,vBwv=0,w=1,2,⋯,t. 在上式两边用Ri,w做内积可得 ⟨l∑v=1AwvQi,vBwv,Ri,w⟩=0. 从而, t∑w=1⟨l∑v=1AwvQi,vBwv,Ri,w⟩=l∑v=1⟨Qi,v,t∑w=1ATwvRi,wBTwv⟩=l∑v=1⟨Qi,v,Ψ(t∑w=1ATwvRi,wBTwv)⟩=l∑v=1⟨Qi,v,Pi,v⟩=l∑v=1‖Pi,v‖2=0. 因此,如果存在一个正整数i使得αi=0或αi=∞, 那么相应的[X1,X2,⋯,Xl]就是问题A的解.
由引理3.4和以上讨论,可得以下定理.
定理3.1 任给初始矩阵组[X0,1,X0,2,⋯,X0,l]∈BRn1×n1∗×BRn2×n2∗×⋯×BRnl×nl∗,通过算法3.1, 至多经过r1+r2+⋯+rl迭代可得问题A的一个解.
注4 理论上,任给初始矩阵组,通过算法3.1,至多经过r1+r2+⋯+rl 迭代可得问题A的一个解. 但实际上,舍入误差是不可避免的,因而问题A的解有时要超过 r1+r2+⋯+rl迭代才能得到.
设W={[M1,M2,⋯,Ml]|Mj=Ψ(t∑i=1ATijHiBTij),j=1,2,⋯,l}, 其中Hi∈Rpi×mi. 显然,W是 BRn1×n1∗×BRn2×n2∗×⋯×BRnl×nl∗ 的一个线性子空间.
引理3.5 假设[˜X1,˜X2,⋯,˜Xl] 是问题A的解. 那么问题A的任意解可表示为 [˜X1+M∗1,˜X2+M∗2,⋯,˜Xl+M∗l],当且仅当
证 设[M∗1,M∗2,⋯,M∗l]∈BRn1×n1∗×BRn2×n2∗×⋯×BRnl×nl∗. 如果[˜X1+M∗1,˜X2+M∗2,⋯,˜Xl+M∗l] 是问题A的一个解,那么由引理3.2的证明可知
反过来,如果[˜X1+M∗1,˜X2+M∗2,⋯,˜Xl+M∗l]∈BRn1×n1∗×BRn2×n2∗×⋯×BRnl×nl∗,l∑j=1AijM∗jBij=0,(i=1,2,⋯,t),那么
定理3.2 如果选取初始的矩阵组[X0,1,X0,2,⋯,X0,l]∈W,那么,通过算法3.1可得问题A的最小范数解.
证 由算法3.1和定理3.1知,如果选取初始矩阵组[X0,1,X0,2,⋯,X0,l]∈W,可得问题A的一个解[˜X∗1,˜X∗2,⋯,˜X∗l],并且存在˜Hi∈Rpi×mi,使得˜X∗j=Ψ(t∑i=1ATij˜HiBTij),j=1,2,⋯,l. 由引理3.5知,问题A的任意解可表示为[˜X∗1+M∗1,˜X∗2+M∗2,⋯,˜X∗l+M∗l], 其中 [M∗1,M∗2,⋯,M∗l]∈BRn1×n1∗×BRn2×n2∗×⋯×BRnl×nl∗,并且满足(3.9)式,而且 l∑j=1⟨˜X∗j,M∗j⟩=l∑j=1⟨Ψ(t∑i=1ATij˜HiBTij),M∗j⟩=t∑i=1⟨˜Hi,l∑j=1AijM∗jBij⟩=0. 因此 l∑j=1‖˜X∗j+M∗j‖2=l∑j=1⟨˜X∗j+M∗j,˜X∗j+M∗j⟩=l∑j=1‖˜X∗j‖2+l∑j=1‖M∗j‖2≥l∑j=1‖˜X∗j‖2. 故[˜X∗1,˜X∗2,⋯,˜X∗l]是问题A的最小范数解.
注5 问题A的解集是非空的,由引理3.5知,这个解集是一个闭凸锥. 因此,问题A存在唯一解. 如果[˜X1,˜X2,⋯,˜Xl]∈W 是问题A的解,那么它就是唯一最小范数解.
定理3.3 对任意初始矩阵组[X0,1,X0,2,⋯,X0,l]∈BRn1×n1∗×BRn2×n2∗×⋯×BRnl×nl∗,算法3.1第k步生成的矩阵组 [Xk,1,Xk,2,⋯,Xk,l]满足以下优化问题 t∑i=1‖l∑j=1AijXk,jBij−Fi‖2=min[X1,X2,⋯,Xl]∈Ut∑i=1‖l∑j=1AijXjBij−Fi‖2, 其中U表示仿射子空间,具有如下形式 U=[X0,1,X0,2,⋯,X0,l]+span{[Q0,1,Q0,2,⋯,Q0,l],⋯,[Qk−1,1,Qk−1,2,⋯,Qk−1,l]}.
证 对任意初始矩阵组[X1,X2,⋯,Xl]∈U,存在实数列{ti}k−10,使得 [X1,X2,⋯,Xl]=[X0,1,X0,2,⋯,X0,l]+k−1∑i=0ti[Qi,1,Qi,2,⋯,Qi,l]. 令g(to,t1,⋯,tk−1)=t∑w=1‖l∑j=1Awj(X0,j+k−1∑i=0tiQi,j)Bwj−Fw‖2. 由引理3.4知 g(to,t1,⋯,tk−1)=t∑w=1‖l∑j=1AwjX0,jBwj−Fw+k−1∑i=0til∑j=1AwjQi,jBwj‖2=t∑w=1‖−R0,w+k−1∑i=0til∑j=1AwjQi,jBwj‖2=t∑w=1(‖R0,w‖2+k−1∑i=0t2i‖l∑j=1AwjQi,jBwj‖2−2k−1∑i=0ti⟨l∑j=1AwjQi,jBwj,R0,w⟩), 其中R0,w(w=1,2,⋯,t)是初始矩阵组[X0,1,X0,2,⋯,X0,l]对应的残量. 由算法3.1知,R0,w可表示为
定理3.3表明,如果[Xk−1,1,Xk−1,2,⋯,Xk−1,l]∈U,[Xk,1,Xk,2,⋯,Xk,l]∈U,那么 t∑i=1‖l∑j=1AijXk,jBij−Fi‖≤t∑i=1‖l∑j=1AijXk−1,jBij−Fi‖, 表明残量序列{t∑i=1‖l∑j=1AijXk,jBij−Fi‖}(k=1,2,⋯)单调递减. 这个单调递减的性质确保 算法3.1快速的收敛.
由于问题I的解集是一个非空的闭凸锥,所以问题II存在唯一解. 给定矩阵组[ˆX1,ˆX2, ⋯,ˆXl]∈D1×D2×⋯×Dl,那么 mint∑i=1‖l∑j=1AijXjBij−Ci‖=mint∑i=1‖l∑j=1Aij(Xj−ˆXj)Bij−(Ci−l∑j=1AijˆXjBij)‖.
设Nj=Xj−ˆXj(j=1,2,⋯,l), ˆFi=Ci−l∑j=1AijˆXjBij,则 求问题II的唯一解等价于求下述最小二乘问题的最小Frobenius范数解 min[N1,N2,⋯,Nl]t∑i=1‖l∑j=1AijNjBij−ˆFi‖.(4.1) 应用算法3.1,设初始矩阵组[N0,1,N0,2,⋯,N0,l]=[0,0,⋯,0],可得问题(4.1)唯一最小Frobenius范数解[N∗1,N∗2,⋯,N∗l], 从而得到问题II的唯一解[ˆX∗1,ˆX∗2,⋯,ˆX∗l]. 在这种情况下, ˆX∗1,ˆX∗2,⋯,ˆX∗l可表示为ˆX∗1=N∗1+ˆX1,ˆX∗2=N∗2+ˆX2,⋯,ˆX∗l=N∗l+ˆXl.
例 5.1 求解矩阵方程组 {A11X1B11+A12X2B12=C1,A21X1B21+A22X2B22=C2,(5.1) 其中 A11=(13−25−14223−71−82−94−83−24−45−35−4116127104127−51−52−33−62946375838−39−35−67−2),B11=(−14−14−14−15−15−15−15−1−2−1−2−1−2−139393937−87−87−87−35−35−35−34−64−64−647272727), A12=(3−41−37−82−14−13−24−26−12−23−54−66−44−313−41−75−23−56−13−36−21−5−6−43−52−81−23−71125235114),B12=(−94−94−94−9−23−23−23−235353532−62−62−6293939394−134−134−13411−511−511−511−37−37−37−36161616), A21=(3−10−82−94−73−24−45−35−4116127104127−51−52−34−62746375831−39−35−67−4),B21=(3−14−14−2−15−15−15−3−1−2−1−2−1836382−87−47−474−35−35−2−64−64−64132626), A22=(3−13−13−15−22−23−23−23−41−1−35−35−35−12−3−13−13−13−22−13−13−13−11−12−35−35−35−43−3),B22=(5−35−36−1−62−62−62−84−84−84−1−8−1−8−1−8−32−32−32−1−2−1−2−1−24−74−74−73123123122−52−52−5), C1=(262−1446262−1446262−14462621521246152124615212461521224−4501224−4501224−45012242110−20922110−20922110−20922110−770800−770800−770800−7701876−11061876−11061876−110618761696−5201696−5201696−5201696), C2=(−110−410−502−590−642−62868282−210348−144398−1952852−1704954−16901132−64−406156−418178−430−422308−246380−218450−154418−476514−418550). toeplitz(1:n)表示第1行为(1,2,⋯,n)的n阶Toeplitz矩阵. hilb(n)表示n阶Hilbert矩阵. 设中心主子矩阵为 Xq1=toeplitz(1:4),Xq2=hilb(5). 首先计算Fi=Ci−Ai1¯X1Bi1−Ai2¯X2Bi2(i=1,2),其中¯Xj (j=1,2)为形如(3.1)式具有适当大小的矩阵. 于是可得以下方程组 {A11X1B11+A12X2B12=F1,A21X1B21+A22X2B22=F2.(5.2). 设初始矩阵为[X0,1,X0,2]=[zeros(8),zeros(9)]. 应用算法3.1, 迭代69步可得方程组(5.2)在子空间BR8×8∗×BR9×9∗ 上的最小Frobenius范数最小二乘解(˜X1,˜X2) {\scriptsize ˜X1=(−3.411620.151213.83368.82172.9464−13.3935−26.0629−10.809420.151222.19816.1023−9.7545−7.96944.10948.8559−26.062913.83366.102300004.1094−13.39358.8217−9.75450000−7.96942.94642.9464−7.96940000−9.75458.8217−13.39354.109400006.102313.8336−26.06298.85594.1094−7.9694−9.75456.102322.198120.1512−10.8094−26.0629−13.39352.94648.821713.833620.1512−3.4116), ˜X2=(25.1095−6.9018−26.654611.818815.91201.6025−7.5709−2.5952−15.4706−6.901832.4696−4.22547.1416−11.28478.863811.2418−20.1741−2.5952−26.6546−4.22540000011.2418−7.570911.81887.1416000008.86381.602515.9120−11.284700000−11.284715.91201.60258.8638000007.141611.8188−7.570911.241800000−4.2254−26.6546−2.5952−20.174111.24188.8638−11.28477.1416−4.225432.4696−6.9018−15.4706−2.5952−7.57091.602515.912011.8188−26.6546−6.901825.1095),} 残量范数为 ‖F1−A11˜X1B11−A12˜X2B12‖+‖F2−A21˜X1B21−A22˜X2B22‖=709.9595. 同样的,应用算法3.1,可以计算序列{(Xk,1,Xk,2)}. 设 δk=‖(Xk,1,Xk,2)−(˜X1,˜X2)‖‖(˜X1,˜X2)‖ 表示解的相对误差,rk=2∑i=1||Fi−Ai1Xk,1Bi1−Ai2Xk,2Bi2||表示残量范数. 求得的结果如图 1. 从图 1上可见,随着迭代次数的增加,rk逐渐下降,δk逐渐下降并趋向于0.
矩阵方程组(5.1)的最小Frobenius范数最小二乘解为 {\scriptsize X∗1=(−3.411620.151213.83368.82172.9464−13.3935−26.0629−10.809420.151222.19816.1023−9.7545−7.96944.10948.8559−26.062913.83366.102312344.1094−13.39358.8217−9.75452123−7.96942.94642.9464−7.96943212−9.75458.8217−13.39354.109443216.102313.8336−26.06298.85594.1094−7.9694−9.75456.102322.198120.1512−10.8094−26.0629−13.39352.94648.821713.833620.1512−3.4116), X∗2=(25.1095−6.9018−26.654611.818815.91201.6025−7.5709−2.5952−15.4706−6.901832.4696−4.22547.1416−11.28478.863811.2418−20.1741−2.5952−26.6546−4.22541.00000.50000.33330.25000.200011.2418−7.570911.81887.14160.50000.33330.25000.20000.16678.86381.602515.9120−11.28470.33330.25000.20000.16670.1429−11.284715.91201.60258.86380.25000.20000.16670.14290.12507.141611.8188−7.570911.24180.20000.16670.14290.12500.1111−4.2254−26.6546−2.5952−20.174111.24188.8638−11.28477.1416−4.225432.4696−6.9018−15.4706−2.5952−7.57091.602515.912011.8188−26.6546−6.901825.1095).}
例 5.2 矩阵A11,B11,A12,B12,A21,B21,A22,B22,C1和C2分别为 A11=(hilb(n/2) ones(n/2)hankel(1:n/2) zeros(n/2)),B11=eye(n), A12=(toeplitz(1:n/2) ones(n/2)zeros(n/2) ones(n/2)),B12=ones(n), A21=(hankel(1:n/2) ones(n/2)toeplitz(1:n/2) zeros(n/2)),B21=−eye(n), A22=hankel(1:n),B22=hadamard(n), C1=tridiag([1,5,−1],n),C2=toeplitz(1:n)×hankel(1:n), 其中 hankel(1:n)表示第1行为(1,2,⋯,n)的n阶Hankel矩阵. C1是由向量[1,5,−1]生成的三对角矩阵. Xq1=toeplitz(1:8)和Xq2=hilb(8)为给定的中心主子 矩阵. 应用算法3.1,分别求解当n=12,24,48,96时所对应的矩阵方程组(5.1). 首先计算Fi=Ci−Ai1¯X1Bi1−Ai2¯X2Bi2(i=1,2), 其中¯Xj (j=1,2)是形如(3.1)式具有适当大小的矩阵. 设[X0,1,X0,2]=[zeros(n),zeros(n)],应用算法(3.1), 得到矩阵方程组 (5.2)在BRn×n∗×BRn×n∗上的 最小Frobenius范数最小二乘解. 表 1列出了有关的数值结果, 即列出了当n=12,24,48,96时矩阵A11,A12, A21,A22的秩,以及在停止标准为 2∑j=1‖Pk,j‖2≤10e−010的条件下的迭代次数 (IT),停止条件2∑j=1‖Pk,j‖2(TER), 残量范数2∑i=1‖Fi−Ai1Xk,1Bi1−Ai2Xk,2Bi2‖(RES)和CPU时间.
尽管A11,A12和A21的条件数很大,但是从表 1可以看出,算法3.1的收敛速度是很快的. 为了节省篇幅,我们仅给出当n=12时方程组(5.1)最小范数最小 二乘解. {\tiny X∗1=(7.181810.0101−5.3302−7.1262−8.6368−8.8701−9.2279−9.4798−8.4007−6.194810.20408.582010.010117.4332−10.2940−7.5255−7.9086−7.6042−7.4557−9.2785−10.4503−15.686223.855810.2040−5.3302−10.294012345678−15.6862−6.1948−7.1262−7.525521234567−10.4503−8.4007−8.6368−7.908632123456−9.2785−9.4798−8.8701−7.604243212345−7.4557−9.2279−9.2279−7.455754321234−7.6042−8.8701−9.4798−9.278565432123−7.9086−8.6368−8.4007−10.450376543212−7.5255−7.1262−6.1948−15.686287654321−10.2940−5.330210.204023.8558−15.6862−10.4503−9.2785−7.4557−7.6042−7.9086−7.5255−10.294017.433210.01018.582010.2040−6.1948−8.4007−9.4798−9.2279−8.8701−8.6368−7.1262−5.330210.01017.1818),} {\tinyX∗2=(6.61410.9170−0.58481.56920.7367−0.7189−3.2931−2.4996−0.47441.6602−0.09413.54300.9170−0.34550.91431.44650.4298−1.0287−0.74140.25720.6862−0.40000.1754−0.0941−0.58480.91431.00000.50000.33330.25000.20000.16670.14290.1250−0.40001.66021.56921.44650.50000.33330.25000.20000.16670.14290.12500.11110.6862−0.47440.73670.42980.33330.25000.20000.16670.14290.12500.11110.10000.2572−2.4996−0.7189−1.02870.25000.20000.16670.14290.12500.11110.10000.0909−0.7414−3.2931−3.2931−0.74140.20000.16670.14290.12500.11110.10000.09090.0833−1.0287−0.7189−2.49960.25720.16670.14290.12500.11110.10000.09090.08330.07690.42980.7367−0.47440.68620.14290.12500.11110.10000.09090.08330.07690.07141.44651.56921.6602−0.40000.12500.11110.10000.09090.08330.07690.07140.06670.9143−0.5848−0.09410.1754−0.40000.68620.2572−0.7414−1.02870.42981.44650.9143−0.34550.91703.5430−0.09411.6602−0.4744−2.4996−3.2931−0.71890.73671.5692−0.58480.91706.6141).}
图 2描述了当n=12,24,48,96时停止条件2∑j=1‖Pk,j‖2的收敛曲线. 从图 2中可以看到, 随着迭代次数的增加,2∑j=1‖Pk,j‖2逐渐趋向于0.
图 3描述了当n=24时残量范数的收敛曲线. 图 3表明残量范数是平稳下降的.
下面求解问题II. 不失一般性,令n=24. 设ˆX1是 ones(24)带有中心主子矩阵为toeplitz(1:8)的矩阵, ˆX2是eye(24)带有中心主子矩阵为hilb(8)的矩阵. 为了求与[ˆX1,ˆX2]相关的最佳逼近解 [ˆX∗1,ˆX∗2],设Nj=Xj−ˆXj(j=1,2), ^Fi=Ci−Ai1ˆX1Bi1−Ai2ˆX2Bi2, 初始矩阵为[N0,1,N0,2]=[zeros(24),zeros(24)], 应用算法3.1,迭代910步,可得方程组Ai1N1Bi1+Ai2N2Bi2=^Fi(i=1,2) 的最小范数解[N∗1,N∗2]. 因而与 [ˆX1,ˆX2]相关的最佳逼近解为 ˆX∗1=N∗1+ˆX1,ˆX∗2=N∗2+ˆX2.
本文提出了一种算法,即,算法3.1求解问题I. 首先,把问题I转化为等价的问题A. 然后,构造了算法3.1求解问题A,并且证明了此算法的收敛性. 本文还应用此算法求解问题II. 最后,给出了数值试验说明此算法是有效的.