数学物理学报, 2024, 44(4): 1066-1079

分裂可行性问题的一个惯性共轭梯度投影法

简金宝, 代钰, 尹江华,*

广西民族大学数学与物理学院, 广西应用数学中心 南宁 530006

An Inertial Conjugate Gradient Projection Method for the Split Feasibility Problem

Jian Jinbao, Dai Yu, Yin Jianghua,*

School of Mathematics and Physics, Center for Applied Mathematics of Guangxi, Guangxi Minzu University, Nanning 530006

通讯作者: *尹江华, E-mail: jianghuayin1017@126.com

收稿日期: 2023-10-5   修回日期: 2024-02-1  

基金资助: 广西自然科学基金(2023GXNSFBA026029)
广西科技计划项目(桂科AD23023001)
广西高校中青年教师基础能力提升项目(2023KY0168)
广西民族大学校级引进人才科研启动项目(2022KJQD03)

Received: 2023-10-5   Revised: 2024-02-1  

Fund supported: Natural Science Foundation of Guangxi(2023GXNSFBA026029)
Guangxi Science and Technology Program (AD23023001)
Middle-aged and Young Teachers' Basic Ability Promotion Project of Guangxi(2023KY0168)
Research Project of Guangxi Minzu University(2022KJQD03)

摘要

基于分裂可行性问题的凸约束非线性单调方程组等价问题, 提出了一个新的惯性共轭梯度投影法. 该算法不需要计算矩阵 ${A^\top}A$ 的最大特征值和多次的复杂投影. 在较弱的条件下, 证明了算法的全局收敛性, 并分析了算法的收敛率. 数值试验结果初步表明算法是有效的和鲁棒的.

关键词: 分裂可行性问题; 惯性技术; 共轭梯度投影法; 全局收敛性; 收敛率

Abstract

Based on a convex constrained nonlinear monotone equations equivalent to the split feasibility problem, in this paper, a novel inertial conjugate gradient projection method is proposed. The presented method does not calculate the maximum eigenvalue of the matrix ${A^\top}A$ and the complex projections of multiple times. Under mild conditions, the global convergence of the proposed method is proved, and its rate of convergence is analyzed. Numerical experiments show that the proposed method is efficient and robust.

Keywords: Split feasibility problem; Inertial technique; Conjugate gradient projection algorithm; Global convergence; Convergence rate

PDF (590KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

简金宝, 代钰, 尹江华. 分裂可行性问题的一个惯性共轭梯度投影法[J]. 数学物理学报, 2024, 44(4): 1066-1079

Jian Jinbao, Dai Yu, Yin Jianghua. An Inertial Conjugate Gradient Projection Method for the Split Feasibility Problem[J]. Acta Mathematica Scientia, 2024, 44(4): 1066-1079

1 引言

分裂可行性问题 (Split Feasibility Problem, SFP), 最早于 1994 年由 Censor 和 Elfving[1]提出并命名, 其数学模型是

$\begin{align*} \mbox{求}\ x\in C,\ \mbox{使得} Ax\in Q, \end{align*}$

其中非零矩阵 $ A\in \mathbb R^{m\times n},\ C\subset \mathbb R^n $$ Q\subset \mathbb R^m $ 是非空闭凸集. 此类问题在医学放射性治疗、信号处理、图像重建、电力系统等领域中有广泛应[2-4]. 本文始终假设问题 (1.1) 的解集 $\Gamma$ 非空.

由文献 [3,命题 3.1] 知, 在解集 $\Gamma$ 非空的前提下, SFP 可等价转化成如下约束优化问题

$\begin{equation} \min\limits_{x\in C}f(x)=\frac{1}{2}\|(I-P_Q)Ax\|^2=\frac{1}{2}\|Ax-P_Q(Ax)\|^2, \end{equation}$

其中, $P_{Q}$$Q$ 上的正交投影 (即 $P_{Q}(y)=\arg\min\{\frac{1}{2}\|z-y\|^2\ |\ z\in Q\},\ \forall\ y\in \mathbb R^m$), $I$ 是单位矩阵, $\|\cdot\|$$l_2$ 范数. 根据文献 [5], 此目标函数 $f$ 的梯度为

$\begin{equation*} {\nabla f(x)} = {A^\top}(I-P_Q)Ax. \end{equation*}$

Byrne[6]最早提出投影型数值解法 (CQ 算法), 其迭代方案是

$\begin{equation*} x_{k+1}=P_C(x_k-{\gamma\nabla f(x_k))}=P_C(x_k-{\gamma {A^\top}(I-P_Q)Ax_k)}, \end{equation*}$

其中, $P_{C}$$C$ 上的正交投影, $\gamma>0$ 为步长. 在 CQ 算法框架下, 步长 $\gamma$ 有三种选取方法: 一是固定步长 $\gamma \in(0,\frac{2}{\|A\|^2})$, 步长 $\gamma$ 的选取依赖于 $\|A\|^2$ (${\|A\|^2}$ 表示矩阵 ${A^{{\top}}}A$ 的最大特征值), 其不容易计算, 其数值过大会影响算法的收敛. 二是动态步长, Yang[7]提出如下动态步长策略

$\begin{equation*} \gamma_k =\frac{{\rho_k}}{\|\nabla f(x_k)\|}, \end{equation*}$

其中, ${\rho_k}>0$, $\sum\limits_{k=1}^{\infty}{\rho_k}={\infty}$, $\sum\limits_{k=1}^{\infty}{{\rho_k}^2}<{\infty}$. 此算法的全局收敛性要求 $Q$ 是有界集、$A$ 是列满秩矩阵. 为了减弱上述收敛性条件, Lopéz 等[2]提出了新的动态步长策略

$\begin{equation*} \gamma_k=\frac{{\rho_k}{f(x_k)}}{\|\nabla f(x_k)\|^2}. \end{equation*}$

三是基于 Armijo 线搜索产生自适应的步长 $\gamma_k$[8]

$\begin{equation*} \gamma_k{\|\nabla f(x_k)-\nabla f(y_k)\|}\leq\mu{\|x_k-y_k\|}, \end{equation*}$

其中, $\mu\in{(0,1)}$, $y_{k}=P_C(x_k-{\gamma_k\nabla f(x_k)})$. 为了得到 $\gamma_k$, 通常需多次计算到 $C$$Q$ 上的投影以及矩阵向量积, 这显然是耗时的.

CQ 算法是求解 SFP 的经典算法. 此外, 文献中也有很多其他方法可求解 SFP. 例如, Wang 和 Xu[9]提出了求解 SFP 的循环算法; Qin 和 Wang[10]提出了 Moudaf 型粘性正则化迭代方法; Dong 等[11]提出了一个线性化分裂算法; 文献 [12] 介绍了几种求解 SFP 的 Dougla-Rachford 分裂算法; 刘等[13]提出外推加速线性交替方向乘子法求解 SFP.

根据文献 [3], 在 $\Gamma\neq \emptyset$ 的前提下, SFP 的解可等价转化为凸约束非线性单调方程组

$\begin{equation} {\nabla f(x)} = {A^\top}(I-P_Q)Ax =0,\ x\in C \end{equation}$

的解. 本文致力于从凸约束非线性单调方程组 (1.3) 的视角寻找求解和设计 SFP 的新型算法. 这一思想在目前的文献中未见报道.

目前, 求解一般的约束非线性单调方程组的方法有很多, 如谱梯度投影法[14,15]、共轭梯度投影法[16,17]、谱共轭梯度投影法[18,19]、三项共轭梯度投影法[20-22]等.

1964 年, Polyak[23]首次提出了惯性外推技术. 大量的数值实验表明, 惯性外推技术可加快收敛速度. 例如, 针对 SFP, Sahu[24]和 Suantai 等[25]在算法中加入惯性外推技术, 有效的提高了算法的性能, 并具有很好的收敛性. 2022 年, Jian 等[26]提出了非线性伪单调方程组的一簇惯性无导数投影法. 最近, 基于凸组合技术, Jiang 等[27]提出了求解无约束优化的一簇混合共轭梯度法. 基于文献 [26] 的惯性加速技术和文献 [27] 的凸组合及混合技术, 本文提出一个新型惯性共轭梯度投影算法 (ICGPM). 此算法不用计算矩阵 ${A^\top}A$ 的最大特征值和复杂的多次投影 $P_C$. 在合适假设下, 所提方法具有全局收敛性和 Q-线性收敛率. 数值实验验证了所提方法的有效性.

本文余下部分结构如下: 第 2 节给出算法的具体步骤; 第 3 节证明其全局收敛性和 $Q$-线性收敛率; 第 4 节进行数值实验, 验证所提方法的有效性; 第 5 节给出结论及展望.

2 惯性共轭梯度投影法

$\nabla f_k:=\nabla f(x_k)$. 下面给出本文的算法.

算法 1 ICGPM.

步骤 0 任取初始点 $x_0\in C$, 选取参数 $\sigma,\varsigma,\varepsilon>0,\ 0\leq \alpha<1,\ 0<\rho<1,\ 0<\gamma<2,\ \mu>1,$$x_{-1}:=x_0,\ k:=0$.

步骤 1$\|\nabla f_k\|\leq \varepsilon$, 则停止; 否则, 计算惯性外推步长

$\begin{equation} \alpha_k=\left\{\begin{array}{ll} \min \bigg\{\alpha,\frac{1}{k^2\|x_k-x_{k-1}\|^2}\bigg\}, & x_k\neq x_{k-1},\\ 0, & \mbox{否则}, \end{array}\right. \end{equation}$

并计算惯性步

$\begin{equation} y_k=x_k+\alpha_k(x_k-x_{k-1}). \end{equation}$

$\|\nabla f(y_k)\|\leq\varepsilon$, 则终止; 否则执行步骤2.

步骤 2 计算搜索方向

$\begin{equation*} d_k=\left\{ \begin{array}{ll} -\nabla f(y_0), & k=0;\\ -\nabla f(y_k)+\beta_kd_{k-1},& k\geq1, \end{array}\right. \end{equation*}$

其中

$\begin{equation} \beta_k=\frac{\|\nabla f(y_k)\|^2-\theta_k{\frac{(\nabla f(y_k)^\top\nabla f(y_{k-1}))^2}{\|\nabla f({y_{k-1}})\|^2}}}{\max \{\mu\| d_{k-1}\|\|\nabla f(y_k)\|,d_{k-1}^\top(\nabla f(y_k)-\nabla f(y_{k-1})),\|\nabla f(y_k)\|^2\}}, \end{equation}$

凸组合参数 $\theta_k\in[0,1]$.$\|d_k\|\leq\varepsilon$, 则终止; 否则执行步骤3.

步骤 3 采用 Armijo 型线搜索求步长, 即 $t_k=\varsigma{\rho}^{i_k}$, 其中 $i_k$ 是满足下式的最小非负整数 $i$

$\begin{equation} -{\nabla f(y_k+\varsigma{\rho}^id_k)}^\top d_k\geq\sigma\varsigma{\rho}^i\|d_k\|^2. \end{equation}$

$z_k=y_k+t_kd_k.$

步骤 4 计算下一个迭代点 $x_{k+1}$

$\begin{equation} x_{k+1}=P_C{[y_k-\gamma\xi_k\nabla f(z_k)]}, \end{equation}$

其中

$\begin{equation} \xi_k=\frac{\nabla f(z_k)^\top(y_k-z_k)} {\|\nabla f(z_k)\|^2}, \end{equation}$

$k:=k+1$, 转步骤1.

注 2.1 (1) 根据算法 1 易知 $\{x_{k}\}\subset C$, 且在每次迭代中, 算法仅需计算一次到 $C$ 上的投影. (2.3) 式可等价表述为“凸组合”

$\begin{equation*} \beta_k=\frac{(1-\theta_k)\|\nabla f(y_k)\|^2+\theta_k(\|\nabla f(y_k)\|^2-{\frac{(\nabla f(y_k)^\top\nabla f(y_{k-1}))^2}{\|\nabla f({y_{k-1}})\|^2}})}{\max \{\mu\| d_{k-1}\|\|\nabla f(y_k)\|,d_{k-1}^\top(\nabla f(y_k)-\nabla f(y_{k-1})),\|\nabla f(y_k)\|^2\}}. \end{equation*}$

(2) 在 (2.5) 式中, 参数 $\gamma$ 被称为松弛因子, 其恰当的取值可加速投影收缩方法的数值收敛.

注 2.2 与文献 [26] 相比, 算法 1 采用了不同的搜索方向以及不同的线搜索. 理论上, 除了全局收敛性以外, 本文进一步分析了算法 1 的局部收敛率. 与文献 [27] 相比, 本文设计的搜索方向不需要重启, 且自动满足充分下降性质.

注 2.3 由 (2.1) 式知 $\alpha_k\in[\alpha],$$\{\alpha_k\}$ 满足

$\begin{equation} \sum\limits_{k=0}^{\infty} \alpha_k\|x_k-x_{k-1}\|^2=\sum\limits_{k=1}^{\infty} \alpha_k\|x_k-x_{k-1}\|^2<\infty. \end{equation}$

注 2.4 Armijo 型线搜索 (2.4) 式取自文献 [14], 其目的是构造分离超平面. 事实上, 由 (2.4) 式知

$\begin{equation*} -{\nabla f(y_k+t_k d_k)}^\top d_k=-{\nabla f(z_k)}^\top d_k\geq\sigma t_k\|d_k\|^2. \end{equation*}$

进而, 由引理 3.2 得

$\begin{equation} {\nabla f(z_k)}^\top (-t_k d_k)={\nabla f(z_k)}^\top(y_k-z_k)\geq\sigma {t_k}^2\|d_k\|^2>0. \end{equation}$

根据 $\nabla f$ 的单调性 (见命题 3.1(ii)) 知

$\begin{equation*} {(\nabla f(z_k)-\nabla f(x^*))}^\top(z_k-x^*)\geq0,\ \forall\ x^*\in\Gamma, \end{equation*}$

$\nabla f(x^*)=0$ (见命题 3.2), 于是有

$\begin{equation} {\nabla f(z_k)}^\top(x^*-z_k)\leq 0,\ \forall\ x^*\in\Gamma. \end{equation}$

由 (2.8) 式和 (2.9) 式知, 超平面

$ \{x\in\mathbb R^{n}\ |\ {\nabla f(z_k)}^\top(x-z_k)=0\} $

严格分离 $y_k$ 与问题 (1.1) 的解集 $\Gamma$.

3 全局收敛性与线性收敛率

本节分析算法 1 的全局收敛性和线性收敛率. 为此, 给出以下命题及引理.

命题 3.1 设函数 $f:\mathbb R^n\rightarrow [0,+\infty)$ 由 (1.2) 式定义, 则

(i) [5]$f$ 是连续可微的凸函数, 且其梯度为

$ {\nabla f(x)} = {A^\top}(I-P_Q)Ax; $

(ii) [5] 映射 $\nabla f$$\mathbb R^n$ 上单调, 即 $\nabla f$ 满足

$\begin{equation} (\nabla f(x)-\nabla f(y))^\top(x-y)\geq0,\ \forall\ x,\ y\in\mathbb{R}^{n}; \end{equation}$

(iii) [4,引理 8.1] 映射 $\nabla f$$\mathbb R^n$ 上是 $L$-Lipschitz 连续的, 且常数 $L=\|A\|^2>0$, 即

$\begin{equation} \|\nabla f(x)-\nabla f(y)\|\leq L\|x-y\|,\ \forall\ x,\ y\in \mathbb{R}^{n}. \end{equation}$

命题 3.2 [3,命题 3.1] 设 SFP 的解集 $\Gamma\neq\emptyset$, 则以下结论等价

(i) $x^*\in\Gamma$;

(ii) $x^*\in C$$f(x^*)=0$;

(iii) $x^*\in C$$\nabla f(x^*)=0$.

命题 3.3 对任意 $a,b,c,d\in \mathbb R^{n}$, 有

$\begin{equation*} 2(a-b)^\top(c-d)=(\|a-d\|^2-\|a-c\|^2)+(\|b-c\|^2-\|b-d\|^2). \end{equation*}$

命题 3.4[28]$\Omega$$\mathbb{R}^{n}$ 中非空闭凸子集, 则对任意 $x\in \mathbb{R}^{n}$$z\in\Omega$, 有

$\begin{equation*} \|P_\Omega(x)-z\|^2\leq\|x-z\|^2-\|P_\Omega(x)-x\|^2. \end{equation*}$

引理 3.1$\{d_k\}$ 是由算法 1 产生的序列, 则对任意 $k\geq1$, 有

$\begin{equation} 0\leq\beta_k\leq\frac{\|\nabla f(y_k)\|}{\mu\|d_{k-1}\|}. \end{equation}$

进而, 对任意 $k\geq0$, 搜索方向 $d_k$ 满足充分下降条件

$\begin{equation} \nabla f(y_k)^\top d_k\leq-(1-\frac{1}{\mu})\|\nabla f(y_k)\|^2 \end{equation}$

及信赖域性质

$\begin{equation} \|d_{k}\|\leq(1+\frac{1}{\mu})\|\nabla f(y_k)\|. \end{equation}$

由 (2.3) 式知

$\begin{equation*}\begin{aligned} \beta_k&=\frac{\|\nabla f(y_k)\|^2-\theta_k{\frac{(\nabla f(y_k)^\top\nabla f(y_{k-1}))^2}{\|\nabla f({y_{k-1}})\|^2}}}{\max \{\mu\| d_{k-1}\|\|\nabla f(y_k)\|,d_{k-1}^\top(\nabla f(y_k)-\nabla f(y_{k-1})),\|\nabla f(y_k)\|^2\}}\\ &=\frac{\|\nabla f(y_k)\|^2-\theta_k{\frac{\|\nabla f(y_k)\|^2\|\nabla f(y_{k-1})\|^2{\rm cos}^2\omega_k}{\|\nabla f({y_{k-1}})\|^2}}}{\max \{\mu\| d_{k-1}\|\|\nabla f(y_k)\|,d_{k-1}^\top(\nabla f(y_k)-\nabla f(y_{k-1})),\|\nabla f(y_k)\|^2\}}\\ &=\frac{(1-\theta_k{\rm cos}^2\omega_k)\|\nabla f(y_k)\|^2}{\max \{\mu\| d_{k-1}\|\|\nabla f(y_k)\|,d_{k-1}^\top(\nabla f(y_k)-\nabla f(y_{k-1})),\|\nabla f(y_k)\|^2\}}, \end{aligned}\end{equation*}$

其中, $\omega_k\in[{\pi}]$$\nabla f(y_{k-1})$$\nabla f(y_{k})$ 的夹角. 由此结合 $\theta_k \in [0,1]$$\beta_k \geq0$. 进一步,

$\begin{equation*}\begin{aligned} \beta_k&\leq\frac{\|\nabla f(y_k)\|^2}{\max \{\mu\| d_{k-1}\|\|\nabla f(y_k)\|,d_{k-1}^\top(\nabla f(y_k)-\nabla f(y_{k-1})),\|\nabla f(y_k)\|^2\}}\\ &\leq\frac{\|\nabla f(y_k)\|^2}{\mu\| d_{k-1}\|\|\nabla f(y_k)\|}=\frac{\|\nabla f(y_k)\|}{\mu\| d_{k-1}\|}. \end{aligned}\end{equation*}$

故 (3.3) 式得证.

下面证明 (3.4) 式. 当 $k=0$ 时, $d_0=-\nabla f(y_0)$, 此时, (3.4) 式显然成立.

$k\geq1$ 时, 在 $d_k=-\nabla f(y_k)+\beta_kd_{k-1}$ 两边同时左乘 $\nabla f(y_k)^{\top}$

$\begin{equation*} \begin{aligned} \nabla f(y_k)^\top d_k&=\nabla f(y_k)^\top(-\nabla f(y_k)+\beta_kd_{k-1})\\ &=-\|\nabla f(y_k)\|^2+\beta_k\nabla f(y_k)^\top d_{k-1}\\ &\leq-\|\nabla f(y_k)\|^2+\beta_k\|\nabla f(y_k)\|\|d_{k-1}\|\\ &\leq-\|\nabla f(y_k)\|^2+\frac{\|\nabla f(y_k)\|^2\|d_{k-1}\|}{\mu\|d_{k-1}\|}\\ &=-(1-\frac{1}{\mu})\|\nabla f(y_k)\|^2, \end{aligned} \end{equation*}$

其中, 上面第一个不等式利用了柯西-施瓦茨不等式及 $\beta_k\geq 0$, 第二个不等式利用了 (3.3) 式. 因此, (3.4) 式得证.

接下来, 证明 (3.5) 式. 当 $k=0$ 时, $d_0=-\nabla f(y_0)$, 则 (3.3) 式成立.

$k\geq1$ 时, $d_k=-\nabla f(y_k)+\beta_kd_{k-1}$. 于是, 利用三角不等式及 (3.3) 式得

$\begin{equation*}\begin{aligned} \|d_k\|&\leq\|\nabla f(y_k)\|+\beta_k\|d_{k-1}\|\\ &\leq\|\nabla f(y_k)\|+\frac{\|\nabla f(y_k)\|}{\mu\| d_{k-1}\|}\|d_{k-1}\| =(1+\frac{1}{\mu})\|\nabla f(y_k)\|. \end{aligned} \end{equation*}$

故 (3.5) 式得证. 证毕.

引理 3.2 算法 1 步骤 3 的 Armijo 型线搜索可在有限次计算后完成, 从而算法 1 是适定的.

反证法. 假设存在某个非负整数 $k_0$, 对任意非负整数 $i$, (2.4) 式均不成立, 即

$\begin{equation*} -{\nabla f(y_{k_0}+\varsigma{\rho}^id_{k_0})}^\top d_{k_0}<\sigma\varsigma{\rho}^i\|d_{k_0}\|^2. \end{equation*}$

$i\rightarrow\infty$, 再结合 $\nabla f$ 的连续性, 可知 $\nabla f(y_{k_0})^\top d_{k_0}\geq0$. 这与 (3.4) 式矛盾, 故引理成立.

引理 3.3 设 SFP 的解集 $\Gamma\neq\emptyset$, 则对任意 $x^*\in\Gamma$, 算法 1 产生的迭代序列 $\{x_k\},\ \{y_k\}$$\{z_k\}$ 满足

$\begin{equation}\begin{aligned} \|x_{k+1}-x^*\|^2&\leq\|x_k-x^*\|^2+\alpha_k(\|x_k-x^*\|^2-\|x_{k-1}-x^*\|^2)\\ &\ \ \ \ +2\alpha_k\|x_k-x_{k-1}\|^2-\gamma(2-\gamma)\sigma^2\frac{\|z_k-y_k\|^4}{\|\nabla f(z_k)\|^2},\ \forall\ k\geq 0. \end{aligned}\end{equation}$

$x^*\in\Gamma$ 及命题 3.2 得

$\begin{equation*} \nabla f(x^*)^\top(z_k-x^*)=0. \end{equation*}$

此结合 (3.1) 式知

$\begin{equation} \nabla f(z_k)^\top(z_k-x^*)\geq0. \end{equation}$

根据 $z_k$ 定义及 (2.8) 式得

$\begin{equation} \nabla f(z_k)^\top(y_k-z_k)\geq\sigma {t_k}^2\|d_k\|^2=\sigma\|z_k-y_k\|^2>0. \end{equation}$

于是, 由 (2.5) 式和命题 3.4 知

$\begin{aligned} \left\|x_{k+1}-x^{*}\right\|^{2} \leq & \left\|y_{k}-\gamma \xi_{k} \nabla f\left(z_{k}\right)-x^{*}\right\|^{2}-\left\|x_{k+1}-y_{k}+\gamma \xi_{k} \nabla f\left(z_{k}\right)\right\|^{2} \\ \leq & \left\|y_{k}-x^{*}-\gamma \xi_{k} \nabla f\left(z_{k}\right)\right\|^{2} \\ = & \left\|y_{k}-x^{*}\right\|^{2}-2 \gamma \xi_{k} \nabla f\left(z_{k}\right)^{\top}\left(y_{k}-x^{*}\right)+\gamma^{2} \xi_{k}^{2}\left\|\nabla f\left(z_{k}\right)\right\|^{2} \\ = & \left\|y_{k}-x^{*}\right\|^{2}-2 \gamma \xi_{k} \nabla f\left(z_{k}\right)^{\top}\left(y_{k}-z_{k}\right)-2 \gamma \xi_{k} \nabla f\left(z_{k}\right)^{\top}\left(z_{k}-x^{*}\right) \\ & +\gamma^{2} \xi_{k}^{2}\left\|\nabla f\left(z_{k}\right)\right\|^{2} \\ \leq & \left\|y_{k}-x^{*}\right\|^{2}-2 \gamma \xi_{k} \nabla f\left(z_{k}\right)^{\top}\left(y_{k}-z_{k}\right)+\gamma^{2} \xi_{k}^{2}\left\|\nabla f\left(z_{k}\right)\right\|^{2} \\ \leq & \left\|y_{k}-x^{*}\right\|^{2}-\gamma(2-\gamma) \sigma^{2} \frac{\left\|z_{k}-y_{k}\right\|^{4}}{\left\|\nabla f\left(z_{k}\right)\right\|^{2}}, \end{aligned}$

其中, 上面第三个不等式利用了 (2.6) 式, (3.7) 式及 (3.8) 式, 最后一个不等式由 $\xi_k$ 定义和 (3.8) 式得到. 由 (2.2) 式知

$\begin{aligned} \left\|y_{k}-x^{*}\right\|^{2}= & \left\|x_{k}+\alpha_{k}\left(x_{k}-x_{k-1}\right)-x^{*}\right\|^{2} \\ = & \left\|x_{k}-x^{*}\right\|^{2}+\alpha_{k}^{2}\left\|x_{k}-x_{k-1}\right\|^{2}+2 \alpha_{k}\left(x_{k}-x^{*}\right)^{\top}\left(x_{k}-x_{k-1}\right) \\ = & \left\|x_{k}-x^{*}\right\|^{2}+\alpha_{k}^{2}\left\|x_{k}-x_{k-1}\right\|^{2}+\alpha_{k}\left\|x_{k}-x^{*}\right\|^{2}+\alpha_{k}\left\|x_{k}-x_{k-1}\right\|^{2} \\ & \quad-\alpha_{k}\left\|x_{k-1}-x^{*}\right\|^{2} \\ \leq & \left\|x_{k}-x^{*}\right\|^{2}+\alpha_{k}\left(\left\|x_{k}-x^{*}\right\|^{2}-\left\|x_{k-1}-x^{*}\right\|^{2}\right)+2 \alpha_{k}\left\|x_{k}-x_{k-1}\right\|^{2} \end{aligned}$

其中, 上面第三个等式由命题 3.3 得到, 最后一个不等式利用了 $\alpha_k\in[\alpha]\subset[0,1)$. 结合 (3.9) 式及 (3.10) 式可得 (3.6) 式. 证毕.

引理 3.4([29], [30,引理 7]) 设非负数列 $\{\chi_k\}$, $\{\eta_k\}$, $\{\alpha_k\}$$\{\upsilon_k\}$ 满足 $\chi_{0}=\chi_{-1}$, $\alpha_k\in[\alpha]\subset[0,1)$, 且

$\begin{equation*} \chi_{k+1}-\chi_k+\upsilon_k\leq\alpha_k(\chi_k-\chi_{k-1})+\eta_k,\ \forall\ k\geq 0. \end{equation*}$

$\sum\limits_{k=0}^{\infty}\eta_k<\infty$, 则

(i) $\lim\limits_{k \rightarrow \infty}\chi_{k}$ 存在;

(ii) $\sum\limits_{k=0}^{\infty}\upsilon_k<\infty$.

定理 3.1$\{x_k\},\ \{y_k\}$, $\{z_k\}$$\{\alpha_k\}$ 由算法 1 产生, 且 $x^*\in\Gamma$, 则

(i) $\lim\limits_{k \rightarrow \infty}\|x_k-x^*\|$ 存在;

(ii) $\sum\limits_{k=0}^{\infty}\frac{\|z_k-y_k\|^4}{\|\nabla f(z_k)\|^2}<\infty$.

$\begin{equation*} \chi_k=\|x_k-x^*\|^2,\ \eta_k=2\alpha_k\|x_k-x_{k-1}\|^2,\ v_k=\gamma(2-\gamma)\sigma^2\frac{\|z_k-y_k\|^4}{\|\nabla f(z_k)\|^2}. \end{equation*}$

于是, 根据 (3.6) 式得

$\begin{equation*} \chi_{k+1}-\chi_k+v_k\leq\alpha_k(\chi_k-\chi_{k-1})+\eta_k,\ \forall\ k\geq 0. \end{equation*}$

$\gamma\in (0,2)$, $\sigma>0$, (2.7) 式及引理 3.4 知定理成立.

推论 3.1 若定理 3.1 的条件成立, 则序列 $\{x_k\}$$\{y_k\}$ 均有界, 且

$\begin{equation} \lim\limits_{k\rightarrow\infty} \frac{\|z_k-y_k\|^2}{\|\nabla f(z_k)\|}=0. \end{equation}$

由 (2.7) 式得

$\begin{equation*} \lim\limits_{k\rightarrow\infty} \alpha_k\|x_k-x_{k-1}\|^2=0. \end{equation*}$

此结合 (2.2) 式和 $\alpha_k\in[\alpha]\subset[0,1)$, 推得

$\begin{equation} \|y_k-x_k\|^2=\alpha_k^2\|x_k-x_{k-1}\|^2\leq\alpha_k\|x_k-x_{k-1}\|^2\rightarrow0,\ k\rightarrow\infty. \end{equation}$

另外, 根据定理 3.1(i) 知序列 $\{x_k\}$ 有界. 再结合 (3.12) 式知序列 $\{y_k\}$ 也有界. 最后, 由定理 3.1}(ii) 立得 (3.11) 式成立. 证毕.

下面给出本文的全局收敛性定理

定理 3.2 由算法 1 产生的迭代序列 $\{x_k\}$, $\{y_k\}$$\{z_k\}$ 均收敛到 SFP (1.1) 的解, 且 $\lim\limits_{k\rightarrow \infty}x_{k}=\lim\limits_{k\rightarrow \infty}y_{k}=\lim\limits_{k\rightarrow \infty}z_{k}$.

首先, 证 $\lim\limits_{k\rightarrow\infty}\|z_k-y_k\|=\lim\limits_{k\rightarrow\infty}t_k\|d_k\|=0$. 依据推论 3.1 知 $\{x_k\}$$\{y_k\}$ 有界. 此结合 (3.5) 式及 $\nabla f$ 连续性知 $\{d_k\}$ 有界. 于是, 由 $t_k\in(0,\varsigma]$$z_k$ 定义易知 $\{z_k\}$ 有界. 因此, 由 $\nabla f$ 连续性可知, 存在常数 $M_0>0$, 使得

$\begin{equation} \|y_k\|\leq M_0,\ \|d_k\|\leq M_0,\ \|\nabla f(y_k)\|\leq M_0,\ \|\nabla f(z_k)\|\leq M_0,\ \forall \ k\geq0. \end{equation}$

此结合 (3.11) 式, 有

$\begin{equation*} \frac{\|z_k-y_k\|^2}{M_0}\leq\frac{\|z_k-y_k\|^2}{\|\nabla f(z_k)\|}\rightarrow0,\ k\rightarrow\infty. \end{equation*}$

因此, 由 $z_k$ 定义知

$\begin{equation} \lim\limits_{k\rightarrow\infty}\|z_k-y_k\|=\lim\limits_{k\rightarrow\infty}t_k\|d_k\|=0. \end{equation}$

其次, 证明 $\underset{k\rightarrow\infty}{\lim}\|\nabla f(y_k)\|=0$. 反证法. 假设 $\underset{k\rightarrow\infty}{\limsup}\|\nabla f(y_k)\|\neq0$, 则存在常数 $\varepsilon_{0}>0$ 及无穷子列 $\mathcal{K}$, 使得

$\begin{equation} \|\nabla f(y_k)\|\geq \varepsilon_{0},\ \forall\ k\in \mathcal{K}. \end{equation}$

由 (3.4) 式知

$\begin{equation} \|d_k\|\geq(1-\frac{1}{\mu})\|\nabla f(y_k)\|\geq(1-\frac{1}{\mu})\varepsilon_{0}>0,\ \forall\ k\in \mathcal{K}. \end{equation}$

进而, 由 $\underset{k\rightarrow\infty}{\lim}t_k\|d_k\|=0$$\lim\limits_{k\in \mathcal{K}}t_k=0$. 根据 $\{d_k\}$$\{y_k\}$ 的有界性, 不妨设

$\begin{equation} \lim\limits_{k\in \mathcal{K}}y_{k}=\bar{y},\ \lim\limits_{k\in \mathcal{K}}d_{k}=\bar{d}. \end{equation}$

在 (3.4) 式中令 $k\in \mathcal{K}$, 取极限, 并利用 (3.15) 式, (3.17) 式和 $\nabla f$ 的连续性, 得

$\begin{equation} \nabla f(\bar{y})^\top\bar{d}\leq-(1-\frac{1}{\mu})\|\nabla f(\bar{y})\|^2\leq-(1-\frac{1}{\mu})\varepsilon_{0}^2<0. \end{equation}$

由算法 1步骤 3 的 Armijo 型线搜索准则知, 对充分大的 $k\in \mathcal{K}$, 有

$\begin{equation*} -\nabla f(y_k+\rho^{-1}t_kd_k)^\top d_k<\sigma\rho^{-1}t_k\|d_k\|^2. \end{equation*}$

同理, 对上述不等式取极限, 并利用 $\lim\limits_{k\in \mathcal{K}}t_k=0$, (3.17) 式与 $\nabla f$ 的连续性, 得 $-\nabla f(\bar{y})^\top \bar{d}\leq0$. 此与 (3.18) 式矛盾. 故 $\underset{k\rightarrow\infty}{\limsup}\|\nabla f(y_k)\|=0$, 进而

$\begin{equation} \underset{k\rightarrow\infty}{\lim}\|\nabla f(y_k)\|=0 \end{equation}$

成立.

最后, 验证 $\{x_k\}$, $\{y_k\}$, $\{z_k\}$ 均收敛到 SFP (1.1) 的解. 取有界序列 $\{y_k\}$ 的一个收敛子列 $y_{k_i}\rightarrow\bar{y},\ i\rightarrow\infty$. 于是, 根据 (3.13) 式, (3.19) 式和 $\nabla f$ 的连续性, 有

$\begin{equation} \lim\limits_{i\rightarrow\infty}\|\nabla f(y_{k_i})\|=\|\nabla f(\bar{y})\|=0. \end{equation}$

另一方面, 由(3.12) 式易得 $x_{k_i}\rightarrow\bar{y}\ (i\rightarrow\infty)$. 因此, 由 $\{x_k\}\subset C$$C$ 的闭性知, $\bar{y}\in C$. 此结合 (3.20) 式的第二个关系式及 (1.3) 式知 $\bar{y}\in\Gamma$. 在定理 3.1 中, 令 $x^*:=\bar{y}$, 利用 $\lim\limits_{i\rightarrow\infty}x_{k_i}=\bar{y}$, 得

$\begin{equation*} \lim\limits_{k\rightarrow\infty}\|x_{k}-\bar{y}\|=\lim\limits_{i\rightarrow\infty}\|x_{k_i}-\bar{y}\|=0. \end{equation*}$

此进一步表明整个序列 $\{x_k\}$ 收敛到 $\bar{y}\in\Gamma$. 于是, 由 (3.12) 式和 (3.14) 式推出序列 $\{y_k\}$$\{z_k\}$ 也收敛到 $\bar{y}\in\Gamma$. 证毕.

基于定理 3.2, 在如下假设条件下, 我们进一步讨论算法 1 的线性收敛速度.

假设 3.1 对序列 $\{y_k\}$ 的极限 $\bar{y}\in \Gamma$, $\nabla f $$\bar{y}$ 附近满足局部误差界条件, 即存在两个常数 $l>0,\ \epsilon>0$, 使得对任意 $y\in N(\bar{y},\epsilon)$, 有

$\begin{equation} l\cdot{\rm dist}(y,\Gamma)\leq\|\nabla f(y)\|, \end{equation}$

其中 ${\rm dist}(y,\Gamma)$ 表示点 $y$ 到解集 $\Gamma$ 的距离, 邻域 $N(\bar{y},\epsilon):=\{y\in \mathbb R^n\ |\ \|y-\bar{y}\|<\epsilon\}$.

注 3.1$\nabla f$$l$-强单调的, 即

$ \langle \nabla f(y)-\nabla f(x),y-x\rangle \geq l\|y-x\|^2,\ \forall\ x,y\in \mathbb R^n,$

则假设 3.1 成立. 事实上, 由柯西-施瓦茨不等式知

$\begin{equation*} \|\nabla f(y)-\nabla f(x)\|\|y-x\| \geq \langle \nabla f(y)-\nabla f(x),y-x\rangle \geq l\|y-x\|^2. \end{equation*}$

于是有

$\begin{equation*} \|\nabla f(y)-\nabla f(x)\| \geq l\|y-x\|. \end{equation*}$

$x:=\bar{y}\in \Gamma$, 则

$\begin{equation*} \|\nabla f(y)\|= \|\nabla f(y)-\nabla f(\bar{y})\| \geq l\|y-\bar{y}\|\geq l\cdot{\rm dist}(y,\Gamma). \end{equation*}$

下面引理给出步长序列 $\{t_k\}$ 的一个正的下界.

引理 3.5 对于算法 1 产生的步长序列 $\{t_k\}$, 有

$\begin{equation} t_k\geq \hat{t}:=\min\bigg\{\varsigma,\frac{\rho(1-\frac{1}{\mu})}{(L+\sigma)(1+\frac{1}{\mu})^2} \bigg\},\ \forall \ k\geq0. \end{equation}$

$\overline{t}_k=\rho^{-1}t_k$, 对于 $t_{k}<\varsigma$, 根据 Armijo 型线搜索准则知,

$\begin{equation*} -\nabla f(y_k+\overline{t}_kd_k)^\top d_k<\sigma\overline{t}_k\|d_k\|^2. \end{equation*}$

$\overline{z}_k=y_k+\overline{t}_k d_k$, 结合 (3.2) 式, (3.4) 式和 (3.5) 式, 得

$\begin{equation*}\begin{aligned} (1-\frac{1}{\mu})\|\nabla f(y_k)\|^2\leq-\nabla f(y_k)^\top d_k &=(\nabla f(\overline{z}_k)-\nabla f(y_k))^\top d_k-\nabla f(\overline{z}_k)^{{\top}}d_k\\ &\leq \|\nabla f(\overline{z}_k)-\nabla f(y_k)\|\|d_k\|-\nabla f(\overline{z}_k)^{{\top}}d_k\\ &<L\|\overline{z}_k-y_k\|\|d_k\|+\sigma\overline{t}_k\|d_k\|^2\\ &=(L+\sigma)\overline{t}_k\|d_k\|^2\\ &=(L+\sigma)\rho^{-1}t_k\|d_k\|^2 \\ &\leq (L+\sigma)\rho^{-1}(1+\frac{1}{\mu})^{2}t_k\|\nabla f(y_k)\|^2. \end{aligned}\end{equation*}$

$t_k\geq\frac{\rho(1-\frac{1}{\mu})}{(L+\sigma)(1+\frac{1}{\mu})^2}$. 证毕.

借助于文献 [31] 关于线性收敛率的分析技巧, 下面建立算法 1 的线性收敛率.

定理 3.3 设假设 3.1 成立, 序列 $\{x_k\}$ 由算法 1 产生, 且记 $a=\underset{k\rightarrow\infty}{\lim\sup}\frac{\frac{1}{k}}{{\rm dist}(x_k,\Gamma)}$.

(1) 若 $0<a<\infty$, 则至少存在一个无限指标集 $\mathcal{K}$, 使得 ${\rm dist}(x_k,\Gamma)=O(\frac{1}{k}),\ k\in \mathcal{K}$;

(2) 若 $a=\infty$, 则至少存在一个无限指标集 $\mathcal{K}$, 使得 ${\rm dist}(x_k,\Gamma)=o(\frac{1}{k}),\ k\in \mathcal{K}$;

(3) 若 $a=0$, 则序列 $\{{\rm dist}(x_k,\Gamma)\}$ Q-线性收敛于 0, 即 $\underset{k\rightarrow\infty}{\lim\sup}\frac{{\rm dist}(x_{k+1},\Gamma)}{{\rm dist}(x_k,\Gamma)}<1.$

结论 (1) 和结论 (2) 显然成立, 现证明结论 (3).

$h_k$$\Gamma$ 中最接近 $y_k$ 的点, 即 $\|y_k-h_k\|={\rm dist}(y_k,\Gamma)$, 则由 (3.9) 式知

$\begin{equation} \begin{aligned} {\rm dist}^2(x_{k+1},\Gamma)&\leq \|x_{k+1}-h_k\|^2\\ &\leq\|y_k-h_k\|^2-\gamma(2-\gamma)\sigma^2\frac{\|z_k-y_k\|^4}{\|\nabla f(z_k)\|^2}\\ &={\rm dist}^2(y_k,\Gamma)-\gamma(2-\gamma)\sigma^2\frac{\|z_k-y_k\|^4}{\|\nabla f(z_k)\|^2}. \end{aligned}\end{equation}$

另一方面, 根据 $\nabla f$ 的 Lipschitz 连续性, (3.5) 式, $t_k\in(0,\varsigma]$, 并注意到 $\nabla f(h_k)=0$, 得

$\begin{equation} \begin{aligned} \|\nabla f(z_k)\|&=\|\nabla f(z_k)-\nabla f(h_k)\|\leq L\|z_k-h_k\|\leq L(\|y_k-z_k\|+\|y_k-h_k\|)\\ &=L(t_k\|d_k\|+\|y_k-h_k\|)\leq L(\varsigma\|d_k\|+\|y_k-h_k\|)\\ &\leq L(\varsigma(1+\frac{1}{\mu})\|\nabla f(y_k)-\nabla f(h_k)\|+\|y_k-h_k\|)\\ &\leq L(1+\varsigma L(1+\frac{1}{\mu}))\|y_k-h_k\|\\ &=L(1+\varsigma L(1+\frac{1}{\mu})){\rm dist}(y_k,\Gamma). \end{aligned}\end{equation}$

根据 $z_k$ 定义, (3.16) 式, (3.21) 式及 (3.22) 式知, 当 $k$ 充分大时, 有

$\begin{equation} \|y_k-z_k\|^4={t^4_k}\|d_k\|^4\geq {\hat{t}^{4}}(1-\frac{1}{\mu})^4\|\nabla f(y_k)\|^4\geq {\hat{t}^{4}}(1-\frac{1}{\mu})^4l^4{\rm dist}^4(y_k,\Gamma). \end{equation}$

结合 (3.23) 式, (3.24) 式和 (3.25) 式, 当 $k$ 充分大时, 可得

$\begin{equation*} {\rm dist}^2(x_{k+1},\Gamma)\leq\tau {\rm dist}^2(y_k,\Gamma)=\tau {\rm dist}^2(x_k+\alpha_k(x_k-x_{k-1}),\Gamma), \end{equation*}$

其中

$\begin{equation*} \tau=1-\gamma(2-\gamma)\sigma^2\frac{{\hat{t}^{4}}l^4(1-\frac{1}{\mu})^4}{L^2(1+\varsigma L(1+\frac{1}{\mu}))^2}<1. \end{equation*}$

由 (2.1) 式知 $\alpha_k\|x_k-x_{k-1}\|^2\leq\frac{1}{k^2}$. 此结合 $\alpha_k\in[\alpha]\subset[0,1)$

$ {\alpha^2_k}\|x_k-x_{k-1}\|^2\leq\alpha_k\|x_k-x_{k-1}\|^2\leq\frac{1}{k^2}. $

进而,

$\begin{equation*}\begin{aligned} {\rm dist}(x_{k+1},\Gamma)&\leq\sqrt\tau {\rm dist}(x_k+\alpha_k(x_k-x_{k-1}),\Gamma)\\ &\leq\sqrt\tau \|x_k+\alpha_k(x_k-x_{k-1})-h_{x_k}\|\\ &\leq\sqrt{\tau} (\|x_k-h_{x_k}\|+\alpha_k\|x_k-x_{k-1}\|) \\ &\leq\sqrt\tau {\rm dist}(x_{k},\Gamma)+ \frac{\sqrt\tau}{k}, \end{aligned}\end{equation*}$

其中, $h_{x_k}$$\Gamma$ 中最接近 $x_k$ 的点. 因此

$\begin{equation*} \frac{{\rm dist}(x_{k+1},\Gamma)}{{\rm dist}(x_{k},\Gamma)} \leq\sqrt\tau+ \frac{\frac{\sqrt\tau}{k}}{{\rm dist}(x_k,\Gamma)}. \end{equation*}$

此表明若 $\underset{k\rightarrow\infty}{\lim\sup}\frac{\frac{1}{k}}{{\rm dist}(x_k,\Gamma)}=0$, 则结论 (3) 成立. 证毕.

4 数值实验

本节将通过 5 个例子检验算法 1 (ICGPM) 的数值效果. 所有程序代码利用 MATLAB R2017a 编写, 软件运行环境为 Windows 10 家庭中文版, Intel(R) Core(TM) i5-6200U, CPU 2.40GHz, 4GB RAM. 所有程序的终止准则为

$\begin{equation*} ({\rm i})\ \|\nabla f_k\|\leq 10^{-6}\ {\mbox {或者}} ({\rm ii})\ \|\nabla f(y_k)\|\leq 10^{-6}\ {\mbox {或者}} {\rm (iii)}\ \| d_{k}\|\leq 10^{-7}; \end{equation*}$

本文将所提算法 ICGPM 和 IPCM[25]相比较. 测试问题如下

问题 1$x\in C:=\{x\in\mathbb R^3\ |\ \|x\|\leq2\}$, 使得 $Ax\in Q$, 其中

$\begin{equation*} A=\left[ \begin{array}{crr} 2& 3&1\\ 1&-2&4\\ 3& 8&-2\\ 4&-1&9 \end{array}\right],\ Q=\{b=(4,-5,13,-5)^\top\}. \end{equation*}$

问题 2$x\in C:=\{x\in \mathbb R^3\ |\ x_1+x_2+x_3\leq3\}$, 使得 $Ax\in Q$, 其中

$\begin{equation*} A=\left[ \begin{array}{rrr} 2&-1\ &3\\ 4&2\ &5\\ 2&0\ &2\\ 0&1\ &1 \end{array}\right],\ Q=\{y\in\mathbb R^4\ |\ y_1-2y_2+3y_3+7y_4\leq5\}. \end{equation*}$

问题 3$x\in C:=\{x\in\mathbb R^4\ |\ \|x\|\leq2\}$, 使得 $Ax\in Q$, 其中

$\begin{equation*} A=\left[ \begin{array}{cccc} 2&\ 5&\ 3&\ 6\\ 1&\ 0&\ 4&\ 5\\ 6&\ 9&\ 0&\ 1\\ 2&\ 1&\ 0&\ 3 \end{array}\right],\ Q=\{b=(2,1,0,-3)^\top\}. \end{equation*}$

问题 4$x\in C:=\{x\in\mathbb R^4\ |\ \|x\|\leq2\}$, 使得 $Ax\in Q$, 其中

$\begin{equation*} A=\left[ \begin{array}{lrrl} 2&\ 3& 1&\ 4\\ 1&-2 &4&\ 5\\ 3&\ 8&-2&\ 7\\ 4&-1 &9&\ 0 \end{array}\right],\ Q=\{b=(4,-5,13,-6)^\top\}. \end{equation*}$

问题 5$x\in C:=\{x\in \mathbb R^3\ |\ x_1+x_2+x_3\leq1\}$, 使得 $Ax\in Q$, 其中

$\begin{equation*} A=\left[ \begin{array}{rrr} -9&-6& 3\\ 4& 7& 5\\ 0&-3&-2\\ 0&-7& 1 \end{array}\right],\ Q=\{y\in\mathbb R^4\ |\ y_1-8y_2+5y_3+7y_4\leq8\}. \end{equation*}$

注 4.1 对于上述问题, 算法 1 步骤 4 中投影的计算参考文献 [32,例 29.20] 和文献 [33,命题 2.2.1].

经过反复调试参数, 本文选取两个算法较好的参数取值进行数值比较. 下面给出两个算法的具体参数设置

ICGPM: $\varsigma= 1.15, \sigma = 0.0005, \rho= 0.4, \gamma= 1.69, \theta_k\equiv 0.5, \mu=3, \alpha=0.63.$

IPCM: $\gamma= 1.2, \sigma= 0.015$,$ \mu= 0.4, \rho= 0.2, \alpha=0.8.$

在数值实验中, 每个测试问题所采用的初始点 (IP) 如下

问题 1: ${x}_0^1=(0,0,0)^\top, {x}_0^2=(1,1,1)^\top, {x}_0^3=(0,-2,0)^\top, {x}_0^4=(-1,1,-1)^\top.$

问题 2: ${x}_0^5=(2,-4,3)^\top, {x}_0^6=(1,1,1)^\top, {x}_0^7=(10,8,2)^\top, {x}_0^8=(-1,-2,3)^\top.$

问题 3: ${x}_0^9=(0,0,0,0)^\top, {x}_0^{10}=(6,4,20,6)^\top, {x}_0^{11}=(1,5,6,-2)^\top, {x}_0^{12}=(5,-1,10,8)^\top.$

问题 4: ${x}_0^{13}=(-30,-20,40,-5)^\top, {x}_0^{14}=(0,-3,-10,-5)^\top, {x}_0^{15}=(-10,0,10,2)^\top, {x}_0^{16}=(5,20,28,35)^\top.$

问题 5: ${x}_0^{17}=(-2,-4,3)^\top, {x}_0^{18}=(-10,8,-7)^\top, {x}_0^{19}=(-8,1,0)^\top, {x}_0^{20}=(9,5,-20)^\top.$

表1中, “Itr”表示迭代次数, “NF”表示 $\nabla f$ 的计算次数, $\|\nabla f^\ast\|$ 表示 $\|\nabla f\|$ 在程序终止时的值. 根据表1, 对于所测试的例子, 可得如下结论

(1) 本文所提算法 1 可有效求解 SFP;

(2) 基于问题 1 和问题 4 的数值结果可见, 本文所提算法 ICGPM 明显优于 IPCM;

(3) 从计算时间及解的质量看, 算法 1 迭代次数少、运行时间短, 且能获得更高质量的近似解.

表1   ICGPM 和 IPCM 数值试验结果

新窗口打开| 下载CSV


5 结论和展望

本文基于非线性单调方程组的求解方法, 提出了求解分裂可行性问题的惯性共轭梯度投影法. 在较弱的条件下, 证明了算法的全局收敛性及$Q$-线性收敛率. 数值结果初步验证了算法的有效性和鲁棒性.

注意到, 本文所提算法的主要计算量为投影算子 $P_Q(\cdot)$$P_C(\cdot)$ 的计算. 当 $Q$$C$ 较复杂时, 相应投影算子的计算是耗时的和高成本的. 结合本文所提算法思想与松弛技术[7,34,35], 设计惯性梯度类松弛投影法是一个值得研究的课题.

参考文献

Censor Y, Elfving T.

A multiprojection algorithm using Bregman projections in a product space

Numer Algorithms, 1994, 8: 221-239

[本文引用: 1]

López G, Martín-Márquez V, Wang F H, et al.

Solving the split feasibility problem without prior knowledge of matrix norms

Inverse Probl, 2012, 28(8): 085004

[本文引用: 2]

Qu B, Xiu N H.

A note on the CQ algorithm for the split feasibility problem

Inverse Probl, 2005, 21(5): 1655-1665

[本文引用: 4]

Byrne C.

A unified treatment of some iterative algorithms in signal processing and image reconstruction

Inverse Probl, 2003, 20(1): 103-120

[本文引用: 2]

Aubin J P. Optima and Eauilibria: An Introduction to Nonliner Analysis. Berlin: Springer-Verlag, 1993

[本文引用: 3]

Byrne C.

Iterative oblique projection onto convex sets and the split feasibility problem

Inverse Probl, 2002, 18(2): 441-453

[本文引用: 1]

Yang Q Z.

On variable-step relaxed projection algorithm for variational inequalities

J Math Anal Appl, 2005, 302(1): 166-179

[本文引用: 2]

Zhao J L, Yang Q Z.

Self-adaptive projection methods for the multiple-sets split feasibility problem

Inverse Probl, 2011, 27(3): 035009

[本文引用: 1]

Wang F H, Xu H K.

Cyclic algorithms for split feasibility problems in Hilbert spaces

Nonlinear Anal: Theory Methods Appl, 2011, 74(12): 4105-4111

[本文引用: 1]

Qin X L, Wang L.

A fixed point method for solving a split feasibility problem in Hilbert spaces

Rev R Acad Cienc Exactas Fís Nat Ser A Mat RACSAM, 2019, 113: 315-325

[本文引用: 1]

Dong Q L, He S N, Rassias M T.

General splitting methods with linearization for the split feasibility problem

J Glob Optim, 2021, 79: 813-836

[本文引用: 1]

Dong Q L, Liu L L, Rassias M T. The strong convergence of Douglas-Rachford methods for the split feasibility problem// Parasidis I N, Providas E, Rassias M T. Mathematical Analysis in Interdisciplinary Research. Switzerland: Springer International Publishing, 2022: 213-233

[本文引用: 1]

刘洋, 薛中会, 王永全, .

分裂可行性问题的外推加速线性交替方向乘子法及其全局收敛性

计算机科学, 2023, 50(6): 261-265

DOI:10.11896/jsjkx.230100009      [本文引用: 1]

This paper deals with a linear alternating direction multiplier method (ADMM) for Split feasibility problems (SFP).More specifically,the SFP has been formulated as a separable convex minimization problem with linear constraints,and then extrapolation accelerated linear ADMM has been proposed,which takes advantage of the separable structure,and then rising to sub-problems with closed-form solutions have been given.Furthermore,the global convergence of the proposed method is proved under some suitable conditions.Moreover,the algorithm has been tested by applying to two SFP examples in our theoretical results.

Liu Y, Xue Z H, Wang Y Q, et al.

Extrapolation accelerated linear alternating direction multiplier method for split feasibility problems and its global convergence

Computer Science, 2023, 50(6): 261-265

DOI:10.11896/jsjkx.230100009      [本文引用: 1]

This paper deals with a linear alternating direction multiplier method (ADMM) for Split feasibility problems (SFP).More specifically,the SFP has been formulated as a separable convex minimization problem with linear constraints,and then extrapolation accelerated linear ADMM has been proposed,which takes advantage of the separable structure,and then rising to sub-problems with closed-form solutions have been given.Furthermore,the global convergence of the proposed method is proved under some suitable conditions.Moreover,the algorithm has been tested by applying to two SFP examples in our theoretical results.

Yu Z S, Lin J, Sun J, et al.

Spectral gradient projection method for monotone nonlinear equations with convex constraints

Appl Numer Math, 2009, 59(10): 2416-2423

[本文引用: 2]

尹江华, 简金宝, 江羡珍.

凸约束非光滑方程组基于自适应线搜索的谱梯度投影算法

计算数学, 2020, 42(4): 457-471

DOI:10.12286/jssx.2020.4.457      [本文引用: 1]

Based on three classic line search techniques for finding separating hyperplane, this paper proposes an adaptive line search method. Combining this with the spectral gradient projection method, a spectral gradient projection algorithm for nonsmooth monotone equations with convex constraints is proposed. The proposed method does not calculate and store any matrix, so it is suitable for solving large-scale nonsmooth monotone nonlinear equations. Under mild conditions, the global convergence of the proposed method is proved, and its rate of convergence is analyzed. Numerical experiments show that the proposed algorithm is efficient and robust.

Yin J H, Jian J B, Jiang X Z.

A spectral gradient projection algorithm for convex constrained nonsmooth equations based on an adaptive line search

Math Numer Sin, 2020, 42(4): 457-471

DOI:10.12286/jssx.2020.4.457      [本文引用: 1]

Based on three classic line search techniques for finding separating hyperplane, this paper proposes an adaptive line search method. Combining this with the spectral gradient projection method, a spectral gradient projection algorithm for nonsmooth monotone equations with convex constraints is proposed. The proposed method does not calculate and store any matrix, so it is suitable for solving large-scale nonsmooth monotone nonlinear equations. Under mild conditions, the global convergence of the proposed method is proved, and its rate of convergence is analyzed. Numerical experiments show that the proposed algorithm is efficient and robust.

Sun M, Liu J.

New hybrid conjugate gradient projection method for the convex constrained equations

Calcolo, 2016, 53: 399-411

[本文引用: 1]

Ding Y Y, Xiao Y H, Li J W.

A class of conjugate gradient methods for convex constrained monotone equations

Optimization, 2017, 66(12): 2309-2328

[本文引用: 1]

Sun M, Liu J.

Three derivative-free projection methods for nonlinear equations with convex constraints

J Appl Math Comput, 2015, 47: 265-276

[本文引用: 1]

Liu J K, Li S J.

Multivariate spectral DY-type projection method for convex constrained nonlinear monotone equations

J Ind Manag Optim, 2017, 13(1): 283-295

[本文引用: 1]

Gao P T, He C J, Liu Y.

An adaptive family of projection methods for constrained monotone nonlinear equations with applications

Appl Math Comput, 2019, 359: 1-16

[本文引用: 1]

Ibrahim A H, Kumam P, Kumam W.

A family of derivative-free conjugate gradient methods for constrained nonlinear equations and image restoration

IEEE Access, 2020, 8: 162714-162729

[本文引用: 1]

Yin J H, Jian J B, Jiang X Z, et al.

A hybrid three-term conjugate gradient projection method for constrained nonlinear monotone equations with applications

Numer Algorithms, 2021, 88: 389-418

[本文引用: 1]

Polyak B T.

Some methods of speeding up the convergence of iteration methods

USSR Comput Math Math Phys, 1964, 4(5): 1-17

[本文引用: 1]

Sahu D R, Cho Y J, Dong Q L, et al.

Inertial relaxed CQ algorithms for solving a split feasibility problem in Hilbert spaces

Numer Algorithms, 2021, 87: 1075-1095

[本文引用: 1]

Suantai S, Panyanak B, Kesornprom S, et al.

Inertial projection and contraction methods for split feasibility problem applied to compressed sensing and image restoration

Optim Lett, 2022, 16: 1725-1744

[本文引用: 2]

Jian J B, Yin J H, Tang C M, et al.

A family of inertial derivative-free projection methods for constrained nonlinear pseudo-monotone equations with applications

Comput Appl Math, 2022, 41(7): Article 309

[本文引用: 3]

Jiang X Z, Ye X M, Huang Z F, et al.

A family of hybrid conjugate gradient method with restart procedure for unconstrained optimizations and image restorations

Comput Oper Res, 2023, 159: 106341

[本文引用: 3]

Zarantonello E H. Projections on convex sets in Hilbert space and spectral theory// Zarantonello E H. Contributions to Nonlinear Functional Analysis. New York: Academic Press, 1971: 237-424

[本文引用: 1]

Polyak B T. Introduction to Optimization. New York: Optimization Software Inc, 1987

[本文引用: 1]

Alves M M, Eckstein J, Geremia M, et al.

Relative-error inertial-relaxed inexact versions of Douglas-Rachford and ADMM splitting algorithms

Comput Optim Appl, 2020, 75: 389-422

[本文引用: 1]

Ma G D, Jin J C, Jian J B, et al.

A modified inertial three-term conjugate gradient projection method for constrained nonlinear equations with applications in compressed sensing

Numer Algorithms, 2023, 92(3): 1621-1653

[本文引用: 1]

Bauschke H H, Combettes P L. Correction to:Convex Analysis and Monotone Operator Theory in Hilbert Spaces. Switzerland: Springer International Publishing, 2017

[本文引用: 1]

尹江华. 非线性方程组投影型算法与非精确 Levenberg-Marquardt 型算法研究及其应用. 呼和浩特: 内蒙古大学, 2021

[本文引用: 1]

Yin J H. Research on projection type algorithms and intexact Levenberg-Marquardt type algorithms for nonlinear equations with applitions. Hohhot: Inner Mongolia University, 2021

[本文引用: 1]

Yang Q Z.

The relaxed CQ algorithm solving the split feasibility problem

Inverse Probl, 2004, 20(4): 1261-1266

[本文引用: 1]

Shehu Y, Gibali A.

New inertial relaxed method for solving split feasibilities

Optim Lett, 2020, 15: 2109-2126

[本文引用: 1]

/