数学物理学报, 2023, 43(2): 593-603

一类拟单调变分不等式的惯性投影算法

杨蓝翔,, 陈艺,, 叶明露,*

最优化理论与应用四川省高校重点实验室, 西华师范大学数学与信息学院 四川南充 637009

Inertial Projection Algorithms for Quasimonotone Variational Inequalities

Yang Lanxiang,, Chen Yi,, Ye Minglu,*

Sichuan Colleges and Universities Key Laboratory of Optimization Theory and Applications, School of Mathematics and Information, China West Normal University, Sichuan Nanchong 637009

通讯作者: *叶明露,E-mail:yml2002cn@aliyun.com

收稿日期: 2022-01-23   修回日期: 2022-05-27  

基金资助: 国家自然科学基金面上项目(11871059)
西华师范大学培育项目(20A024)
西华师范大学校级大学生创新创业训练计划项目(cxcy2022027)

Received: 2022-01-23   Revised: 2022-05-27  

Fund supported: NSFC(11871059)
Cultivation project of China West Normal University(20A024)
Innovation and Entrepreneurship training Program for university students of China west normal university(cxcy2022027)

作者简介 About authors

杨蓝翔,E-mail:609497110@qq.com

陈艺,E-mail:cy1935393974@163.com

摘要

2020 年, Liu 和 Yang 在 Hilbert 空间中提出了一种求解拟单调变分不等式的投影算法. 该文介绍了一种新的惯性系数来加速 Liu 和 Yang 文中的算法, 并在相同的假设条件下得到了算法的全局弱收敛性. 数值实验表明适当选取参数后的惯性方法比 Liu 和 Yang 文中的算法有更少的迭代步数和计算机耗时.

关键词: 变分不等式; 投影算法; 拟单调; 惯性方法

Abstract

In 2020, Liu and Yang proposed a projection algorithm (LY for short) for solving quasimonotone variational inequality in Hilbert Space. In this paper, by taking a new inertia coefficient, we present an inertial technique to accelerate LY. Under the same assumptions, the global weak convergence of the sequence generated by this algorithm is obtained. Numerical experiments show that the new algorithm can accelerate LY from the point view of iterate number steps and the point view of CPU time cost by taking suitable parameters.

Keywords: Variational inequality; Projection algorithm; Quasimonotone; Inertial method

PDF (385KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

杨蓝翔, 陈艺, 叶明露. 一类拟单调变分不等式的惯性投影算法[J]. 数学物理学报, 2023, 43(2): 593-603

Yang Lanxiang, Chen Yi, Ye Minglu. Inertial Projection Algorithms for Quasimonotone Variational Inequalities[J]. Acta Mathematica Scientia, 2023, 43(2): 593-603

1 引言

$H$ 是一个 Hilbert 空间, $C$$H$ 中的非空闭凸子集, $F:H\rightarrow H$ 为一个连续映射, 记$\langle\cdot,\cdot\rangle$, $\|\cdot,\cdot\|$ 分别为 $H$ 中的内积和范数, 并记 $P_{C}(x)$ 为点 $x\in H$$C$ 上的投影, 即

$P_{C}(x):={\rm argmin}\{\|y-x\||y\in C\}.$

本文考虑如下的经典变分不等式问题, 记为 VI($F,C$): 寻找一个向量 $x^{*}\in C$ 使得

$\langle F(x^{*}),y-x^{*}\rangle\geq0, \forall y\in C.$

$S$ 为 VI($F,C$) 的解集, $S_{D}$ 为 VI($F,C$) 的对偶变分不等式的解集, 其中

$S:=\{x^{*}\in C:\langle F(x^{*}),y-x^{*}\rangle\geq0,\forall y\in C\};$
$S_{D}:=\{x^{*}\in C:\langle F(y),y-x^{*}\rangle\geq0,\forall y\in C\}. $

由于 $F$$C$ 上为连续映射, 且 $C$$H$ 中的非空闭凸子集, 故 $S_{D}\subset S$.$F$$C$ 上是伪单调映射, 则有 $S\subset S_{D}$. 因此, 若 $F$$C$ 上为连续映射, $C$$H$ 中的非空闭凸子集, 且 $F$$C$ 上是伪单调映射时, 我们有

$S=S_{D},$

参见文献[引理 2.1]. 在 $S=S_{D}$ 的假设条件下考虑变分不等式的投影类型的数值算法有很多, 参见文献[2-11]. 但当 $F$ 退化为拟单调连续映射时, 存在 $S_{D}\subset S$ 的例子, 参见文献[12]中的例 4.2. 因此, 考虑非单调变分不等式的算法成为了一个热点. 例如, 在 2014 年, 为了削弱映射 $F$ 的单调性, Ye 和 He[12] 提出了一种求解非单调变分不等式的双投影算法, 证明了在 $R^{n}$ 中假设 $S_{D}\neq\emptyset$ 时算法生成序列的全局收敛性. 然而, 这个算法的迭代点 $x_{k+1}$ 是一个向量投影到可行集 $C$$k+1$ 个半空间的交所产生, 因此计算 $x_{k+1}$ 的计算机耗时将会随着 $k$ 的增加而增加. 最近, He[13] 阐明了如果 $C\subset R$ ($R$ 为一维的欧氏空间)是一个有界闭集, 那么 $S_{D}\neq\emptyset$ 当且仅当 $F$$C$ 上是拟单调的. 因此, 在2020 年, Liu 和 Yang[14] 基于 Tseng[5] 的梯度投影算法在 Hilbert 空间中提出了一种求解拟单调变分不等式的自适应算法, 在假设条件 $S_{D}\neq\emptyset$; 映射 $F:H\rightarrow H$ 具有 $L$-Lipschitz 连续性且 $L>0$; 映射 $F$$H$ 上为序列弱连续; 映射 $F$$H$ 上拟单调; 且集合 $\{z\in C|F(z)=0\}\backslash S_{D}$ 为有限集的假设下得到了算法的全局弱收敛性. 算法如下

$y_n=P_{C}(x_{n}-\lambda_nF(x_n)), x_{n+1}=y_n+\lambda_n(F(x_n)-F(y_n)),$
$\lambda_{n+1}=\left\{\begin{array}{ll} \min\Big\{\frac{\mu\|x_n-y_n\|}{\|F(x_n)-F(y_n)\|},\lambda_n+p_n\Big\},& \mbox{若} F(x_n)-F(y_n)\neq0,\\ \lambda_n+p_n,& \mbox{其它}. \end{array}\right. $

最近,Ye[15] 给出了一种在 $n$ 维欧氏空间中求解非单调变分不等式的投影算法, 该算法在 $S_D\neq\emptyset$, $F:R^{n}\rightarrow R^{n}$ 连续的条件下得到了算法的全局收敛性, 并且该算法的新迭代点由当前迭代点向一个半空间投影生成.

惯性方法由Polyak[16] 提出, 通过利用前一迭代点的信息来加速凸极小化算法. 现已被用去加速变分不等式算法[17-21]. 其中, Wang[17] 等利用惯性方法来加速算法, 给出了求解 Hilbert 空间中拟单调变分不等式的算法, 且在 $F(z)\neq0, \forall z\in C $ 的假设条件下得到了算法的全局弱收敛性, 其惯性系数 $\alpha_n$ 的取值如下.

选取 $0\leq\alpha_n\leq\bar{\alpha}_n$, 这里的

$\bar{\alpha}_n = \left\{\begin{array}{ll}\min\Big\{\frac{\epsilon_n}{\|x_n-x_{n-1}\|^2},\alpha \Big\},& \mbox{if} x_n\neq x_{n-1},\\\alpha,&\mbox{其它}.\end{array}\right.$

其中 $0<\alpha<1$, $\{\epsilon_n\}$ 为一个正实数序列.

注意到惯性算法的生成点与解集的距离没有 Fejer 单调性. 因此, 当惯性系数为一个固定常数并且算法所生成的迭代点趋近于变分不等式的解时, 迭代点到变分不等式解集的距离会出现反复震荡的情形, 参见文献[21]. 因此, 本文中的惯性系数没有取常数, 而是把惯性系数修改为随着迭代步数单调递减趋于 0.

本文主要采取了变动的惯性系数来加速文献[14]中的算法, 其中惯性系数的选取参见后面的 (3.1)式. 并且, 本文在与文献[14]相同的假设条件下证明了算法的全局弱收敛性. 数值实验表明通过选取合适的参数能够使得新算法比文献[14]中的算法有更少的迭代步数和计算机耗时, 见注 4.1.

2 预备知识

本节中我们用 $F:H\rightarrow H$ 表示一个连续映射, $H$ 为一个Hilbert 空间, $C$$H$ 中的一个非空闭凸子集, $P_{C}(x)$ 为点 $x\in H$$C$ 上的投影, 即 $P_{C}(x):={\rm argmin}\{\|y-x\||y\in C\}.$并用 $\langle\cdot,\cdot\rangle$, $\|\cdot,\cdot\|$ 分别表示 $H$ 中的内积和范数. $R^m$ 表示 $m$ 维的欧式空间, $R_{+}^{m}$$R^m$ 的非负卦象.下面介绍本文的一些定义和引理, 它们将用于算法的收敛性分析.

定义2.1 (i)若映射 $F$ 满足

$\begin{matrix}\langle F(x)-F(y),x-y\rangle\geq0, \forall x,y\in H,\end{matrix}$

则称 $F$$H$ 上是单调的;

(ii)若映射 $F$ 满足

$\begin{matrix}\langle F(x),y-x\rangle\geq0\Rightarrow\langle F(y),y-x\rangle\geq0, \forall x,y\in H,\end{matrix}$

则称 $F$$H$ 上是伪单调的;

(iii)若映射 $F$ 满足

$\begin{matrix}\langle F(x),y-x\rangle>0\Rightarrow\langle F(y),y-x\rangle\geq0,\end{matrix}$

则称 $F$$H$ 上是拟单调的;

(iv)若存在常数 $L>0$, 满足

$\begin{matrix}\|F(x)-F(y)\|\leq L\|x-y\|, \forall x,y\in H,\end{matrix}$

则称映射 $F$$H$$L$-Lipschitz连续.

引理2.1[22]$C$$H$ 中的一个非空闭凸子集, 那么对于任意固定的 $x\in H$, 都有

$z=P_C(x) \Leftrightarrow z \in C \text { 且. }\langle z-x, y-z\rangle \geq 0, \forall y \in C \text {. }$

引理2.2[23] 对任意的 $x,y\in H$, $\lambda\in R$ 则有

$\begin{matrix}\|\lambda x+(1-\lambda)y\|^{2}=\lambda\|x\|^{2}+(1-\lambda)\|y\|^{2}-\lambda(1-\lambda)\|x-y\|^{2}.\end{matrix}$

引理2.3[23]$C$$H$ 中的一个非空闭凸子集, $\{x_n\}$$H$ 中的序列, 若满足

(i) 对任意的 $x\in C$, $\lim\limits_{n\rightarrow\infty}\|x_n-x\|$ 存在;

(ii) 序列 $\{x_n\}$ 的任意弱聚点都属于 $C$. 那么, 序列 $\{x_n\}$ 弱收敛到 $C$ 中的一点.

引理2.4[24]$\{a_n\}$, $\{b_n\}$, $\{\theta_n\}$$[0,+\infty)$ 中的实数序列. 若对于任意的 $n\geq1$ 都存在一个实数 $\theta$, 使得

$\begin{matrix}a_{n+1}\leq a_n+\theta_n(a_n-a_{n-1})+b_n, 0\leq\theta_n\leq\theta<1, \sum\limits_{n=1}^{+\infty}b_n<+\infty.\end{matrix}$

那么有以下结论成立

(a) $\sum\limits_{n=1}^{+\infty}[a_n-a_{n-1}]<+\infty$, 这里的 $[t]_{+}:=\max\{t,0\}$;

(b) 存在一个 $a^*\in[0,+\infty)$, 使得 $\lim\limits_{n\rightarrow\infty}a_n=a^*$.

为了考虑变分不等式问题, 本文还做了如下假设

(A) 映射 $F$$H$ 上为 $L$-Lipschitz连续, 其中 $L>0$;

(B) $S_D\neq\emptyset$;

(C) 映射 $F$$H$ 上为序列弱连续, 即对于 $H$ 中的一个序列 $\{x_n\}$, 当 $\{x_n\}$ 弱收敛到一点 $x$, 都有 $\{F(x_n)\}$ 弱收敛到 $F(x)$;

(D) 映射 $F$$H$ 上拟单调;

(E) 集合 $\{z\in C|F(z)=0\}\backslash S_D$ 为有限集.

3 算法与收敛分析

在这一节里, 我们主要介绍算法及其收敛性分析. 我们先介绍算法如下.

算法 3.1 步骤1 选取初始点 $x_{-1}=x_{0}\in H$ 以及参数 $0<\mu<1, \lambda_0>0$. 此外, 选取正实数序列 $\{p_n\}$, $\{\varepsilon_n\}$, $\{\beta_n\}$, 并且满足 $ \sum\limits_{n=0}^{+\infty}p_n<+\infty$, $\sum\limits_{n=0}^{+\infty}\varepsilon_n<+\infty$, $\{\beta_n\}$单调递减趋于 0. 取 $n:=0$.

步骤2 选取 $\alpha_n$, 使得 $0\leq\alpha_n\leq\bar{\alpha}_n\leq\beta_0$, 其中

$\begin{matrix}\bar{\alpha}_n = \left\{\begin{array}{ll}\min\Big\{\frac{\varepsilon_n}{\|x_n-x_{n-1}\|^2},\beta_n \Big\},& \mbox{若} x_n\neq x_{n-1},\\\beta_n,& \mbox{其他}.\\\end{array}\right.\end{matrix}$

步骤3

$\begin{matrix}\label{omigan}\omega_n=x_n+\alpha_n(x_n-x_{n-1}),\end{matrix}$
$\begin{matrix}y_n=P_C(\omega_n-\lambda_nF(\omega_n)).\end{matrix}$

如果 $\omega_n=y_n$ 或者 $F(y_n)=0$, 停止. 否则进行步骤 4.

步骤4

$\begin{matrix}x_{n+1}=y_n+\lambda_n(F(\omega_n)-F(y_n)).\end{matrix}$

步骤5

$\begin{matrix}\lambda_{n+1}=\left\{\begin{array}{ll}\min\Big\{\frac{\mu\|\omega_n-y_n\|}{\|F(\omega_n)-F(y_n)\|},\lambda_n+p_n\Big\},& \mbox{若} F(\omega_n)-F(y_n)\neq0,\\\lambda_n+p_n,&\mbox{其他}.\end{array}\right.\end{matrix}$

步骤6 令 $n:=n+1$, 返回步骤 2.

注3.1 注意到惯性算法的生成点与解集的距离没有 Fejer单调性. 因此, 本文的惯性系数 $\alpha_n$ 由 (3.1) 式中的$\bar{\alpha}_n$ 所确定. 通过让 $ \{\beta_n\}$ 为一单调递减趋近于 $0$ 的实数列, 可以迫使 $\{\alpha_n\}$ 也是一个单调递减趋近于 $0$ 的实数列. 此外, 若 $\beta_n=0,\forall n$, 则算法3.1退化为文献[14]中的算法3.1.

引理 3.1$\{\lambda_n\}$ 为算法3.1 所生成的序列, $\{p_n\}$ 满足算法 3.1 中步骤 1 的假设条件, 且 $p=\sum\limits_{n=0}^{+\infty}p_n$. 那么

$\lim\limits_{n\rightarrow\infty}\lambda_n=\lambda\ \mbox{且}\ \min \Big\{\frac{\mu}{L}, \lambda_0\Big\}\leq\lambda_n\leq\lambda_0+p.$

见文献[引理 3.1].

引理 3.2 假设条件 (a), (b) 成立, $\{x_n\}$, $\{y_n\}$, $\{\omega_n\}$, $\{\alpha_n\}$, $\{\lambda_n\}$ 为算法3.1所生成的序列, $\{\varepsilon_n\}$, $\{\beta_n\}$ 满足算法 3.1中步骤1的假设条件. 则我们有以下结论成立

(a) 对于任意固定 $u\in S_D$, $\lim\limits_{n\rightarrow\infty}\|x_n-u\|$ 存在. 进而可知序列 $\{x_n\}$ 是有界的;

(b) $\lim\limits_{n\rightarrow\infty}\|\omega_n-y_n\|= \lim\limits_{n\rightarrow\infty}\|x_{n+1}-x_n\|= \lim\limits_{n\rightarrow\infty}\|x_n-y_n\|=0$.

(a)对于任意固定的 $u\in S_D$, 由 (3.4) 式可得

$\begin{matrix}\|x_{n+1}-u\|^{2}&=&\|y_n+\lambda_n(F(\omega_n)-F(y_n))-u\|^{2}\nonumber\\&=&\|y_n-u\|^{2}+\lambda_n^{2}\|F(\omega_n)-F(y_n)\|^{2}-2\lambda_n\langle F(y_n)-F(\omega_n),y_n-u\rangle\nonumber\\&=&\|\omega_n-u\|^2+\|y_n-\omega_n\|^{2}+2\langle y_n-\omega_n,\omega_n-u\rangle\nonumber\\&&+\lambda_n^{2}\|F(\omega_n)-F(y_n)\|^{2}-2\lambda_n\langle F(y_n)-F(\omega_n),y_n-u\rangle\nonumber\\&=&\|\omega_n-u\|^2-\|y_n-\omega_n\|^{2}+2\langle y_n-\omega_n,y_n-u\rangle\nonumber\\&&+\lambda_n^{2}\|F(\omega_n)-F(y_n)\|^{2}-2\lambda_n\langle F(y_n)-F(\omega_n),y_n-u\rangle.\end{matrix}$

$y_n$ 的定义以及引理 2.1 有 $\langle y_n-\omega_n+\lambda_nF(\omega_n),y_n-u\rangle\leq0$, 变形后可化为

$\begin{matrix} \langle y_n-\omega_n,y_n-u\rangle\leq-\lambda_n\langle F(\omega_n),y_n-u\rangle, \end{matrix}$

于是结合(3.6)式, 可以得到如下不等式关系

$\begin{matrix}\|x_{n+1}-u\|^{2}&\leq&\|\omega_n-u\|^{2}-\|\omega_n-y_n\|^{2}-2\lambda_n\langle F(\omega_n),y_n-u\rangle\nonumber\\&&+\lambda_n^{2}\|F(\omega_n)-F(y_n)\|^{2}-2\lambda_n\langle F(y_n)-F(\omega_n),y_n-u\rangle\nonumber\\&=&\|\omega_n-u\|^{2}-\|\omega_n-y_n\|^{2}+\lambda_n^{2}\|F(\omega_n)-F(y_n)\|^{2}-2\lambda_n\langle F(y_n),y_n-u\rangle\nonumber\\&\leq&\|w_n-u\|^{2}-\|\omega_n-y_n\|^{2}+\lambda_n^{2}\|F(\omega_n)-F(y_n)\|^{2}\nonumber\\&\leq&\|w_n-u\|^{2}-\|\omega_n-y_n\|^{2}+\frac{\lambda_n^{2}\mu^{2}}{\lambda_{n+1}^{2}}\|\omega_n-y_n\|^{2}\nonumber\\&=&\|w_n-u\|^{2}-(1-\frac{\lambda_n^{2}}{\lambda_{n+1}^{2}}\mu^{2})\|\omega_n-y_n\|^{2},\end{matrix}$

这里的第二个不等式的成立是依据 $y_n\in C, u\in S_D$, 第三个不等式的成立是根据 (3.5) 式中$\lambda_{n+1}$ 的定义得出. 接下来, 利用引理 3.1 以及 $0<\mu<1$ 可得

$\begin{matrix}\lim\limits_{n\rightarrow\infty}\Big(1-\frac{\lambda_n^{2}}{\lambda_{n+1}^{2}}\mu^{2}\Big)=1-\mu^{2}>0,\end{matrix}$

结合(3.7)式可知, 存在一个正整数 $N_0$, 都有

$\begin{matrix}\|x_{n+1}-u\|^2\leq\|\omega_n-u\|^2, \forall n\geq N_0. \end{matrix}$

另一方面, 由 (3.2) 式中 $\omega_n$ 的定义以及引理 2.2 可得

$\begin{matrix}\|w_n-u\|^2&=&\|x_{n}+\alpha_{n}(x_n-x_{n-1})-u\|^{2}\\&=&\|(1+\alpha_n)(x_n-u)-\alpha_n(x_{n-1}-u)\|^{2}\nonumber\\&=&(1+\alpha_n)\|x_n-u\|^{2}-\alpha_n\|x_{n-1}-u\|^{2}+\alpha_n(1+\alpha_n)\|x_n-x_{n-1}\|^{2},\end{matrix}$

结合(3.9)式通过变形可以得到, 对于任意的 $n\geq N_0$, 都有

$\begin{matrix}\|x_{n+1}-u\|^{2}&\leq &\|x_n-u\|^2+\alpha_n(\|x_n-u\|^2-\|x_{n-1}-u\|^2)\nonumber\\&&+\alpha_n(1+\alpha_n)\|x_n-x_{n-1}\|^{2}.\end{matrix}$

在(3.1)式中, 根据 $\bar{\alpha}_n$ 的定义, 可以观察到

$\begin{matrix}\alpha_n\|x_n-x_{n-1}\|^2 \leq \bar\alpha_n\|x_n-x_{n-1}\|^2 \leq\varepsilon_n, 1+\alpha_n \leq 1 + \bar \alpha_n \leq 1 + \beta_0,\end{matrix}$

那么

$\begin{matrix}\sum\limits_{n=0}^{+\infty}\alpha_n(1+\alpha_n)\|x_n-x_{n-1}\|^2\leq(1+\beta_0)\sum\limits_{n=0}^{+\infty}\varepsilon_n<+\infty.\end{matrix}$

最后由引理 2.4 以及 (3.11), (3.13) 式可以推出结论 (a) 成立. 下面证明结论 (b) 成立.

通过利用 (3.9), (3.10) 式可以观察到对于任意的 $n\geq N_0$ 都有

$\begin{matrix}0&\leq& \|\omega_n-u\|^2-\|x_{n+1}-u\|^2\\& =& \|x_n-u\|^{2} - \|x_{n+1}-u\|^2 +\alpha_n (\|x_n-u\|^{2}-\|x_{n-1}-u\|^{2})\\ &&+\alpha_n(1+\alpha_n)\|x_n-x_{n-1}\|^{2}.\end{matrix}$

因此, 由结论 (a) 以及 $0\leq\alpha_n\leq\beta_n\leq\beta_0$, 对 (3.14) 式取 $n\rightarrow\infty$, 则有

$\lim\limits_{n\rightarrow\infty}(\|\omega_n-u\|^2-\|x_{n+1}-u\|^2)=0,$

再结合 (3.7) 和 (3.8) 式可得

$\begin{matrix}\lim\limits_{n\rightarrow\infty}\|\omega_n-y_n\|=0.\end{matrix}$

接下来, 由 (3.4)式, 引理 3.1 以及 $F$$L$-Lipschitz连续性可得

$\begin{matrix}\|x_{n+1}-y_n\|^{2}=\lambda_n^{2}\|F(\omega_n)-F(y_n)\|^2 \leq(\lambda_0+p)^{2}L^2\|\omega_n-y_n\|^2,\end{matrix}$

再由 (3.15)式, 则

$\begin{matrix}\lim\limits_{n\rightarrow\infty}\|x_{n+1}-y_n\|=0.\end{matrix}$

此外, 通过利用 (3.15), (3.16)式, 以及三角不等式

$\|x_{n+1}-\omega_n\|\leq\|x_{n+1}-y_n\|+\|y_n-\omega_n\|$

可得

$\begin{matrix}\lim\limits_{n\rightarrow\infty}\|x_{n+1}-\omega_n\|=0.\end{matrix}$

另外, 由(3.2)式中 $\omega_n$ 的定义可以知道

$\begin{matrix}\|x_{n+1}-\omega_n\|&=&\|x_{n+1}-x_n-\alpha_n(x_n-x_{n-1})\|\\&\geq&\|x_{n+1}-x_n\|-\alpha_n\|x_n-x_{n-1}\|,\end{matrix}$

那么

$\|x_{n+1}-x_n\| \leq \|x_{n+1}-\omega_n\| + \alpha_n\|x_n-x_{n-1}\|,$

再由 (3.17)式, $0\leq\alpha_n\leq\beta_n\rightarrow0, n\rightarrow\infty$ 以及序列 $\{x_n\}$ 的有界性, 可得

$\begin{matrix}\lim\limits_{n\rightarrow\infty}\|x_{n+1}-x_n\|=0.\end{matrix}$

最后, 利用(3.16),(3.18)式和三角不等式 $\|x_n-y_n\|\leq\|x_n-x_{n+1}\|+\|x_{n+1}-y_n\|$ 可以推出 $\lim\limits_{n\rightarrow\infty}\|x_n-y_n\|=0$. 故结论 (b) 成立.

引理 3.3 假设条件 (A)-(D) 成立, $\{x_n\}$, $\{y_n\}$, $\{\omega_n\}$ 为算法3.1所生成的序列. 设 $\bar{x}$$\{x_n\}$ 的任一弱聚点, 则 $\bar{x}\in C$, 并且我们还有 $F(\bar{x})=0$$\bar{x}\in S_D$.

由引理 3.2(a) 可知, 序列 $\{x_n\}$ 是有界的. 因此, 设 $\bar{x}$$\{x_n\}$ 的任一弱聚点, 即存在 $\{x_n\}$ 的子序列$\{x_{n_k}\}$, 使得当 $k\rightarrow\infty$ 时, 有 $\{x_{n_k}\}$ 弱收敛到 $\bar{x}$. 此外, 根据引理 3.2(b)可知, 当 $ k\rightarrow\infty$ 时, $\{y_{n_k}\}$$\{\omega_{n_k}\}$ 均弱收敛到 $\bar{x}$. 由于 $\{y_n\}\subset C$, 且 $C$$H$ 中的非空闭凸子集($C$ 为弱闭集), 有 $\bar{x}\in C$.下面分两种情形进行讨论.

情形1 当 $\limsup\limits_{k\rightarrow\infty}\|F(y_{n_k})\|=0$ 时, 可得出 $F(\bar{x})=0$. 证明过程同文献 [引理 3.3].

情形2 当 $\limsup\limits_{k\rightarrow\infty}\|F(y_{n_k})\|>0$ 时, 那么存在一个常数 $K\in N$,使得 $\|F(y_{n_k})\|>0$, $\forall k>K$. 利用引理 2.1 以及 (3.3)式中 $y_n$ 的定义可得

$\begin{matrix}\langle y_{n_k}-(\omega_{n_k}-\lambda_{n_k}F(\omega_{n_k})),x-y_{n_k}\rangle\geq0, \forall x\in C,\end{matrix}$

那么对于任意固定的 $x\in C$, 利用 (3.19) 式以及 $\lambda_n>0, \forall n$ 可推出

$\langle F(y_{n_k}),x-y_{n_k}\rangle \geq\frac{1}{\lambda_{n_k}}\langle w_{n_k}-y_{n_k},x-y_{n_k}\rangle+\langle F(y_{n_k})-F(\omega_{n_k}), x-y_{n_k}\rangle, \forall x\in C.\label{solve}$

由引理 3.1, 引理 3.2(b) 以及 $F$ 的 Lipschitz 连续性可得

$\begin{matrix}+\infty>\limsup\limits_{k\rightarrow\infty}\langle F(y_{n_k}),x-y_{n_k}\rangle\geq\liminf\limits_{k\rightarrow\infty}\langle F(y_{n_k}),x-y_{n_k}\rangle\geq0,\forall x\in C.\end{matrix}$

$\limsup\limits_{k\rightarrow\infty}\langle F(y_{n_k}),x-y_{n_k}\rangle>0$ 时, 即 $\{y_{n_k}\}$ 存在一个子序列 $\{y_{n_{k_i}}\}$ 满足

$\lim\limits_{i\rightarrow\infty}\langle F(y_{n_{k_i}}),x-y_{n_{k_i}}\rangle>0,$

这意味着存在一个正整数 $N_1$ 使得

$\langle F(y_{n_{k_i}}),x-y_{n_{k_i}}\rangle>0, \forall i\geq N_1,$

再由 $F$ 的拟单调性以及 $\{y_{n_{k_i}}\}$ 弱收敛到 $\bar{x}$ 可推出

$\begin{matrix}\langle F(x),x-\bar{x}\rangle\geq0, \forall x\in C.\end{matrix}$

$\limsup\limits_{k\rightarrow\infty}\langle F(y_{n_k}),x-y_{n_k}\rangle=0$ 时, 根据 (3.20) 式可以推出

$\lim\limits_{k\rightarrow\infty}\langle F(y_{n_k}),x-y_{n_k}\rangle=0.$

$\eta_{k}:=|\langle F(y_{n_k}),x-y_{n_k}\rangle|+\frac{1}{k}, k=1,2,\cdots,$

那么

$\begin{matrix}\label{eta}\langle F(y_{n_k}),x-y_{n_k}\rangle+\eta_{k}>0.\end{matrix}$

$z_{n_k}=\frac{F(y_{n_k})}{\|F(y_{n_k})\|^{2}}, \forall k>K,$$\langle F(y_{n_k}), z_{n_k}\rangle=1$, 结合 (3.22) 式可得

$\langle F(y_{n_k}),x-y_{n_k}\rangle+\eta_{k}\langle F(y_{n_k}), z_{n_k}\rangle>0, \forall k>K.$

$\langle F(y_{n_k}),x+\eta_kz_{n_k}-y_{n_k}\rangle>0, \forall k>K.$

$F$$H$ 上的拟单调性可知

$\langle F(x+\eta_kz_{n_k}),x+\eta_kz_{n_k}-y_{n_k}\rangle\geq0, \forall k>K,$

这意味着

$\langle F(x),x-y_{n_{k}}\rangle+\langle F(x+\eta_{k}z_{n_{k}})-F(x),x-y_{n_{k}}\rangle +\langle F(x+\eta_{k}z_{n_{k}}),\eta_{k}z_{n_{k}}\rangle\geq0, \forall k>K,$

因此

$\begin{matrix}\label{equaty}\langle F(x),x-y_{n_{k}}\rangle+\|F(x+\eta_{k}z_{n_{k}})-F(x)\|\|x-y_{n_{k}}\|+\|F(x+\eta_{k}z_{n_{k}})\|\|\eta_{k}z_{n_{k}}\|\geq0, \forall k>K.\end{matrix}$

下面说明 $\lim\limits_{k\rightarrow\infty}\eta_kz_{n_k}=0$. 因为 $F$$H$上为序列弱连续且 $\{y_{n_k}\}$ 弱收敛到 $\bar{x}$, 所以 $ \{F(y_{n_k})\}$ 弱收敛到 $F(\bar{x})$.这结合范数的弱下半连续性可知

$\liminf\limits_{k\rightarrow\infty}\|F(y_{n_k})\|\geq\|F(\bar{x})\|>0.$

由此, 结合 $\eta_k$$z_{n_k}$ 的定义以及 $\lim\limits_{k\rightarrow\infty}\eta_k$ 存在可知

$\begin{matrix}\limsup\limits_{k\rightarrow\infty}\|\eta_{k}z_{n_k}\|=\limsup\limits_{k\rightarrow\infty}\frac{|\eta_k|}{\|F(y_{n_k})\|}\leq\limsup\limits_{k\rightarrow\infty}\frac{|\eta_k|}{\|F(\bar{x})\|}=0,\end{matrix}$

$\lim\limits_{k\rightarrow\infty}\eta_kz_{n_{k}}=0$.

$F$$H$ 上具有 Lipschitz 连续性可知 $\{F(x+\eta_kz_{n_k})\}$ 是有界的. 现对(3.23)式取 $k\rightarrow\infty$, 于是可推出 $\langle F(x),x-\bar{x}\rangle\geq0, \forall x\in C$. 最后结合(3.21) 式可知 $\bar{x}\in S_D$.证毕.

引理 3.4 假设条件 (A)-(E) 成立, $\{x_n\}$ 为算法 3.1所生成的序列, 则 $\{x_n\}$ 弱收敛到 $S$ 中一点.

$A_{x}$$\{x_n\}$ 的所有弱聚点构成的集合. 则由引理 3.3 可知 $A_{x}\subset C$.下面我们分情况讨论.

情况1 若存在 $\tilde{x}\in A_{x}$ 使得 $\tilde{x}\in S_D$. 此时, 则由引理 3.2(a) 可知$\lim\limits_{n\rightarrow\infty}\|x_n-\tilde{x}\|$ 存在. 因此, 不妨设 $x_n-\tilde{x}\rightarrow a(n\rightarrow\infty)$, 其中 $a$ 为一常数. 由此, 结合 $\tilde{x}$$\{x_n\}$ 的弱聚点可知 $a=0$. 进而结合 $S_D\subset S$ 可知结论成立.

情况2 若对任意的 $\tilde{x}\in A_{x}$ 都有 $\tilde{x}\notin S_D$, 则由引理 3.3 可知 $F(\tilde{x})=0$. 因此, 我们有 $ A_{x}\subset\{z\in C|F(z)=0\}\backslash S_D$. 这结合假设条件 (E) 可知 $A_{x}$ 为有限集. 因此, 文献[14]中的引理3.5成立. 进而,结合引理3.2(b)中的 $\lim\limits_{n\rightarrow\infty}\|x_{n+1}-x_n\|=0$ 以及文献[14] 中的定理3.1可知 $\{x_n\}$ 弱收敛到 $S$ 中一点.证毕.

4 数值实验

本节中, 我们通过数值实验来比较本文算法 3.1 (简记为 YCY) 及 Liu 和 Yang[14] 的算法 3.1 (简记为 LY). 使用的工具是 R2014a 版本的 MATLAB 在 CPU 型号为 Intel(R) Core(TM) i3-1000NG4 (四核, 主频 1.10GHz) 和内存为 8.0GB 的笔记本电脑上运行的. LY 的参数选取见文献[14], 即 $\mu=0.5, \lambda_0=1, p_n=\varepsilon_n=\frac{100}{(n+1)^{1.1}}$. YCY 的参数选取方案如下.

YCY1: $\mu=0.5, \lambda_0=1, p_n=\varepsilon_n=\frac{100}{(n+1)^{1.1}}, \beta_n=\frac{1}{100ln(n+2)}$;

YCY2: $\mu=0.5, \lambda_0=1, p_n=\varepsilon_n=\frac{100}{(n+1)^{1.1}}, \beta_n=\frac{1}{0.286(n+1)ln(n+2)}$;

YCY3: $\mu=0.5, \lambda_0=1, p_n=\varepsilon_n=\frac{100}{(n+1)^{1.1}}, \beta_n=\frac{1}{n+1}$;

YCY4: $\mu=0.5, \lambda_0=1, p_n=\varepsilon_n=\frac{100}{(n+1)^{1.1}}, \beta_n=(\frac{1\cdot3\cdot\cdot\cdot(2n-1)}{2\cdot4\cdot\cdot\cdot2n})^3$.

YCY与 LY 的终止条件分别为$\|\omega_n-y_n\|/\min\{\lambda_n, 1\}\leq\varepsilon$, $\|x_n-y_n\|/\min\{\lambda_n, 1\}\leq\varepsilon$. 用 cpu (单位:秒)来记计算机的耗时, 用 iter 来记算法迭代的步数. 定义 $x_{-1}=x_0$ 为 YCY 的初始点, $x_0$ 为 LY 的初始点. 取 $\varepsilon=10^{-6}$. YCY 与 LY 的数值结果均取 MATLAB 运行5次后的平均值.

例4.1 本例被文献[14]用于拟单调变分不等式问题的算法检验. 设$C=[-1,1]$.

$\begin{matrix}F(x) = \left\{\begin{array}{ll}2x-1,& x>1,\\x^2,& x\in[-1,1],\\-2x-1,& x<-1.\end{array}\right.\end{matrix}$

例4.2 本例被文献[25] 用于单调变分不等式问题的算法检验. 设

$C=R_{+}^m, F(y)=My+d, d\in R^m,$

这里的向量 $d$ 中的每一个元素从 $(-500,0)$ 中随机产生. 对于随机矩阵$M=NN^{T}+S+D\in R^{m\times m}$, 其中, $N\in R^{m\times m}$ 为一个随机矩阵, $S\in R^{m\times m}$为一个随机反对称矩阵, $D\in R^{m\times m}$ 为一个随机对角矩阵, 这里 $S$$D$ 中的每一个元素分别于 $(-5,5)$$(0,0.3)$ 中随机产生. 因此, $M$ 为正定矩阵, 且 $F$$L$-Lipschitz连续, 其 Lipschitz 常数 $L=\|M\|$.

例4.3 本例在 $R^m$ 中用来测试与比较YCY和LY的数值实验结果. 在维数 $m=5$ 时, 本例被文献[12]用于拟单调变分不等式的算法检验. 设

$C=\Big\{x\in R^m:x_i\geq0,i=1,\cdots,m, \sum\limits_{i=1}^{i=m}x_i=a\Big\}, a>0, G(x)=\frac{\frac{1}{2}x^{T}Hx+q^{T}x+r}{\sum\limits_{i=1}^{i=m}x_i}, $

其中 $H=hI$, $I\in R^{m\times m}$ 为单位矩阵, $h\in(0.1,1.6)$, $q=(-1,\cdots,-1)^{T}\in R^m$, $r=1$, 则 $G$$C$ 上的光滑拟凸函数. 令 $F(x)=(F_{1}(x),\cdots F_{m}(x))^{T}$$G(x)$ 的导函数, 则

$F_{i}(x)=\frac{hx_{i}\sum\limits_{i=1}^{i=m}x_i-\frac{1}{2}h\sum\limits_{i=1}^{i=m}x_{i}^{2}-1}{(\sum\limits_{i=1}^{i=m}x_i)^2},\forall i.$

因此, VI($F,C$) 是拟单调变分不等式, 且$S_D=\{(\frac{a}{m},\cdots,\frac{a}{m})\}$.

注4.1表1-表3可以看出:当YCY的参数选取方案为YCY2时, 算法YCY(惯性的 LY)比LY有更少的迭代步数和计算机耗时.

表1   例4.1 的数值结果

新窗口打开| 下载CSV


表2   例4.2 的数值结果

新窗口打开| 下载CSV


表3   例4.3 的数值结果

新窗口打开| 下载CSV


参考文献

Cottle R W, Yao J C.

Pseudo-monotone complementarity problems in Hilbert space

J Optim Theory Appl, 1992, 75: 281-295

DOI:10.1007/BF00941468      URL    

Goldstein A A.

Convex programming in Hilbert space

Bull Amer Math Soc, 1964, 70(5): 709-710

DOI:10.1090/bull/1964-70-05      URL     [本文引用: 1]

Korpelevich G M.

An extragradient method for finding saddle points and other problems

Ekonomika i Mat Metody, 1976, 12: 747-756

[本文引用: 1]

Antipin A S.

On a method for convex programs using asymmetrical modification of the Lagrange function

Ekonomika i Mat Metody, 1976, 12(6): 1164-1173

[本文引用: 1]

Tseng P.

A modified forward-backward splitting method for maximal monotone mappings

SIAM J Control Optim, 2000, 38: 431-446

DOI:10.1137/S0363012998338806      URL     [本文引用: 2]

Censor Y, Gibali A, Reich S.

The subgradient extragradient method for solving variational inequalities in Hilbert Space

J Optim Theory Appl, 2011, 148: 318-335

DOI:10.1007/s10957-010-9757-3      URL     [本文引用: 1]

Vuong P T.

On the weak convergence of the extragradient method for solving pseudo-monotone variational Inequalities

J Optim Theory Appl, 2018, 176: 399-409

DOI:10.1007/s10957-017-1214-0      [本文引用: 1]

陈艺, 叶明露.

求解伪单调变分不等式的修正投影收缩算法

西华师范大学学报(自然科学版), 2021, 42(3): 246-253

[本文引用: 1]

Chen Y, Ye M L.

Modified projection and contraction algorithm for solving pseudomonotone variational inequality problems

Journal of China West Normal University(Natural Sciences), 2021, 42(3): 246-253

[本文引用: 1]

杨静, 龙宪军.

关于伪单调变分不等式与不动点问题的新投影算法

数学物理学报, 2022, 42A(3): 904-919

[本文引用: 1]

Yang J, Long X J.

A new projection algorithm for solving pseudo-monotone variational inequality and fixed point problems

Acta Mathematica Scientia, 2022, 42A(3): 904-919

[本文引用: 1]

万升联.

解变分不等式的一种二次投影算法

数学物理学报, 2021, 41A(1): 237-244

[本文引用: 1]

Wan S L.

A double projection algorithm for solving variational inequalities

Acta Mathematica Scientia, 2021, 41A(1): 237-244

[本文引用: 1]

胡雨贤.

求解变分不等式的一种双投影算法

数学物理学报, 2019, 39A(6): 1492-1498

[本文引用: 1]

Hu Y X.

A double projection method for solving variational inequalities

Acta Mathematica Scientia, 2019, 39A(6): 1492-1498

[本文引用: 1]

Ye M L, He Y R.

A double projection method for solving variational inequalities without monotonicity

Comput Optim and Appl, 2015, 60(1): 141-150

DOI:10.1007/s10589-014-9659-7      URL     [本文引用: 3]

He Y R.

Solvability of the minty variational inequality

J Optim Theory Appl, 2017, 174(3): 686-692

DOI:10.1007/s10957-017-1124-1      URL     [本文引用: 1]

Liu H W, Yang J.

Weak convergence of iterative methods for solving quasimonotone variational inequalities

Comput Optim and Appl, 2020, 77(2): 491-508

DOI:10.1007/s10589-020-00217-8      [本文引用: 10]

Ye M L.

An infeasible projection type algorithm for nonmonotone variational inequalities

Numer Algor, 2022: 89(4), 1723-1742

DOI:10.1007/s11075-021-01170-1      [本文引用: 1]

Polyak B T.

Some methods of speeding up the convergence of iteration methods

USSR Comput Math Math Phys, 1964: 4(5): 1-17

[本文引用: 1]

Wang Z B, Chen X, Yi J, et al.

Inertial projection and contraction algorithms with larger step sizes for solving quasimonotone variational inequalities

J Global Optim, 2022, 82(3): 499-522

DOI:10.1007/s10898-021-01083-2      [本文引用: 2]

Thong D V, Vinh N T, Cho Y J.

New strong convergence theorem of the inertial projection and contraction method for variational inequality problems

Comput Optim and Appl, 2020, 84(1): 285-305

[本文引用: 1]

杨蓝翔, 叶明露.

一类伪单调变分不等式与不动点问题的自适应惯性投影算法

西华师范大学学报(自然科学版), 1-13[2022-11-16]. http://kns.cnki.net/kcms/detail/51.1699.N.20220927.1812.007.html

URL     [本文引用: 1]

Yang L X, Ye M L.

A Self-adaptive inertial projection algorithm for a class of pseudomonotone variational inequalities and fixed-point problems

Journal of China West Normal University(Natural Sciences), 1-13[2022-11-16]. http://kns.cnki.net/kcms/detail/51.1699.N.20220927.1812.007.html

URL     [本文引用: 1]

Chen J X, Ye M L.

A new inertial two-subgradient extragradient algorithm for variational inequality problems

Adv Math (China), 2022, 51(1): 165-182

[本文引用: 1]

Shehu Y, Iyiola O S.

Projection methods with alternating inertial steps for variational inequalities: Weak and linear convergence

Appl Numer Math, 2020, 157: 315-337

DOI:10.1016/j.apnum.2020.06.009      URL     [本文引用: 2]

Goebel K, Rech S. Uniform Convexity, Hyperbolic Geometry, and Nonexpansive Mappings. New York: Marcel Dekker, 1984

[本文引用: 1]

Bauschke H H, Combettes P L. Convex Analysis and Monotone Operator Theory in Hilbert Spaces. Berlin: Springer, 2017

[本文引用: 2]

Alvarez F.

Weak convergence of a relaxed and inertial hybrid projection-proximal point algorithm for maximal monotone operators in Hilbert Space

SIAM J Optimiz, 2004, 14(3): 773-782

DOI:10.1137/S1052623403427859      URL     [本文引用: 1]

Dang H, Pham K A, Le D M.

Modified hybrid projection methods for finding common solutions to variational inequality problems

Comput Optim and Appl, 2017, 66(1): 75-96

DOI:10.1007/s10589-016-9857-6      URL     [本文引用: 1]

/