一种新的广义次梯度及其性质


扩展功能
	加入收藏夹

	复制引文信息

	加入引用管理器

	Email Alert

	RSS
本文作者相关文章
	黄正刚

一种新的广义次梯度及其性质

黄正刚

重庆理工大学数学与统计学院重庆 400054

收稿日期: 2014-04-20; 修订日期: 2015-03-04

作者简介: 黄正刚,hzg@cqut.edu.cn

摘要: 该文提出了一种新的广义次梯度,讨论了与Tangent锥相关的一些基本性质,且在部分性质基础上得出了含不等式与任意集约束下非凸非可微标量最优化问题的k阶严格局部极小点存在的必要与充分条件以及无约束非凸非可微标量最优化问题局部极小点存在的必要条件.

关键词: k-下(上)次梯度 Tangent锥 k阶严格局部极小点局部极小点最优性条件

A New Notion of Generalized Subgradients and Its Properties

Huang Zhenggang

College of Mathematics and Statistics, Chongqing University of Technology, Chongqing 400054

Received: 2014-04-20; Revised: 2015-03-04

Abstract: This paper proposes a new notion of generalized subgradients and discusses some properties of it in terms of Tangent cone. Using some of those properties, necessary and sufficient optimality conditions for a nonconvex and nondifferentiable scalar optimization problem with inequalities constraints and an arbitrary set constraint are derived, also a necessary condition for a nonconvex and nondifferentiable unconstrained scalar optimization problem is derived.

Key words: k-Lower(upper)subgradient Tangent cone Strict local minimizer of order k Local minimizer Optimality conditions

1 引言及预备知识

记 $N$ , $R$ 与 $R^n$ 分别表示自然数集,实数集与 $n$ 维欧氏空间, $N^+=\{x\in N:x>0\},$ $R^{++}=\{x\in R:x>0\}$ , $\|\cdot\|$ 是欧氏范数, $\langle\cdot \rangle$ 是欧氏空间中两个元素的数量积, $\Gamma=\{v\in R^n:\|v\|=1\}$ , $A\times B$ 为集合 $A$ 与 $B$ 的笛卡尔积, $E_f$ 为函数 $f$ 的上图像.

在最优化理论中,次梯度是一个基本而又重要的理论工具. 利用各种次梯度及其基本性质^{[1, 2, 3, 4, 5, 6, 7]}, 可以得到非可微最优化问题的一阶或二阶最优性条件. 在最优化理论和凸分析较早研究时, 人们利用普通方向导数(双侧方向导数)定义了凸函数在一点的次梯度与次微分的重要概念.

定义1.1^{[8, 9, 10, 11, 12, 13, 14]} 设凸函数 $f:R^n\rightarrow R\cup \{+\infty \}$ 在点 $x^0\in M\subset R^n$ 的函数值有限. 向量 $\xi\in R^n$ 被称为是 $f$ 在 $x^0$ 的次梯度,如果

$\langle \xi,\cdot \rangle \leq f'(x^0,\cdot),$

其中, $\langle \xi,\cdot \rangle$ 和 $f'(x^0,\cdot)$ 分别表示 $\xi$ 与 $R^n$ 中任一向量的数量积、 $f$ 在 $x^0$ 沿同一方向的普通方向导数. 并称集合 $\partial f(x^0):=\{\xi\in R^n: \langle \xi,u \rangle \leq f'(x^0,u),\forall u\in R^n\}$ 为 $f$ 在点 $x^0$ 的次微分.

对于以上凸次梯度(凸次微分), 人们研究了它的一些基本性质与凸函数极小点存在的必要与充分条件. 后来,针对更一般的标量函数, 人们利用Dini、Clarke、M-P等方向导数,提出了更广义的次梯度(次微分): Dini、Clarke、M-P等次梯度(次微分)等^{[1, 2, 3, 4, 5, 6, 7]},并讨论了相应的基本性质. 其实,这些定义是在一定的空间中,将上面的普通方向导数分别换成Dini、 Clarke、M-P等方向导数后所得结果. 关于一阶次微分完整、系统的基本理论可见文献[13, 14, , , ]. 对于二阶次微分,Georgiev给出了 $C1,1$ 函数在一点的Clarke 型二阶次微分定义.

定义1.2^[18] 设 $E$ 是实Banach空间, $G\subset E$ 是非空开集, $f: G\to R$ 是 $C1,1$ 函数, $x^0 \in G$ . 对每一个 $h_1,h_2 \in E$ ,称

$f^{00}(x^0,h_1,h_2):=\limsup _{t\to 0^+,y\to x^0}\frac{f'(y+th_1)[h_2] -f'(y)[h_2]}{t}$

是 $f$ 在 $x^0$ 处沿方向 $h_1,h_2$ 的二阶方向导数. 并称集合

$\partial_C ^2 f(x^0):=\{l\in L(E\times E):l(h_1,h_2)\leq f^{00}(x^0,h_1,h_2), \forall h_1,h_2 \in E\}$

为 $f$ 在 $x^0$ 的次微分,其中每一个元素 $l$ 称为 $f$ 在 $x^0$ 的二阶次梯度. 这里, $f'(x)$ 表示 $f$ 在 $x$ 的导数, $L(E\times E)$ 表示 $E\times E$ 上的所有连续双线性泛函组成的集合.

在以上一阶凸、Dini、Clarke 和M-P次微分、二阶次微分定义形式的启发下, 我们提出基于 $k(k\geq 1)$ 阶下、上Studniarski方向导数的 $k$ -下、上次梯度(次微分)的概念. 而且,它在某种条件下可退化为一阶凸次梯度(次微分) (见本文p3注2.1(b)),故与Dini、Clarke和M-P次梯度(次微分)一样, 是一种广义次梯度(次微分),而且当 $k\geq2$ 时,还是一种高阶广义次梯度(次微分); 另外,此概念在以前研究中从未出现过,所以是一种新的广义次梯度(次微分).

本文并不专门讨论该广义次微分是否具有凸性、闭性以及单调性等基本性质, 而主要研究与Tangent锥相关的一些重要结论,利用某些性质分别导出了约束与无约束条件下标量最优化问题关于 $k$ 阶严格局部极小点与局部极小点存在的最优性条件.

定义1.3 设函数 $f:R^n\rightarrow R,x^0\in M\subset R^n.$ 集合 $M$ 在点 $x^0$ 处的Tangent锥(简称 $T$ -切锥)定义为

$T(M,x^0)=\{v \in R^n: \exists x_m \in M,x_m\rightarrow x^0,\exists \lambda_m>0,\lambda_m(x_m-x^0)\rightarrow v\}.$

定义1.4 在定义1.3基础上, $T$ -切锥的正极锥定义为

$T^+(M,x^0)=\{ \xi \in R^n:\langle \xi,y\rangle \geq0,\forall y\in T(M,x^0)\}.$

定义1.5 设 $f:R^n \rightarrow R\bigcup\{+\infty\}$ 在点 $x^0$ 处函数值有限, 则 $f$ 在点 $x^0$ 处沿方向 $v \in R^n$ 的Hadamard 方向导数及下、上 Hadamard 方向导数分别是

$df(x^0,v)=\lim_{(t,u)\to(0^+,v)}\frac{f(x^0+tu)-f(x^0)}{t},$

$\underline{d}f(x^0,v)=\liminf_{(t,u)\to(0^+,v)}\frac{f(x^0+tu)-f(x^0)}{t}$

与

$\overline{d}f(x^0,v)=\limsup_{(t,u)\to(0^+,v)}\frac{f(x^0+tu)-f(x^0)}{t}.$

定义1.6^[19] 设 $f:R^n \rightarrow R\bigcup\{+\infty\}$ 在点 $x^0$ 处函数值有限, $k\in N^+$ ,则 $f$ 在点 $x^0$ 处沿方向 $v \in R^n$ 的 $k$ 阶下、上 Studniarski 方向导数定义为

$\underline{d}^kf(x^0,v)=\liminf_{(t,u)\to(0^+,v)}\frac{f(x^0+tu)-f(x^0)}{t^k}$

与

$\overline{d}^kf(x^0,v)=\limsup_{(t,u)\to(0^+,v)}\frac{f(x^0+tu)-f(x^0)}{t^k}.$

定义1.7^{[19, 20]} 设 $f:R^n\rightarrow R,x^0\in M\subset R^n$ , 若存在常数 $\alpha >0$ 与点 $x^0$ 的某一邻域 $U$ ,使得

$f(x)>f(x^0)+\alpha{\|x-x^0\|}^k,\forall x\in M\cap U\backslash\{x^0\},$

则称 $x^0$ 是 $f(x)(x\in M)$ 的 $k$ 阶严格局部极小点. 所有这样的点组成的集合记为 $\mbox{StrL}(k,f,M)$

定义1.8 设 $f:R^n\rightarrow R,x^0\in M\subset R^n$ , 若存在 $x^0$ 的某一邻域 $U$ ,使得

$f(x)\geq f(x^0),\forall x\in U\cap M,$

则称 $x^0$ 是 $f(x)(x \in M)$ 的局部极小点. 若 $M=R^n$ ,则称 $x^0$ 是 $f$ (在 $R^n$ 上)的局部极小点.

显然, $f$ 的下(上) Hadamard方向导数就是一阶下(上) Studniarski方向导数, $f(x)$ $(x \in M)$ 的 $k$ 阶严格局部极小点也是 $f(x)$ $(x \in M)$ 的局部极小点.

$k$ -下(上)次梯度及其性质

本节,我们研究 $k$ -下(上)次梯度的某些基本性质, 并给出约束与无约束条件下最优化问题的 $k$ 阶严格局部极小点和局部极小点存在的必要与充分条件.

定义2.1 设 $k\in N^+$ , 函数 $f:R^n\rightarrow R,\,x^0\in R^n ,\,\xi \in R^n,\,r:R^{++}\times R^n \to R$ 满足当 $(t,u)\in R^{++}\times R^n$ 收敛时(其中 $t\to 0)$ , 有 $r(t,u)\to 0.$ 称 $\xi$ 是 $f$ 在点 $x^0$ 处关于 $r$ 的 $k$ - 下次梯度(简称为 $f$ 在点 $x^0$ 的 $k$ - 下次梯度),如果对任一 $(t,u)\in R^{++}\times R^n$ , 有

$f(x^0+tu)\geq f(x^0)+t^k\langle \xi,u\rangle +t^k\|u\|r(t,u).$

在此定义中,如果 $``\geq"$ 改为 $``\leq"$ 成立,则称 $\xi$ 是 $f$ 在点 $x^0$ 的 $k$ - 上梯度. 称 $\underline\partial^kf(x^0)=\{\xi\in R^n:\xi$ 是 $f$ 在点 $x^0$ 的 $k$ -下次梯度\} 为 $f$ 在 $x^0$ 的 $k$ - 下次微分, $\overline{\partial}^kf(x^0)=\{\xi\in R^n:\xi$ 是 $f$ 在点 $x^0$ 的 $k$ -上次梯度\} 为 $f$ 在 $x^0$ 的 $k$ - 上次微分.

注2.1 (a) 当 $k=1$ 时,若 $r(t,u)\equiv 0$ , 则 $k$ - 下(上)次梯度就是凸函数(凹函数)在点 $x^0$ 处的次梯度;

(b) 当 $k=1$ 时, 若此定义中的不等号为等号,则 $f$ 在点 $x^0$ 处可微,且 $\xi=\nabla f(x^0)$ .

因此,这里的 $k$ -下(上)次梯度其实是一种广义的次梯度.

下面所有内容均假设定义2.1中的函数 $r$ 已知,现在我们来讨论这种广义次梯度的一些基本性质.

定理2.1 设 $k\in N^+$ ,函数 $f:R^n\rightarrow R$ 在点 $x^0$ 处连续,则

(i) 如果 $\xi\in\underline{\partial}^kf(x^0)$ ,那么 $\langle \xi,v \rangle \leq\underline{d}^kf(x^0,v),\forall v \in \Gamma$ .

(ii) 如果 $\xi \in\overline{\partial}^kf(x^0)$ , 那么 $\langle \xi,v \rangle \geq\overline{d}^kf(x^0,v),\forall v\in \Gamma$ .

证 (i) 设 $\xi\in\underline{\partial}^kf(x^0)$ , 则由定义2.1,对 $\forall(t,u)\in R^{++}\times \Gamma$ ,有

$\begin{eqnarray*} f(x^0+tu) &\geq &f(x^0)+t^k\langle \xi,u\rangle +t^k\|u\|r(t,u)\\ &=&f(x^0)+t^k\langle \xi,u\rangle +t^kr(t,u). \end{eqnarray*}$

故

$\frac{f(x^0+tu)-f(x^0)}{t^k}\geq \langle \xi,u \rangle +r(t,u).$

从而

$\liminf_{(t,u)\rightarrow(0^+,v)}\frac{f(x^0+tu)-f(x^0)}{t^k}\geq\langle \xi,v\rangle .$

即

$\langle \xi,v\rangle \leq\underline{d}^kf(x^0,v)$

得证.

(ii) 同理可证.

考虑约束最优化问题

$\mbox{(sp)} \left\{ \begin{array}{ll} \min & f \left( x \right) ,\\ \mbox{s.t.} & g \left( x \right) \in -D ,\\ & x \in Q , \end{array} \right.$

其中, $f:R^n\to R\cup\left\{+\infty\right\}$ , $g:R^n \to R^p$ , $D\subset R^p$ 是一个内部非空的闭凸点锥, $Q\subset R^n$ 是一个任意集合, $S$ 表示(sp)的可行集,点 $x^0\in S$ .

在该问题中,我们总假定 $f$ 在 $x^0$ 处连续, $g$ 在 $x^0$ 处Hadamard方向可微, 即 $g$ 沿任一方向 $v\in R^n$ 的 Hadamard 方向导数 $dg(x^0,v)$ 均存在. 记 $G=\{x\in R^n:g(x)\in -D\},$ $C_0(G,x^0)=\{v\in R^n:dg(x^0,v)\in \mbox{intcone}(-D-g(x^0)\},$ $C(G,x^0)=\{v\in R^n:dg(x^0,v)\in \mbox{clcone}(-D-g(x^0))\},$ $C(f,x^0)=\{v\in R^n: {\underline{d}}_rf(x^0,v)\leq 0\},$ $I_Q(x)=0/+\infty(x\in Q/\notin Q)$ 为 $Q$ 的指标函数.

文献[20,定理2.1,3.1,3.2]给出了问题(sp) $k$ 阶严格局部极小点存在的必要条件与充分条件.

引理2.1 设 $k\in N^+$ . 若 $x^0 \in \mbox{StrL}(k,f,G\cap Q)$ , 则

$\overline{d}^k f(x^0,v)>0,\,\forall v\in {C_0}(G,x^0)\cap T(Q,x^0)\backslash{\{0\}}.$

引理2.2 设 $k\in N^+\mbox{且}k\geq 2.$ 若 $\forall v \in C(G,x^0)\cap T(Q,x^0)\cap C(f,x^0)\backslash{\{0\}}$ ,使得

$\underline {d}^k(f+I_Q)(x^0,v)>0,$

则 $x^0\in \mbox{StrL}(k,f,G\cap Q).$

引理2.3 如果对 $\forall v\in C(G,x^0)\cap T(Q,x^0)\backslash {\{0\}}$ , 有

$\underline{d}(f+I_Q)(x^0,v)>0,$

则 $x^0\in \mbox{StrL}(1,f,G\cap Q)$ .

现对于(sp),我们利用 $k$ -上次梯度,可得其 $k$ 阶严格局部极小点存在的必要条件.

定理2.2 设 $k\in N^+,\,\xi\in \overline {\partial}^kf(x^0)$ . 若 $x^0 \in \mbox{StrL}(k,f,G\cap Q)$ ,则有

$\langle\xi,v\rangle>0,\forall v\in C_0(G,x^0)\cap T(Q,x^0)\backslash{\{0\}}.$

证设 $\xi\in \overline {\partial}^k f(x^0)$ ,由定理2.1(ii), 对 $\forall v\in C_0(G,x^0)\cap T(Q,x^0)\backslash{\{0\}},$ 有

$\langle\xi,\frac{v}{\|v|}\rangle \geq \overline {d}^{k}f(x^0,\frac{v}{\|v\|}).$

由已知及引理2.1,

$\overline{d}^kf(x^0,\frac{v}{\|v\|})>0.$

从而

$\langle\xi,\frac{v}{\|v\|}\rangle >0.$

即

$\langle \xi,v\rangle >0,$

得证.

显然,当 $C_0(G,x^0)\cap T(Q,x^0)=S$ 时,定理2.2是凸函数局部极小点存在必要条件的推广(参见文献[12,pp120,121,定理3.4.3]).

利用定理2.1、引理2.2、引理2.3以及 $k$ -下次梯度,我们可得(sp) $k$ 阶严格局部极小点存在的充分条件如下.

定理2.3 设 $k\in N^+\mbox{且}k\geq 2.$ 若任给 $\xi \in \underline {\partial}^k(f+I_Q)(x^0)$ ,有

$\langle \xi,v\rangle>0,\forall v\in C(G,x^0)\cap T(Q,x^0)\cap C(f,x^0) \backslash {\{0\}},$

则 $x_0\in\mbox{StrL}(k,f,G\cap Q).$

证任给 $\xi \in \underline {\partial}^k(f+I_Q)(x^0),$ 由定理2.1(i), 对 $\forall v\in C(G,x^0)\cap T(Q,x^0)\cap C(f,x^0)\backslash{\{0\}},$

$\langle \xi,\frac {v}{\|v\|}\rangle \leq \underline{d}^k(f+I_Q)(x^0,\frac{v}{\|v\|}),$

即

$\langle \xi,v\rangle \leq \underline{d}^k(f+I_Q)(x^0,v).$

从而由已知及引理2.2,上面结论成立.

定理2.4 任给 $\xi\in \underline {\partial}(f+I_Q)(x^0),$ 若

$\langle\xi,v\rangle>0,\forall v\in C(G,x^0)\cap T(Q,x^0)\backslash{\{0\}},$

则 $x_0\in \mbox{StrL}(1,f,G\cap Q).$

证利用引理2.3,其证明过程与定理2.3类似.

明显地,当 $C(G,x^0)\cap T(Q,x^0)\cap C(f,x^0)=S$ 时, 定理2.3是凸函数的局部极小点存在的(文献[12,pp120,121,定理3.4.3]) 充分条件的推广; 当 $C(G,x^0)\cap T(Q,x^0)=S$ 时,定理2.4是该充分条件的推广.

下面我们继续讨论 $k$ -下(上)次梯度的其它性质.

定理2.5 设 $\xi\in R^n$ . 则 $\xi\in\underline{\partial}^kf(x^0) \Leftrightarrow$ 对 $R^{++}\times \Gamma$ 中任一收敛序列 $(t_m,u_m)\rightarrow(0^+,v)$ $(m\rightarrow +\infty)$ , 存在其子序列 $(t_{m_j},u_{m_j})$ 及某数列 $c_m\rightarrow 0(m\rightarrow +\infty)$ 使得

$f(x^0+t_{m_j}u_{m_j})\geq f(x^0)+t_{m_j}^k\langle \xi,u_{m_j} \rangle +t_{m_j}^kc_m,\forall j,m\in N^+.$

证 $\Rightarrow$ ". 设 $\xi\in\underline{\partial}^kf(x^0)$ , 由定义2.1,对任一 $(t,u)\in R^{++}\times \Gamma$ ,有

$f(x^0+tu)\geq f(x^0)+t^k\langle \xi,u \rangle +t^k\|u\|r(t,u),$

其中, $r(t,u)\rightarrow 0$ (当 $(t,u)\rightarrow (0^+,v)$ 时).

因为 $(t,u)\in R^{++}\times \Gamma$ ,故当 $t>0$ 充分小时,集合 $\{(t,u)\}$ 有界. 设 $\forall(t_m,u_m)\in R^{++}\times \Gamma$ 且 $(t_m,u_m)\rightarrow(0^+,v)$ , 则序列 $\{(t_m,u_m)\}$ 有界. 取

$(t_{m_j},u_{m_j})=(t_m,u_m),$

$c_m=\|u_m\|r(t_m,u_m)=r(t_m,u_m),$

$\forall m\in N^+$ 得证.

`` $\Leftarrow$ ". 用反证法,设 $\xi\notin\underline{\partial}^kf(x^0)$ . 现取 $r(t,u)=\min \{0,[f(x^0+tu)-f(x^0)-t^k\langle \xi,u \rangle]/t^k\|u\|\}$ , 则 $r(t,u)\leq 0$ ,且当 $(t,u)\rightarrow(0^+,v)$ 时,必然 $r(t,u)\not\to 0.$ 从而存在数 $\beta>0$ ,使得

$\begin{equation} f(x^0+tu)-f(x^0)-t^k\langle \xi ,u \rangle <-\beta. \end{equation}$

(2.1)

由已知, $t_mu_m\rightarrow0\in R^n$ $(m\rightarrow +\infty)$ , 从而存在其子序列 $\{t_{m_j}u_{m_j}\}$ 使得 $t_{m_j}u_{m_j}\rightarrow 0\in R^n$ $(j\rightarrow +\infty)$ . 又由已知,存在数列 $c_m\rightarrow 0$ $(m\rightarrow +\infty)$ ,对充分大的 $j\in N^+,$ 下式成立

$\begin{equation} f(x^0+t_{m_j}u_{m_j})\geq f(x^0)+t_{m_j}^k\langle \xi,u_{m_j}\rangle +t_{m_j}^k\|u_{m_j}\|\cdot c_{m_j} \end{equation}$

(2.2)

所以由(2.1)、(2.2)式,

$t_{m_j}^kc_{m_j}<-\beta$

对任意充分大的 $j\in N^+$ 成立.

上式当 $j\rightarrow +\infty$ 时取极限,得 $0\leq -\beta$ 矛盾.

故 $\xi\in\underline{\partial}^kf(x^0).$

定理2.6 设 $f:R^n \rightarrow R,\,x^0\in R^n,\,\xi \in R^n,\,k\in N^+$ , 那么下面结论成立.

(i) 设 $k=1$ . 则 $\xi\in\underline{\partial}^kf(x^0)\Leftrightarrow (-\xi,1)\in T^+[E_f,(x^0,f(x^0))]$ .

(ii) 设 $k\geq 2.$ 若 $x^0$ 是 $f$ 在 $R^n$ 上的局部极小点, 则 $0\in \underline{\partial}^kf(x^0)\Leftrightarrow(0,1)\in T^+[E_f,$ $(x^0,f(x^0))].$

证先证(i)、(ii)的`` $\Rightarrow$ ",再证(i)、(ii) 的`` $\Leftarrow$ ".

`` $\Rightarrow$ ". 设 $k\in N^+ ,\xi\in\underline{\partial}^kf(x^0)$ (在(ii)中, 这时 $\xi=0\in R^n),\,(x,y)\in T[E_f,(x^0,f(x^0))]$ .

由 $T$ -切锥定义,存在数列 $\lambda_m>0$ 及序列 $(x_m,y_m)\in E_f$ , 使得

$\lambda_m[(x_m,y_m)-(x^0,f(x^0))]\rightarrow(x,y),(m\rightarrow+\infty).$

即当 $m\rightarrow+\infty$ 时,

$\begin{equation} [\lambda_m(x_m-x^0),\lambda_m(y_m-f(x^0))]\rightarrow(x,y). \end{equation}$

(2.3)

因为 $\xi\in \underline{\partial}^kf(x^0)$ ,所以对任一收敛序列 ${(t_m,u_m)}\subset R^{++}\times \Gamma$ (其中 $t_m\rightarrow 0^+,m\rightarrow+\infty$ ), 由定义2.1,有

$y_m\geq f(x_m)=f(x^0+t_mu_m)\geq f(x^0)+t_m^k\langle \xi,u_m\rangle +t_m^k\|u_m\|r(t_m,u_m),$

对 $\forall$ 充分大的 $m \in N^+$ . 其中 $x_m=x^0+t_mu_m,\forall$ 充分大的 $m\in N^+$ ,且 $r(t_m,u_m)\rightarrow 0$ $(m\rightarrow +\infty)$ .

即

$y_m-f(x^0)\geq t_m^{k-1}\langle \xi,t_mu_m\rangle +t_m^{k-1}\|t_mu_m\|r(t_m,u_m),$

对 $\forall$ 充分大的 $m\in N^+$ .

上式乘以 $\lambda_m(>0)$ ,得

$\begin{equation} \lambda_m(y_m-f(x^0))\geq t_m^{k-1}\langle \xi,\lambda_m t_m u_m\rangle +t_m^{k-1} \|t_m\lambda_m u_m\|r(t_m,u_m),\,\forall m\in N^+. \end{equation}$

(2.4)

此时,

(i) 当 $k=1$ 时,上式两边对 $m\rightarrow+\infty$ 取极限,并注意到(2.3)式,则有 $y\geq \langle \xi,x\rangle ,$ 即 $\langle (-\xi,1)\cdot(x,y) \rangle \geq 0.$ 所以 $(-\xi,1)\in T^+[E_f,(x^0,f(x^0))]$ .

(ii) 当 $k\geq 2$ 时,(2.4)式两边对 $m\rightarrow +\infty$ 取极限,得 $y\geq 0.$ 即 $\langle (0,1)\cdot(x,y)\rangle \geq 0.$ 从而 $(0,1)\in T^+[E_f,(x^0,f(x^0))].$

`` $\Rightarrow$ ". 设 $k\in N^+,(-\xi,1)\in T^+[E_f,(x^0,f(x^0))]$ ,任一 $(t_m,u_m)\in R^{++}\times \Gamma$ 收敛,且 $t_m\rightarrow 0^+$ $(m\rightarrow +\infty)$ .

令 $z_m=(t_m u_m,f(x^0+t_m u_m)-f(x^0)),\forall m\in N^+.$ 为证明简洁, 不妨假设 $\ z_m/\|z_m\|\rightarrow(x,y)\in R^n\times R$ $(m\rightarrow+\infty)$ ,即

$\begin{equation} \frac{t_m u_m}{\|z_m\|}\rightarrow x~(m\rightarrow+\infty), \end{equation}$

(2.5)

且

$\begin{equation} \frac{f(x^0+t_m u_m)-f(x^0)}{\|z_m\|}\rightarrow y~(m\rightarrow +\infty) . \end{equation}$

(2.6)

因为

$\begin{eqnarray*} (x^0,f(x^0))+\|z_m\|\frac{z_m}{\|z_m\|} &=&(x^0,f(x^0))+z_m\\ &=&(x^0+t_m u_m,f(x^0+t_m u_m))\in E_f \end{eqnarray*}$

且

$\frac{z_m}{\|z_m\|}\rightarrow(x,y)~(m\rightarrow + \infty),$

所以

$(x,y)\in T[E_f,(x^0,f(x^0)].$

此时,分为 $x=0$ 与 $x\neq 0$ 两种情况.

(a) 若 $x=0$ ,我们分别讨论(i)、(ii).

由于 $\|(x,y)\|=1$ 且 $(-\xi,1)\in T^+[E_f,(x^0,f(x^0))]$ ,易得

$y=1.$

故

$\begin{equation} (x,y)=(0,1). \end{equation}$

(2.7)

由(2.5)、(2.6)、(2.7)式,对所有充分大的 $m\in N^+,$

$\frac{\langle \xi,t_m u_m\rangle }{\|z_m\|}<1/2$

与

$\frac{f(x^0+t_m u_m)-f(x^0)}{\|z_m\|}>1/2.$

从而对所有充分大的 $m\in N^+,$

$\begin{eqnarray} f(x^0+t_mu_m) &>&f(x^0)+1/2\|z_m\|\nonumber\\ &>&f(x^0)+\langle \xi,t_m u_m \rangle \nonumber\\ &=&f(x^0)+t_m\langle \xi,u_m \rangle +t_m\|u_m\|\cdot 0 . \end{eqnarray}$

(2.8)

这时,若 (i) $k=1$ ,则对于(2.8)式取 $c_m=0,\forall m\in N^+$ . 由定理2.5, $\xi\in\underline{\partial}^kf(x^0)$ .

若 (ii) $k\geq 2$ ,因为 $\xi=0\in R^n$ ,则(2.8)式变为

$f(x^0+t_m u_m)>f(x^0)+t_m^k\langle \xi,u_m \rangle +t_m^k\|u_m\|\cdot \xi .$

取 $c_m=0$ , $\forall$ 充分大的 $m\in N^+$ ,由定理2.5, $\xi=0\in\underline{\partial}^kf(x^0)$ .

(b) 若 $x\neq 0$ ,由(2.5)式,

$\|z_m\|/ t_m u_m \rightarrow 1/x~ (m\rightarrow +\infty).$

由于 $(x,y)\in T[E_f,(x^0,f(x^0))],(-\xi,1)\in T^+[E_f,(x^0,f(x^0))]$ ,故

$\langle (-\xi,1),(x,y)\rangle \geq 0.$

即

$\langle \xi,x \rangle \leq y.$

所以对 $\forall m\in N^+$ ,

$\begin{eqnarray} f(x^0+t_mu_m)&=&f(x^0)+\langle \xi,t_m u_m \rangle +\|z_m\|\{[f(x^0+t_m u_m) \nonumber\\ &&-f(x^0)]/\|z_m\|-\langle \xi,t_m u_m \rangle /\|z_m\|\} \nonumber\\ &\geq& f(x^0)+\langle \xi,t_m u_m\rangle +\|t_m u_m\|\cdot c_m, \end{eqnarray}$

(2.9)

其中,

$c_m=\|z_m\|/\|t_m u_m\|\{[f(x^0+t_mu_m)-f(x^0)]/\|z_m\|-\langle y,t_mu_m \rangle /\|z_m\|-y\}$

对 $\forall$ 充分大的 $m\in N^+$ .

由(2.6)式,上面 $c_m$ 中的

${\frac{f(x^0+t_mu_m)-f(x^0)}{\|z_m\|}-\frac{\langle \xi,t_mu_m\rangle }{\|z_m\|}}\rightarrow 0 ~ (m\rightarrow +\infty).$

故

$\lim_{m\to +\infty} c_m=0.$

于是,若(i) $k=1$ ,利用定理2.5与(2.9)式,有 $\xi\in\underline{\partial}f(x^0)$ .

若(ii) $k\geq 2$ , $x^0$ 是 $f$ 在 $R^n$ 上的局部极小点,则对任意充分大的 $m\in N^+$ ,

$\begin{equation} f(x^0+t_m u_m)\geq f(x^0). \end{equation}$

(2.10)

于是取 $\xi =0\in R^n$ ,利用(2.9)、(2.10)式可知 $c_m\geq 0$ , 对 $\forall$ 充分大的 $m\in N^+$ .

从而注意到 $k\geq 2$ 与(2.9)式,可得

$f(x^0+t_m u_m)\geq f(x^0)+t_m^k\langle 0,u_m\rangle +t_m^k\|u_m\|\cdot c_m$

对 $\forall$ 充分大的 $m\in N^+$ 成立.

又因为 $\lim\limits_{m\to +\infty} c_m=0$ ,所以由定理2.5,

$0\in \underline{\partial}^kf(x^0),$ 得证.

参考文献

[1]	Dini U. Fondamenti per la teoria delle funzioni di variabili reali. Pisa:Nistri, 1878
[2]	Avriel M. Nonlinear Programming. Englewood Cliffs, NJ:Prentice-Hall, 1976
[3]	Clarke F H. Generalized gradients and applications. Transactions of the American Mathematical Society, 1975, 205:247-262
[4]	Clarke F H. Optimization and Nonsmooth Analysis(second edition). Philadelphia, PA:SIAM, 1990
[5]	Michel P, Penot J-P. Calcul sous-differentiel pour les fonctions lipschiziennes et non lipschizienennes. C R Acad Sci Paris, 1984, 298:269-272
[6]	Michel P, Penot J-P. A generalized derivative for calm and stable functions. Differential and Integaral Equations, 1992, 5(2):433-454
[7]	Borwein J M, Zhu Q J. Techniques of Variational Analysis. New York:Springer, 2005
[8]	Hestense M R. Calculus of Varitions and Optimal Control Theory. New York:Wiley, 1966
[9]	Hestense M R. Optimization Theory. The Finite Dimensional Case. New York:Wiley, 1975
[10]	Borwein J M. Convex Analysis and Nonlinear Optimization(Theory and Examples). New York:Springer, 2000
[11]	Rockafellar R T. Convex Analysis. Princeton:Princeton University Press, 1970
[12]	Bazaraa M B, Shetty C M. 非线性规划-理论与算法. 王化存, 张春柏译. 贵阳:贵州人民出版社, 1986
[13]	Rockafellar R T, Wets R J-B. Variational Analysis. Berlin:Springer, 1998
[14]	Modukhovich B S. Variational Analysi and Generalized Differentiation, I:Basic Theory, Grundlehren Series(Fundamental Principles of Mathematical Sciences). Berlin:Springer, 2006
[15]	Schirotzek, W. Nonsmooth Analysis. Berlin:Springer, 2007
[16]	Ferrera J. An Introduction to Nonsmooth Analysis. New York:Academic Press, 2013
[17]	Kutateladze S S. Constructive Nonsmooth Analysis and Related Topics. New York:Springer, 2014
[18]	Georgiev P G, Zlateva N P. Second-order subdifferentials of C1,1 functions and optimality conditions. Set-Valued Analysis, 1996, 4(2):101-117
[19]	Studniarski M. Necessary and sufficient conditions for isolated local minima of nonsmooth functions. SIAM Journal on Control and Optimization, 1986, 24:1044-1049
[20]	Jiménez B, Novo V. Higher-order optimality conditions for strict local minima. Annual of Operational and Research, 2008, 157:183-192