Loading [MathJax]/jax/element/mml/optable/BasicLatin.js
  数学物理学报  2015, Vol. 35 Issue (5): 927-935   PDF (301 KB)    
扩展功能
加入收藏夹
复制引文信息
加入引用管理器
Email Alert
RSS
本文作者相关文章
黄正刚
一种新的广义次梯度及其性质
黄正刚    
重庆理工大学数学与统计学院 重庆 400054
摘要: 该文提出了一种新的广义次梯度,讨论了与Tangent锥相关的一些基本性质,且在部分性质基础上得出了含不等式与任意集约束下非凸非可微标量最优化问题的k阶严格局部极小点存在的必要与充分条件以及无约束非凸非可微标量最优化问题局部极小点存在的必要条件.
关键词: k-下(上)次梯度     Tangent锥     k阶严格局部极小点     局部极小点     最优性条件    
A New Notion of Generalized Subgradients and Its Properties
Huang Zhenggang     
College of Mathematics and Statistics, Chongqing University of Technology, Chongqing 400054
Abstract: This paper proposes a new notion of generalized subgradients and discusses some properties of it in terms of Tangent cone. Using some of those properties, necessary and sufficient optimality conditions for a nonconvex and nondifferentiable scalar optimization problem with inequalities constraints and an arbitrary set constraint are derived, also a necessary condition for a nonconvex and nondifferentiable unconstrained scalar optimization problem is derived.
Key words: k-Lower(upper)subgradient     Tangent cone     Strict local minimizer of order k     Local minimizer     Optimality conditions    
1 引言及预备知识

N,RRn分别表示自然数集,实数集与n 维欧氏空间, N+={xN:x>0}, R++={xR:x>0},是欧氏范数, 是欧氏空间中两个元素的数量积,Γ={vRn:v=1}, A×B为集合AB的笛卡尔积,Ef为函数f的上图像.

在最优化理论中,次梯度是一个基本而又重要的理论工具. 利用各种次梯度及其基本性质[1, 2, 3, 4, 5, 6, 7], 可以得到非可微最优化问题的一阶或二阶最优性条件. 在最优化理论和凸分析较早研究时, 人们利用普通方向导数(双侧方向导数)定义了凸函数在一点的次梯度与次微分的重要概念.

定义1.1[8, 9, 10, 11, 12, 13, 14]   设凸函数f:RnR{+} 在点x0MRn 的函数值有限. 向量ξRn被称为是fx0 的次梯度,如果

ξ,f(x0,),

其中,ξ,f(x0,)分别表示ξRn中任一向量的数量积、 fx0沿同一方向的普通方向导数. 并称集合 f(x0):={ξRn:ξ,uf(x0,u),uRn}f在点x0的次微分.

对于以上凸次梯度(凸次微分), 人们研究了它的一些基本性质与凸函数极小点存在的必要与充分条件. 后来,针对更一般的标量函数, 人们利用Dini、Clarke、M-P等方向导数,提出了更广义的次梯度(次微分): Dini、Clarke、M-P等次梯度(次微分)等[1, 2, 3, 4, 5, 6, 7],并讨论了相应的基本性质. 其实,这些定义是在一定的空间中,将上面的普通方向导数分别换成Dini、 Clarke、M-P等方向导数后所得结果. 关于一阶次微分完整、 系统的基本理论可见文献[13, 14, 15, 16, 17]. 对于二阶次微分,Georgiev给出了 C1,1 函数在一点的Clarke 型二阶次微分定义.

定义1.2[18]    设E是实Banach空间,GE 是非空开集, f:GRC1,1 函数,x0G. 对每一个h1,h2E,称

f00(x0,h1,h2):=lim sup

fx^0处沿方向h_1,h_2的二阶方向导数. 并称集合

\partial_C ^2 f(x^0):=\{l\in L(E\times E):l(h_1,h_2)\leq f^{00}(x^0,h_1,h_2), \forall h_1,h_2 \in E\}

fx^0的次微分,其中每一个元素l称为fx^0 的二阶次梯度. 这里,f'(x)表示fx的导数, L(E\times E)表示E\times E上的所有连续双线性泛函组成的集合.

在以上一阶凸、Dini、Clarke 和M-P次微分、二阶次微分定义形式的启发下, 我们提出基于k(k\geq 1)阶下、上Studniarski方向导数的k -下、 上次梯度(次微分)的概念. 而且,它在某种条件下可退化为一阶凸次梯度(次微分) (见本文p3注2.1(b)),故与Dini、Clarke和M-P次梯度(次微分)一样, 是一种广义次梯度(次微分),而且当k\geq2时,还是一种高阶广义次梯度(次微分); 另外,此概念在以前研究中从未出现过,所以是一种新的广义次梯度(次微分).

本文并不专门讨论该广义次微分是否具有凸性、闭性以及单调性等基本性质, 而主要研究与Tangent锥相关的一些重要结论,利用某些性质分别导出了 约束与无约束条件下标量最优化问题关于k阶严格局部极小点与局部极小点存在的最优性条件.

定义1.3   设函数 f:R^n\rightarrow R,x^0\in M\subset R^n. 集合M在点 x^0 处的Tangent锥(简称T -切锥)定义为

T(M,x^0)=\{v \in R^n: \exists x_m \in M,x_m\rightarrow x^0,\exists \lambda_m>0,\lambda_m(x_m-x^0)\rightarrow v\}.

定义1.4   在定义1.3基础上,T -切锥的正极锥定义为

T^+(M,x^0)=\{ \xi \in R^n:\langle \xi,y\rangle \geq0,\forall y\in T(M,x^0)\}.

定义1.5   设f:R^n \rightarrow R\bigcup\{+\infty\}在点x^0处函数值有限, 则f 在点x^0处沿方向v \in R^n 的Hadamard 方向导数及下、上 Hadamard 方向导数分别是

df(x^0,v)=\lim_{(t,u)\to(0^+,v)}\frac{f(x^0+tu)-f(x^0)}{t}, \underline{d}f(x^0,v)=\liminf_{(t,u)\to(0^+,v)}\frac{f(x^0+tu)-f(x^0)}{t}

\overline{d}f(x^0,v)=\limsup_{(t,u)\to(0^+,v)}\frac{f(x^0+tu)-f(x^0)}{t}.

定义1.6[19]    设f:R^n \rightarrow R\bigcup\{+\infty\}在点x^0处函数值有限, k\in N^+,则f 在点x^0 处沿方向v \in R^nk阶下、上 Studniarski 方向导数定义为

\underline{d}^kf(x^0,v)=\liminf_{(t,u)\to(0^+,v)}\frac{f(x^0+tu)-f(x^0)}{t^k}

\overline{d}^kf(x^0,v)=\limsup_{(t,u)\to(0^+,v)}\frac{f(x^0+tu)-f(x^0)}{t^k}.

定义1.7[19, 20]   设f:R^n\rightarrow R,x^0\in M\subset R^n, 若存在常数\alpha >0与点x^0 的某一邻域U,使得

f(x)>f(x^0)+\alpha{\|x-x^0\|}^k,\forall x\in M\cap U\backslash\{x^0\},

则称x^0f(x)(x\in M)k阶严格局部极小点. 所有这样的点组成的集合记为\mbox{StrL}(k,f,M)

.

定义1.8   设f:R^n\rightarrow R,x^0\in M\subset R^n, 若存在x^0 的某一邻域U,使得

f(x)\geq f(x^0),\forall x\in U\cap M,

则称x^0f(x)(x \in M)的局部极小点. 若M=R^n,则称x^0f (在R^n上)的局部极小点.

显然,f的下(上) Hadamard方向导数就是一阶下(上) Studniarski方向导数, f(x) (x \in M)k 阶严格局部极小点也是f(x) (x \in M) 的局部极小点.

2 k -下(上)次梯度及其性质

本节,我们研究k -下(上)次梯度的某些基本性质, 并给出约束与无约束条件下最优化问题的k阶严格局部极小点和局部极小点存在的必要与充分条件.

定义2.1   设k\in N^+, 函数f:R^n\rightarrow R,\,x^0\in R^n ,\,\xi \in R^n,\,r:R^{++}\times R^n \to R 满足当(t,u)\in R^{++}\times R^n收敛时(其中t\to 0), 有r(t,u)\to 0.\xif 在点x^0处关于rk - 下次梯度(简称为f 在点x^0k - 下次梯度),如果对任一(t,u)\in R^{++}\times R^n, 有

f(x^0+tu)\geq f(x^0)+t^k\langle \xi,u\rangle +t^k\|u\|r(t,u).

在此定义中,如果``\geq"改为``\leq"成立,则称\xif在点x^0k - 上梯度. 称\underline\partial^kf(x^0)=\{\xi\in R^n:\xi f 在点x^0k -下次梯度\} 为fx^0k - 下次微分, \overline{\partial}^kf(x^0)=\{\xi\in R^n:\xif在点x^0k -上次梯度\} 为fx^0k - 上次微分.

注2.1   (a) 当k=1时,若r(t,u)\equiv 0, 则k - 下(上)次梯度就是凸函数(凹函数)在点x^0 处的次梯度;

(b) 当k=1时, 若此定义中的不等号为等号,则f在点x^0处可微,且\xi=\nabla f(x^0).

因此,这里的k -下(上)次梯度其实是一种广义的次梯度.

下面所有内容均假设定义2.1中的函数r已知,现在我们来讨论这种广义次梯度的一些基本性质.

定理2.1   设k\in N^+,函数f:R^n\rightarrow R在点x^0处连续,则

(i) 如果\xi\in\underline{\partial}^kf(x^0),那么\langle \xi,v \rangle \leq\underline{d}^kf(x^0,v),\forall v \in \Gamma.

(ii) 如果\xi \in\overline{\partial}^kf(x^0), 那么\langle \xi,v \rangle \geq\overline{d}^kf(x^0,v),\forall v\in \Gamma .

  (i) 设\xi\in\underline{\partial}^kf(x^0), 则由定义2.1,对\forall(t,u)\in R^{++}\times \Gamma,有

\begin{eqnarray*} f(x^0+tu) &\geq &f(x^0)+t^k\langle \xi,u\rangle +t^k\|u\|r(t,u)\\ &=&f(x^0)+t^k\langle \xi,u\rangle +t^kr(t,u). \end{eqnarray*}

\frac{f(x^0+tu)-f(x^0)}{t^k}\geq \langle \xi,u \rangle +r(t,u).

从而

\liminf_{(t,u)\rightarrow(0^+,v)}\frac{f(x^0+tu)-f(x^0)}{t^k}\geq\langle \xi,v\rangle .

\langle \xi,v\rangle \leq\underline{d}^kf(x^0,v)

得证.

(ii) 同理可证.

考虑约束最优化问题

\mbox{(sp)} \left\{ \begin{array}{ll} \min & f \left( x \right) ,\\ \mbox{s.t.} & g \left( x \right) \in -D ,\\ & x \in Q , \end{array} \right.

其中,f:R^n\to R\cup\left\{+\infty\right\},g:R^n \to R^p,D\subset R^p 是一个内部非空的闭凸点锥,Q\subset R^n 是一个任意集合, S表示(sp)的可行集,点x^0\in S.

在该问题中,我们总假定fx^0处连续,gx^0处Hadamard方向可微, 即g 沿任一方向v\in R^n的 Hadamard 方向导数dg(x^0,v)均存在. 记 G=\{x\in R^n:g(x)\in -D\}, C_0(G,x^0)=\{v\in R^n:dg(x^0,v)\in \mbox{intcone}(-D-g(x^0)\}, C(G,x^0)=\{v\in R^n:dg(x^0,v)\in \mbox{clcone}(-D-g(x^0))\}, C(f,x^0)=\{v\in R^n: {\underline{d}}_rf(x^0,v)\leq 0\}, I_Q(x)=0/+\infty(x\in Q/\notin Q)Q 的指标函数.

文献[20,定理2.1,3.1,3.2]给出了问题(sp)k阶严格局部极小点存在的必要条件与充分条件.

引理2.1   设k\in N^+. 若x^0 \in \mbox{StrL}(k,f,G\cap Q), 则

\overline{d}^k f(x^0,v)>0,\,\forall v\in {C_0}(G,x^0)\cap T(Q,x^0)\backslash{\{0\}}.

引理2.2   设k\in N^+\mbox{且}k\geq 2.\forall v \in C(G,x^0)\cap T(Q,x^0)\cap C(f,x^0)\backslash{\{0\}},使得

\underline {d}^k(f+I_Q)(x^0,v)>0,

x^0\in \mbox{StrL}(k,f,G\cap Q).

引理2.3   如果对\forall v\in C(G,x^0)\cap T(Q,x^0)\backslash {\{0\}}, 有

\underline{d}(f+I_Q)(x^0,v)>0,

x^0\in \mbox{StrL}(1,f,G\cap Q).

现对于(sp),我们利用k -上次梯度,可得其k阶严格局部极小点存在的必要条件.

定理2.2   设k\in N^+,\,\xi\in \overline {\partial}^kf(x^0). 若x^0 \in \mbox{StrL}(k,f,G\cap Q),则有

\langle\xi,v\rangle>0,\forall v\in C_0(G,x^0)\cap T(Q,x^0)\backslash{\{0\}}.

  设\xi\in \overline {\partial}^k f(x^0),由定理2.1(ii), 对 \forall v\in C_0(G,x^0)\cap T(Q,x^0)\backslash{\{0\}},

\langle\xi,\frac{v}{\|v|}\rangle \geq \overline {d}^{k}f(x^0,\frac{v}{\|v\|}).

由已知及引理2.1,

\overline{d}^kf(x^0,\frac{v}{\|v\|})>0.

从而

\langle\xi,\frac{v}{\|v\|}\rangle >0.

\langle \xi,v\rangle >0,

得证.

显然,当C_0(G,x^0)\cap T(Q,x^0)=S时,定理2.2是凸函数局部极小点存在 必要条件的推广(参见文献[12,pp120,121,定理3.4.3]).

利用定理2.1、引理2.2、引理2.3以及k -下次梯度,我们可得(sp)k阶严格局部极小 点存在的充分条件如下.

定理2.3   设k\in N^+\mbox{且}k\geq 2. 若任给 \xi \in \underline {\partial}^k(f+I_Q)(x^0),有

\langle \xi,v\rangle>0,\forall v\in C(G,x^0)\cap T(Q,x^0)\cap C(f,x^0) \backslash {\{0\}},

x_0\in\mbox{StrL}(k,f,G\cap Q).

  任给\xi \in \underline {\partial}^k(f+I_Q)(x^0), 由定理2.1(i), 对\forall v\in C(G,x^0)\cap T(Q,x^0)\cap C(f,x^0)\backslash{\{0\}},

\langle \xi,\frac {v}{\|v\|}\rangle \leq \underline{d}^k(f+I_Q)(x^0,\frac{v}{\|v\|}),

\langle \xi,v\rangle \leq \underline{d}^k(f+I_Q)(x^0,v).

从而由已知及引理2.2,上面结论成立.

定理2.4   任给\xi\in \underline {\partial}(f+I_Q)(x^0),

\langle\xi,v\rangle>0,\forall v\in C(G,x^0)\cap T(Q,x^0)\backslash{\{0\}},

x_0\in \mbox{StrL}(1,f,G\cap Q).

   利用引理2.3,其证明过程与定理2.3类似.

明显地,当C(G,x^0)\cap T(Q,x^0)\cap C(f,x^0)=S时, 定理2.3是凸函数的局部极小点存在的(文献[12,pp120,121,定理3.4.3]) 充分条件的推广; 当C(G,x^0)\cap T(Q,x^0)=S时,定理2.4是该充分条件的推广.

下面我们继续讨论k -下(上)次梯度的其它性质.

定理2.5   设\xi\in R^n. 则\xi\in\underline{\partial}^kf(x^0) \LeftrightarrowR^{++}\times \Gamma中任一收敛序列(t_m,u_m)\rightarrow(0^+,v) (m\rightarrow +\infty), 存在其子序列(t_{m_j},u_{m_j})及某数列c_m\rightarrow 0(m\rightarrow +\infty)使得

f(x^0+t_{m_j}u_{m_j})\geq f(x^0)+t_{m_j}^k\langle \xi,u_{m_j} \rangle +t_{m_j}^kc_m,\forall j,m\in N^+.

  \Rightarrow". 设\xi\in\underline{\partial}^kf(x^0), 由定义2.1,对任一(t,u)\in R^{++}\times \Gamma,有

f(x^0+tu)\geq f(x^0)+t^k\langle \xi,u \rangle +t^k\|u\|r(t,u),

其中,r(t,u)\rightarrow 0 (当(t,u)\rightarrow (0^+,v) 时).

因为(t,u)\in R^{++}\times \Gamma,故当t>0充分小时,集合\{(t,u)\}有界. 设\forall(t_m,u_m)\in R^{++}\times \Gamma(t_m,u_m)\rightarrow(0^+,v), 则序列\{(t_m,u_m)\}有界. 取

(t_{m_j},u_{m_j})=(t_m,u_m), c_m=\|u_m\|r(t_m,u_m)=r(t_m,u_m),

\forall m\in N^+ 得证.

``\Leftarrow". 用反证法,设\xi\notin\underline{\partial}^kf(x^0). 现取r(t,u)=\min \{0,[f(x^0+tu)-f(x^0)-t^k\langle \xi,u \rangle]/t^k\|u\|\}, 则r(t,u)\leq 0,且当(t,u)\rightarrow(0^+,v)时,必然 r(t,u)\not\to 0. 从而存在数\beta>0,使得

\begin{equation} f(x^0+tu)-f(x^0)-t^k\langle \xi ,u \rangle <-\beta. \end{equation} (2.1)

由已知,t_mu_m\rightarrow0\in R^n (m\rightarrow +\infty), 从而存在其子序列\{t_{m_j}u_{m_j}\}使得t_{m_j}u_{m_j}\rightarrow 0\in R^n (j\rightarrow +\infty). 又由已知,存在数列c_m\rightarrow 0 (m\rightarrow +\infty),对充分大的j\in N^+,下式成立

\begin{equation} f(x^0+t_{m_j}u_{m_j})\geq f(x^0)+t_{m_j}^k\langle \xi,u_{m_j}\rangle +t_{m_j}^k\|u_{m_j}\|\cdot c_{m_j} \end{equation} (2.2)

所以由(2.1)、(2.2)式,

t_{m_j}^kc_{m_j}<-\beta

对任意充分大的j\in N^+ 成立.

上式当j\rightarrow +\infty时取极限,得 0\leq -\beta 矛盾.

\xi\in\underline{\partial}^kf(x^0).

定理2.6   设f:R^n \rightarrow R,\,x^0\in R^n,\,\xi \in R^n,\,k\in N^+, 那么下面结论成立.

(i) 设k=1. 则\xi\in\underline{\partial}^kf(x^0)\Leftrightarrow (-\xi,1)\in T^+[E_f,(x^0,f(x^0))].

(ii) 设 k\geq 2.x^0 fR^n上的局部极小点, 则0\in \underline{\partial}^kf(x^0)\Leftrightarrow(0,1)\in T^+[E_f, (x^0,f(x^0))].

  先证(i)、(ii)的``\Rightarrow",再证(i)、(ii) 的``\Leftarrow".

``\Rightarrow". 设k\in N^+ ,\xi\in\underline{\partial}^kf(x^0) (在(ii)中, 这时\xi=0\in R^n),\,(x,y)\in T[E_f,(x^0,f(x^0))].

T -切锥定义,存在数列\lambda_m>0 及序列(x_m,y_m)\in E_f, 使得

\lambda_m[(x_m,y_m)-(x^0,f(x^0))]\rightarrow(x,y),(m\rightarrow+\infty).

即当m\rightarrow+\infty时,

\begin{equation} [\lambda_m(x_m-x^0),\lambda_m(y_m-f(x^0))]\rightarrow(x,y). \end{equation} (2.3)

因为\xi\in \underline{\partial}^kf(x^0),所以对任一收敛序列 {(t_m,u_m)}\subset R^{++}\times \Gamma (其中t_m\rightarrow 0^+,m\rightarrow+\infty ), 由定义2.1,有

y_m\geq f(x_m)=f(x^0+t_mu_m)\geq f(x^0)+t_m^k\langle \xi,u_m\rangle +t_m^k\|u_m\|r(t_m,u_m),

\forall 充分大的m \in N^+ . 其中x_m=x^0+t_mu_m,\forall 充分大的m\in N^+,且r(t_m,u_m)\rightarrow 0 (m\rightarrow +\infty).

y_m-f(x^0)\geq t_m^{k-1}\langle \xi,t_mu_m\rangle +t_m^{k-1}\|t_mu_m\|r(t_m,u_m),

\forall 充分大的m\in N^+.

上式乘以\lambda_m(>0),得

\begin{equation} \lambda_m(y_m-f(x^0))\geq t_m^{k-1}\langle \xi,\lambda_m t_m u_m\rangle +t_m^{k-1} \|t_m\lambda_m u_m\|r(t_m,u_m),\,\forall m\in N^+. \end{equation} (2.4)

此时,

(i) 当k=1时,上式两边对 m\rightarrow+\infty 取极限,并注意到(2.3)式,则有 y\geq \langle \xi,x\rangle , \langle (-\xi,1)\cdot(x,y) \rangle \geq 0. 所以 (-\xi,1)\in T^+[E_f,(x^0,f(x^0))].

(ii) 当k\geq 2时,(2.4)式两边对m\rightarrow +\infty取极限,得 y\geq 0. \langle (0,1)\cdot(x,y)\rangle \geq 0. 从而 (0,1)\in T^+[E_f,(x^0,f(x^0))].

``\Rightarrow". 设k\in N^+,(-\xi,1)\in T^+[E_f,(x^0,f(x^0))],任一(t_m,u_m)\in R^{++}\times \Gamma 收敛,且t_m\rightarrow 0^+ (m\rightarrow +\infty).

z_m=(t_m u_m,f(x^0+t_m u_m)-f(x^0)),\forall m\in N^+. 为证明简洁, 不妨假设\ z_m/\|z_m\|\rightarrow(x,y)\in R^n\times R (m\rightarrow+\infty),即

\begin{equation} \frac{t_m u_m}{\|z_m\|}\rightarrow x~(m\rightarrow+\infty), \end{equation} (2.5)

\begin{equation} \frac{f(x^0+t_m u_m)-f(x^0)}{\|z_m\|}\rightarrow y~(m\rightarrow +\infty) . \end{equation} (2.6)

因为

\begin{eqnarray*} (x^0,f(x^0))+\|z_m\|\frac{z_m}{\|z_m\|} &=&(x^0,f(x^0))+z_m\\ &=&(x^0+t_m u_m,f(x^0+t_m u_m))\in E_f \end{eqnarray*}

\frac{z_m}{\|z_m\|}\rightarrow(x,y)~(m\rightarrow + \infty),

所以

(x,y)\in T[E_f,(x^0,f(x^0)].

此时,分为x=0x\neq 0两种情况.

(a) 若x=0,我们分别讨论(i)、(ii).

由于\|(x,y)\|=1(-\xi,1)\in T^+[E_f,(x^0,f(x^0))],易得

y=1.

\begin{equation} (x,y)=(0,1). \end{equation} (2.7)

由(2.5)、(2.6)、(2.7)式,对所有充分大的m\in N^+,

\frac{\langle \xi,t_m u_m\rangle }{\|z_m\|}<1/2

\frac{f(x^0+t_m u_m)-f(x^0)}{\|z_m\|}>1/2.

从而对所有充分大的m\in N^+,

\begin{eqnarray} f(x^0+t_mu_m) &>&f(x^0)+1/2\|z_m\|\nonumber\\ &>&f(x^0)+\langle \xi,t_m u_m \rangle \nonumber\\ &=&f(x^0)+t_m\langle \xi,u_m \rangle +t_m\|u_m\|\cdot 0 . \end{eqnarray} (2.8)

这时,若 (i) k=1,则对于(2.8)式取c_m=0,\forall m\in N^+. 由定理2.5, \xi\in\underline{\partial}^kf(x^0).

若 (ii)k\geq 2,因为\xi=0\in R^n,则(2.8)式变为

f(x^0+t_m u_m)>f(x^0)+t_m^k\langle \xi,u_m \rangle +t_m^k\|u_m\|\cdot \xi .

c_m=0,\forall充分大的m\in N^+,由定理2.5,\xi=0\in\underline{\partial}^kf(x^0).

(b) 若x\neq 0,由(2.5)式,

\|z_m\|/ t_m u_m \rightarrow 1/x~ (m\rightarrow +\infty).

由于(x,y)\in T[E_f,(x^0,f(x^0))],(-\xi,1)\in T^+[E_f,(x^0,f(x^0))] ,故

\langle (-\xi,1),(x,y)\rangle \geq 0.

\langle \xi,x \rangle \leq y.

所以对\forall m\in N^+,

\begin{eqnarray} f(x^0+t_mu_m)&=&f(x^0)+\langle \xi,t_m u_m \rangle +\|z_m\|\{[f(x^0+t_m u_m) \nonumber\\ &&-f(x^0)]/\|z_m\|-\langle \xi,t_m u_m \rangle /\|z_m\|\} \nonumber\\ &\geq& f(x^0)+\langle \xi,t_m u_m\rangle +\|t_m u_m\|\cdot c_m, \end{eqnarray} (2.9)

其中,

c_m=\|z_m\|/\|t_m u_m\|\{[f(x^0+t_mu_m)-f(x^0)]/\|z_m\|-\langle y,t_mu_m \rangle /\|z_m\|-y\}

\forall 充分大的 m\in N^+ .

由(2.6)式,上面c_m中的

{\frac{f(x^0+t_mu_m)-f(x^0)}{\|z_m\|}-\frac{\langle \xi,t_mu_m\rangle }{\|z_m\|}}\rightarrow 0 ~ (m\rightarrow +\infty).

\lim_{m\to +\infty} c_m=0.

于是,若(i) k=1,利用定理2.5与(2.9)式,有\xi\in\underline{\partial}f(x^0).

若(ii) k\geq 2,x^0fR^n上的局部极小点,则对任意充分大的m\in N^+,

\begin{equation} f(x^0+t_m u_m)\geq f(x^0). \end{equation} (2.10)

于是取\xi =0\in R^n,利用(2.9)、(2.10)式可知 c_m\geq 0, 对\forall充分大的m\in N^+.

从而注意到k\geq 2与(2.9)式,可得

f(x^0+t_m u_m)\geq f(x^0)+t_m^k\langle 0,u_m\rangle +t_m^k\|u_m\|\cdot c_m

\forall充分大的m\in N^+成立.

又因为\lim\limits_{m\to +\infty} c_m=0,所以由定理2.5,

0\in \underline{\partial}^kf(x^0), 得证.
参考文献
[1] Dini U. Fondamenti per la teoria delle funzioni di variabili reali. Pisa:Nistri, 1878
[2] Avriel M. Nonlinear Programming. Englewood Cliffs, NJ:Prentice-Hall, 1976
[3] Clarke F H. Generalized gradients and applications. Transactions of the American Mathematical Society, 1975, 205:247-262
[4] Clarke F H. Optimization and Nonsmooth Analysis(second edition). Philadelphia, PA:SIAM, 1990
[5] Michel P, Penot J-P. Calcul sous-differentiel pour les fonctions lipschiziennes et non lipschizienennes. C R Acad Sci Paris, 1984, 298:269-272
[6] Michel P, Penot J-P. A generalized derivative for calm and stable functions. Differential and Integaral Equations, 1992, 5(2):433-454
[7] Borwein J M, Zhu Q J. Techniques of Variational Analysis. New York:Springer, 2005
[8] Hestense M R. Calculus of Varitions and Optimal Control Theory. New York:Wiley, 1966
[9] Hestense M R. Optimization Theory. The Finite Dimensional Case. New York:Wiley, 1975
[10] Borwein J M. Convex Analysis and Nonlinear Optimization(Theory and Examples). New York:Springer, 2000
[11] Rockafellar R T. Convex Analysis. Princeton:Princeton University Press, 1970
[12] Bazaraa M B, Shetty C M. 非线性规划-理论与算法. 王化存, 张春柏译. 贵阳:贵州人民出版社, 1986
[13] Rockafellar R T, Wets R J-B. Variational Analysis. Berlin:Springer, 1998
[14] Modukhovich B S. Variational Analysi and Generalized Differentiation, I:Basic Theory, Grundlehren Series(Fundamental Principles of Mathematical Sciences). Berlin:Springer, 2006
[15] Schirotzek, W. Nonsmooth Analysis. Berlin:Springer, 2007
[16] Ferrera J. An Introduction to Nonsmooth Analysis. New York:Academic Press, 2013
[17] Kutateladze S S. Constructive Nonsmooth Analysis and Related Topics. New York:Springer, 2014
[18] Georgiev P G, Zlateva N P. Second-order subdifferentials of C1,1 functions and optimality conditions. Set-Valued Analysis, 1996, 4(2):101-117
[19] Studniarski M. Necessary and sufficient conditions for isolated local minima of nonsmooth functions. SIAM Journal on Control and Optimization, 1986, 24:1044-1049
[20] Jiménez B, Novo V. Higher-order optimality conditions for strict local minima. Annual of Operational and Research, 2008, 157:183-192
一种新的广义次梯度及其性质
黄正刚