平均场正倒向随机控制系统的最大值原理
A General Maximum Principle for Forward-Backward Stochastic Control Systems of Mean-Field Type
收稿日期: 2017-12-5
基金资助: |
|
Received: 2017-12-5
Fund supported: |
|
作者简介 About authors
李瑞敬,E-mail:
该文研究具有时间不连续效用函数的平均场随机系统最优控制问题.其中,扩散项系数包含控制变量且控制区域非凸.借助于延拓的Ekeland变分原理及递归方法,建立平均场理论框架下一般形式的随机最大值原理.最后,求解一个线性二次问题以论证结果的可行性.
关键词:
The present paper concerns with optimal control problems allowing for time inconsistent utility functions for instance of mean-field stochastic systems. Moreover, the control variable enters the diffusion coefficient and the control domain is non-convex. Via extended Ekeland's variational principle as well as the reduction method, a general stochastic maximum principle is established in the framework of mean-field theory. Finally, a linear-quadratic example is worked out to illustrate the application of the results.
Keywords:
本文引用格式
李瑞敬.
Li Ruijing.
1 引言
近年来,平均场方法被广泛应用于金融学、统计力学、博弈论等多学科领域.这些领域所涉及的系统大多是平均场类型,即:性能指标、漂移项系数、扩散性系数不仅依赖于状态过程,还依赖于状态过程的概率分布.这种情形下,平均场效益函数具有时间不连续性,以致Bellman动态规划原则不再成立.因此,涉及到这类效用函数的最优控制问题不能用经典的HJB方程来解决.故本文通过Pontryagin最大值原理研究平均场背景意义下的委托代理问题.
2009年, Buckdahn等人在文献[4]首次研究了非线性平均场倒向随机微分方程.随后,文献[5]利用经典倒向随机微分方程(BSDEs)方法给出相应于平均场BSDEs的非局部偏微分方程的概率解释.此后,平均场正倒向随机微分方程理论得到广泛发展,且针对McKean-Vlasov类型的系统[8]已取得丰富成果.如:文献[6]利用罚方法构造逼近解证明了最优转换问题中一阶平均场策略方程解的存在性;文献[10]通过将拆分法转化为BSDEs方法给出分布方程的适定性,进一步,通过对系数的正则性假设,证明了其值函数为相应平均场非局部拟线性积分偏微分方程唯一经典解的结论.另一方面,随着平均场正倒向随机微分方程理论的完善,有关平均场框架下随机控制问题的研究得到快速发展.如:文献[3]通过尖变分技术建立了彭-类型的随机最大值原理.当此受控系统包含马尔可夫跳参数时,文献[14]给出了平均场随机线性二次最优控制问题的最大值原理.文献[15]则利用随机最大值原理得到有限时区平均场最优控制问题显式可解的充分必要条件.更多结果可参考文献[9, 11, 13, 16-17].
可以看到,当控制系统具有终端约束且控制区域非凸时,相应的随机最大值原理都是建立在罚泛函的下半连续性要求基础之上的.因此,如何降低这一要求目前还是一个新问题.本文尝试利用延拓的Ekeland变分原理解决这一问题,并在一般控制域情形下借助于递归方法建立平均场正倒向随机微分方程的最大值原理.需要指出的是,由于延拓的Ekeland变分原理的应用,这里所使用的递归方法是不同于文献[18].
2 预备知识
设
设
考虑如下受控的平均场正倒向随机微分方程
其中
注2.1 方程
相应于系统
其中
定义容许控制集为
问题A 找到一个
若
(H
(H
注2.2 在条件(H
在系统
问题B 在
其状态方程为
且具有最优状态约束
注2.3 由文献[2,定理2]知,在条件(H
对于问题A,系统
定理2.1[1] 设
(ⅰ)对所有
(ⅱ)对所有
(ⅲ)对所有
若对某个
3 最大值原理
现在我们来求解问题B.首先,假定
空间
其中
显然,
令
是闭集.事实上,令
注意到
其中
同理有
由(H
故
进一步,不难验证
从而由定理2.1知,存在
进一步有
这一结论意味着控制过程
其中
为简便记
这些记号对于它们相应导数仍然适用.假设
其中
容易验证方程组
引理3.1 假设(H
其中
证 详情可参阅文献[12,引理2.1].
引理3.2 假设(H
其中
证 由引理3.1、BDG不等式及Gronwall不等式可直接推出结论.
为了建立问题
一阶,二阶伴随方程分别为
定理3.1 假设(H
证 证明分为两步.
第一步 令
由
应用引理3.1、引理3.2及Taylor展式得
令
则
为了去掉上述不等式中的
其中
对
注意到
因此,由平均场倒向随机微分方程解对参数的连续依赖性知,当
类似地,存在
第二步 一般控制域情形.
首先,假设
易见
同样地,存在
由
定理3.2 假设(H
注3.1 若我们只考虑
4 实际应用
考虑最优控制问题.
问题C 在
其状态方程为
其中
显然,方程组(4.2)-(4.5)分别存在唯一解.因
其次,在
最后,在
进而有
其中
命题4.1 由
证 假设
对
利用
另外,由
这意味着
参考文献
Well-posedness of mean-field type forward-backward stochastic differential equations
,DOI:10.1016/j.spa.2015.04.006 [本文引用: 2]
A general stochastic maximum principle for SDEs of mean-field type
,DOI:10.1007/s00245-011-9136-y [本文引用: 1]
Mean-field backward stochastic differential equations. A limit approach
,
Mean-field backward stochastic differential equations and related partial differential equations
,DOI:10.1016/j.spa.2009.05.002 [本文引用: 1]
Weakly coupled mean-field game systems
,DOI:10.1016/j.na.2016.05.017 [本文引用: 1]
Relationship between backward stochastic differential equations and stochastic controls:a linear-quadratic approach
,DOI:10.1137/S036301299834973X [本文引用: 1]
Stochastic maximum principle in the mean-field controls
,DOI:10.1016/j.automatica.2011.11.006 [本文引用: 1]
Mean-field forward and backward SDEs with jumps and associated nonlocal quasi-linear integralPDEs
,DOI:10.1016/j.spa.2017.10.011 [本文引用: 1]
A maximum principle for fully coupled stochastic control systems of mean-field type
,DOI:10.1016/j.jmaa.2014.02.008 [本文引用: 1]
Maximum principle for partially observed risk-sensitive optimal control problems of meanfield type
,DOI:10.1016/j.ejcon.2016.05.002 [本文引用: 1]
A mean-field stochastic maximum principle via Malliavin calculus
,DOI:10.1080/17442508.2011.651619 [本文引用: 1]
Mean-field stochastic linear-quadratic optimal control with Markov jump parameters
,DOI:10.1016/j.sysconle.2016.04.002 [本文引用: 1]
Necessary and sufficient solution to optimal control for linear continuous time meanfield system
,DOI:10.1016/j.ifacol.2017.08.298 [本文引用: 1]
The maximum principle for a jump-diffusion mean-field model and its application to the mean-variance problem
,DOI:10.1016/j.na.2013.02.029 [本文引用: 1]
An optimal control problem for mean-field forward-backward stochastic differential equation with noisy observation
,DOI:10.1016/j.automatica.2017.07.018 [本文引用: 1]
A general maximum principle for optimal control of forward-backward stochastic systems
,DOI:10.1016/j.automatica.2013.02.005 [本文引用: 3]
/
〈 | 〉 |