带跳跃平均场倒向随机微分方程的线性二次最优控制
Linear-Quadratic Optimal Control Problems for Mean-Field Backward Stochastic Differential Equations with Jumps
通讯作者:
收稿日期: 2016-12-9
基金资助: |
|
Received: 2016-12-9
Fund supported: |
|
该文研究了一类随机线性二次最优控制问题,其中状态方程是由泊松随机鞅测度和布朗运动共同驱动的平均场类型的倒向随机微分方程.首先,通过经典的凸变分原理获得了最优控制的存在性与唯一性;其次,利用对偶方法给出了最优控制的随机哈密顿系统刻画,这里的随机哈密顿系统是由状态方程、对偶方程和最优控制的对偶刻画构成的一个完全耦合的具有跳跃的平均场正倒向随机微分方程;最后,利用解耦技术,通过引入两个黎卡提方程和一个平均场倒向随机微分方程对随机哈密顿系统进行解耦,进而获得最优控制的反馈表示.
关键词:
This paper is concerned with a linear quadratic optimal control problem for meanfield backward stochastic differential equations driven by a Poisson random martingale measure and a Brownian motion. Firstly, by the classic convex variation principle, the existence and uniqueness of the optimal control is obtained. Secondly, the optimal control is characterized by the stochastic Hamilton system which turns out to be a linear fully coupled mean-field forward-backward stochastic differential equation with jumps by the duality method. Thirdly, in terms of a decoupling technique, the stochastic Hamilton system is decoupled by introducing two Riccati equations and a MF-BSDE with jumps. Then an explicit representation for the optimal control is obtained.
Keywords:
本文引用格式
唐矛宁, 孟庆欣.
Tang Maoning, Meng Qingxin.
1 引言
由于在经济和金融中的应用,平均场类型的随机最优控制问题近年来被广泛研究.与经典的随机最优控制问题不同,平均场类型的随机最优控制问题的性能指标函数的漂移和扩散系数不仅取决于状态和控制,而且还取决于状态控制部分的概率分布.平均场的存在使得最优控制问题变得时间不一致,此时动态规划原理(DPP)不再适用,这就推动了人们利用随机最大原理(SMP)对其进行求解.对于平均场类型的SMP更多的研究成果,可以参见文献[1-3, 6, 9, 12, 16-17, 22-23, 25-28]等.2013年,仅由布朗运动驱动的平均场随机微分方程(简称MF-SDE)的线性二次(简称LP)最优控制问题被Yong[29]系统地研究,并通过引入两个唯一可解的黎卡提方程,得到了最优控制的反馈表示.在文献[29]以后,在相关论题及其应用方面取得了许多成果(例如文献[8, 10, 13-15, 18-21, 26]). 2016年, Tang和Meng[24]将文献[29]中的结果推广到了跳跃扩散系统,获得相应的理论结果.直观地说,由一个MF-SDE所驱动的受控状态方程的对偶方程是一个平均场倒向随机微分方程(简称MF-BSDE).因此,从文献[4]和[5]建立了关于MF-BSDE的存在唯一性理论以来,平均场类型的随机最优控制问题的最大值原理已经成为了一个研究热点.由于一个MF-BSDE是定义良好的动态系统,在随机控制理论和数学金融学中具有重要应用,因此考虑MF-BSDE的最优控制问题是必要且自然的.2016年, Li, Sun和Xiong[11]首次研究了仅由布朗运动驱动的MF-BSDE系统的LQ问题.在该研究中,他们通过一种变分法获得了最优化系统,并通过引入两个耦合的黎卡提方程和一个MF-BSDE来解耦最优化系统.最后,他们得到了最优控制的状态反馈表示.本文的目的是将文献[11]的LQ问题推广到平均场类型的倒向跳跃扩散系统,并建立相应的理论结果.更准确地说,第2节介绍本文要使用的基本符号,提出所要讨论的LQ问题.第3节,通过在标准假设下的经典凸变分原理,得到LQ问题最优控制的存在唯一性.第4节,首先建立了相应的随机哈密顿系统最优控制的对偶刻画.这里随机哈密顿系统是一带跳平均场类型的完全耦合的正向随机微分方程,其可解性非常困难.然后,引入两个黎卡提方程和一个带跳的MF-BSDE来解耦,并解出随机哈密尔顿系统.最后,对状态反馈控制的最优性给出了相应的验证.
2 记号与问题提出
2.1 记号
设
2.2 问题的提出
考虑如下由布朗运动
和二次性能指标
其中
对任一可允许控制过程
下面给出本文所要研究的带跳的平均场倒向随机线性二次最优控制问题.
问题 2.1 对于任意给定的
成立.
任意满足上述等式的
接下来,给出本文的基本假设.
假设 2.1 矩阵值函数
假设 2.2
下面的结果给出了状态方程(2.1)的适定性,以及一些实用的估计.
引理 2.2 设假定2.1成立.则对于任意
和
假设
这里定义
另外,
证 方程解的存在唯一性可以由经典的方法即压缩映象原理直接得证.对于估计(2.4)和(2.6),可以通过对
其中,利用了如下的基本不等式:对于任意
证明完毕.
因此,由引理2.2,可以断言问题2.1是定义良好的.
3 最优控制的存在唯一性
在这一节中,将研究问题2.1最优控制的存在唯一性.为此,首先给出性能指标(2.2)的一些基本性质.
引理 3.1 设假设2.1和2.2成立.则对于任意
证 设
利用估计(2.4)和(2.6)可得
则
因此,性能指标
引理 3.2 设假设2.1和2.2成立.则对于任意给定的
证 由于加权矩阵是非随机的,故容易验证
因此由
这意味着
引理 3.3 设假设2.1和2.2成立.则对于任意给定的
其中
证 设
因此,根据(3.8)式和性能指标函数
另一方面,由估计(2.4)可得
因此
这意味着
注 3.1 由于性能指标函数
下面给出并证明问题2.1最优控制的存在唯一性.
定理 3.4 设假设2.1和2.2成立.则问题2.1存在唯一的最优控制.
证 既然可允许控制集
定理 3.5 设假设2.1和2.2成立.则一可允许控制
即
证 对于必要性,假设
和
这意味着
对于充分性,设
这意味着
4 随机哈密顿系统、解耦、黎卡提方程、最优控制的表示
4.1 随机哈密顿系统
本节将利用随机哈密尔顿系统对问题2.1的最优控制进行对偶刻画.为简化的记号,在下文中,在不致混淆的情况下,我们将省略时间变量s.
定理 4.1 设假设2.1和2.2成立.则一可允许四元组
此处
证 设
另一方面,由文献[23]可知方程(4.2)存在唯一的适应解
将(4.4)式代入(4.3)式,
对于必要性,设
对于充分性,设
最后引入所谓的随机哈密顿系统,它由状态方程(2.1),对偶方程(4.2)和对偶刻画(4.1)构成如下
这是一个带跳跃完全耦合的正倒向随机微分方程(简称MF-FBSDE),它的解由
定理 4.2 设假设2.1和2.2成立.则随机哈密顿系统(4.8)存在唯一解
证 由定理3.4可知,问题2.1存在唯一最优的四元组
总之,随机哈密尔顿系统(4.8)完全刻画了问题2.1的最优控制.因此,求解问题2.1等价于求解随机哈密尔顿系统(4.8),并且唯一的最优控制可以通过(4.1)式给出.对(4.1)式的两边取期望可得
这意味着
再由(4.1)式可以得到
再将(4.9)式代入(4.10)式,有
4.2 黎卡提方程的推导
由定理4.2可知假设2.1和2.2下,随机哈密尔顿系统(4.8)存在唯一解
此外,容易检验
现在假设状态过程
其中
这里
和
定义
其中
下面将形式地推导
比较上述等式两边的扩散项和漂移项,有
和
这意味着
接着对(4.20)和(4.21)式两边求期望,有下列关系:
假设
将(4.30)和(4.31)式代入(4.23)式可得
因此形式上有
进一步由(4.16)和(4.12)式可得
将(4.16), (4.28)和(4.29)式代入等式左边并比较上述等式两端可得
因此,形式上有
此外,比较(4.16)和(4.17)两方程两端的终端值应有
所以,通过(4.33)和(4.36)式可知
且
和文献[11]的第四部分一样,在假设2.1和2.2下,可以证明黎卡提方程(4.37)和(4.38)分别有唯一解.
4.3 最优控制的表示
本节将通过对黎卡提方程(4.37), (4.38)和MF-BSDE (4.39)的解,给出最优控制的解析公式.主要结果表述如下:
定理 4.3 设假设2.1和2.2成立.设
且对于终端状态
证 设
对
此外,将(4.41)-(4.44)式代入(4.40)式并根据前面小节中Riccati等式的推导,
由(4.41)式可得
因此,混合(4.45), (4.46)和(4.47)式,可得
因此,根据定理4.2得出由(4.41)式定义的
5 结论
本文发展了具有跳跃和确定性系数的平均场倒向随机微分方程的线性二次最优控制理论.其中最优控制过程可由对偶过程和两个黎卡提方程的解进行反馈表示.在后续的研究中,将对无限时区的这类线性二次问题进行探讨和研究.
参考文献
A maximum principle for SDEs of mean-field type
,DOI:10.1007/s00245-010-9123-8 [本文引用: 1]
A maximum principle for stochastic control with partial information
,
A general stochastic maximum principle for SDEs of mean-field type
,DOI:10.1007/s00245-011-9136-y [本文引用: 1]
Mean-field backward stochastic differential equations:a limit approach
,DOI:10.1214/08-AOP442 [本文引用: 1]
Mean-field backward stochastic differential equations and related partial differential equations
,DOI:10.1016/j.spa.2009.05.002 [本文引用: 1]
A stochastic maximum principle for delayed mean-field stochastic differential equations and its applications
,
Discrete time mean-field stochastic linear-quadratic optimal control problems
,DOI:10.1016/j.automatica.2013.08.017 [本文引用: 1]
A mean-field maximum principle for optimal control of forward-backward stochastic differential equations with Poisson jump processes
,DOI:10.1007/s40435-013-0027-8 [本文引用: 1]
A linear-quadratic optimal control problem for mean-field stochastic differential equations in infinite horizon
,
Stochastic maximum principle in the mean-field controls
,DOI:10.1016/j.automatica.2011.11.006 [本文引用: 1]
Linear quadratic optimal control problem for partially observed forward backward stochastic differential equations of mean-field type
,
Output feedback H∞ control for discrete time mean-field stochastic systems
,
H∞ control for continuous time mean-field stochastic systems
,DOI:10.1002/asjc.1290 [本文引用: 1]
Optimal control of mean-field jump-diffusion systems with delay:A stochastic maximum principle approach
,DOI:10.1016/j.cam.2014.10.011 [本文引用: 1]
A mean-field stochastic maximum principle via Malliavin calculus
,DOI:10.1080/17442508.2011.651619 [本文引用: 1]
Finite-horizon indefinite mean-field stochastic linear-quadratic optimal control
,DOI:10.1016/j.ifacol.2015.12.127 [本文引用: 1]
Indefinite mean-field stochastic linear-quadratic optimal control
,
Maximum principle for mean-field jump diffusion stochastic delay differential equations and its application to finance
,DOI:10.1016/j.automatica.2014.03.021 [本文引用: 1]
The maximum principle for a jump-diffusion mean-field model and its application to the mean-variance problem
,DOI:10.1016/j.na.2013.02.029 [本文引用: 2]
Stochastic maximum principle for mean-field type optimal control under partial information
,DOI:10.1109/TAC.2013.2273265 [本文引用: 1]
Linear-quadratic optimal control problems for mean-field stochastic differential equations
,DOI:10.1137/120892477 [本文引用: 3]
/
〈 | 〉 |