非齐次马氏决策过程的齐次化

数学物理学报 ›› 1997, Vol. 17 ›› Issue (4): 432-438.

非齐次马氏决策过程的齐次化

侯振挺, 郭先平

长沙铁道学院科研所长沙 410075

收稿日期:1996-04-22 出版日期:1997-08-26 发布日期:1997-08-26
基金资助:
国家自然科学基金

The Homogenization of Non-homogeneous Markov Decision Processes

Hou Zhenting, Guo Xianping

Changsha Railway University 410075

Received:1996-04-22 Online:1997-08-26 Published:1997-08-26

摘要/Abstract

摘要： 该文考虑的是可数状态空间有限行动空间非齐次马氏决策过程的期望总报酬准则.与以往不同的是,我们是通过扩大状态空间的方法,将非齐次的马氏决策过程转化成齐次的马氏决策过程,于是非常简洁地得到了按传统的方法所得的主要结果.

关键词: 马氏决策过程, 非齐次, 齐次, 期望总报酬准则, 最优策略

Abstract: In this paper we consider the homogenization of Non-homogneous Markov decision model with expected total reward criterion.denumerable state space and finite action spaces. We translate the non-homogeneous Markov decision processes into a homegeneous one by the method of extanding state space which is different from the usual one, and then we easily obtain the mail results obtained by usual method. Specially, the mail results obtained by K. Hinderer.

Key words: Markov decision processes, Non-homogeneous, Homogenization, Optimal policies

侯振挺, 郭先平. 非齐次马氏决策过程的齐次化[J]. 数学物理学报, 1997, 17(4): 432-438.

Hou Zhenting, Guo Xianping. The Homogenization of Non-homogeneous Markov Decision Processes[J]. Acta mathematica scientia,Series A, 1997, 17(4): 432-438.

[1]	梁海华, 陈玉明, 岑秀丽. 一类拟齐次多项式中心的极限环分支[J]. 数学物理学报, 2018, 38(1): 1-9.
[2]	陈鹏飞. 三维非齐次不可压MHD方程组在Slip边界条件下的无粘无电阻极限[J]. 数学物理学报, 2018, 38(1): 83-95.
[3]	胡晓梅. 关于齐次Moran集的packing维数结果[J]. 数学物理学报, 2016, 36(5): 873-878.
[4]	李琴, 杨作东. 带有非线性边界条件的非齐次拟线性椭圆型方程组的多解性[J]. 数学物理学报, 2016, 36(2): 307-316.
[5]	宋乃琪, 赵纪满. 与Full-Laplacian算子相关的波方程的色散估计和Strichartz估计[J]. 数学物理学报, 2016, 36(1): 90-116.
[6]	吴元泽, 吴宗芳, 刘增. 关于含非齐次Dirichlet边值的Brézis-Nirenberg问题的研究[J]. 数学物理学报, 2015, 35(6): 1025-1043.
[7]	樊自安. 包含Caffarelli-Kohn-Nirenberg临界指数的非齐次椭圆方程[J]. 数学物理学报, 2015, 35(5): 884-894.
[8]	赵杰. 椭圆重复齐次化问题W₀^1,p[J]. 数学物理学报, 2015, 35(3): 525-533.
[9]	杨芬. 全空间上一类半线性双调和方程正解的衰减[J]. 数学物理学报, 2015, 35(2): 282-287.
[10]	匡杰,王泽军. 非齐次Burgers方程周期解的大时间行为[J]. 数学物理学报, 2015, 35(1): 1-14.
[11]	梁占平, 苏加宝. 具有凸凹项非齐次拟线性椭圆方程的多解性[J]. 数学物理学报, 2014, 34(2): 217-226.
[12]	黄改改, 冯光庭, 张兴安. 一类平面三次拟齐次向量场的全局拓扑结构[J]. 数学物理学报, 2014, 34(2): 419-425.
[13]	王立伟, 瞿萌, 束立生. 齐次Morrey-Herz空间中高阶交换子的中心BMO估计[J]. 数学物理学报, 2014, 34(2): 426-436.
[14]	周树清, 胡振华, 彭冬云. 一类A -调和方程的障碍问题的很弱解的全局正则性[J]. 数学物理学报, 2014, 34(1): 27-38.
[15]	谢华朝, 李素丽. 一类非齐次临界椭圆方程在R^N中的正解[J]. 数学物理学报, 2013, 33(6): 1099-1111.