摘要: 该文考虑的是可数状态空间有限行动空间非齐次马氏决策过程的期望总报酬准则.与以往不同的是,我们是通过扩大状态空间的方法,将非齐次的马氏决策过程转化成齐次的马氏决策过程,于是非常简洁地得到了按传统的方法所得的主要结果.
侯振挺, 郭先平. 非齐次马氏决策过程的齐次化[J]. 数学物理学报, 1997, 17(4): 432-438.
Hou Zhenting, Guo Xianping. The Homogenization of Non-homogeneous Markov Decision Processes[J]. Acta mathematica scientia,Series A, 1997, 17(4): 432-438.