非平稳MDP—平均样本轨道最优

Abstract

Abstract:

Ｉｎｔｈｉｓｐａｐｅｒ，ｗｅｃｏｎｓｉｄｅｒｔｈｅｓａｍｐｌｅｐａｔｈｏｐｔｉｍａｌｉｔｙｆｏｒｎｏｎｓｔａｔｉｏｎａｒｙＭＤＰｗｉｔｈａｒｂｉｔｒａｒｙｓｔａｔｅａｎｄａｃｔｉｏｎｓｐａｃｅｓｕｎｄｅｒａｖｅｒａｇｅｃｒｉｔｅｒｉｏｎ．Ｂｙｔｈｅｍａｒｔｉｎｇａｌｅｔｈｅｏｒｙ，ｗｅｐｒｏｖｅｔｈｅｅｘｉｓｔｅｎｃｅｏｆｏｐｔｉｍａｌＭａｒｋｏｖｐｏｌｉｃｉｅｓｕｎｄｅｒｔｈｅｗｅａｋｅｒｇｏｄｉｃｃｏｎｄｉｔｉｏｎｓ，ａｎｄｔｈｅｎｅｘｔｅｎｄｔｈｅｍａｉｎｒｅｓｕｌｔｓｏｂｔａｉｎｅｄｂｙＡ．Ａｒｏｐｏｓｔａｔｈｉｓ，Ｖ．Ｂｏｒｋａｒ，Ｅ．Ｆ．Ｇａｕｃｈｅｒａｎｄ，Ｍ．ＧｈｏｓｈａｎｄＳ．Ｍａｒｃｕｓ［１］（１９９３）

Key words: Ｍａｒｋｏｖｄｅｃｉｓｉｏｎｐｒｏｇｒａｍｍｉｎｇ（ＭＤＰ）, Ａｖｅｒａｇｅｓａｍｐｌｅｐａｔｈｃｒｉｔｅｒｉｏｎ, Ｎｏｎｓｔａｔｉｏｎａｒｙ, ＯｐｔｉｍａｌＭａｒｋｏｖｐｏｌｉｃｉｅｓ

CLC Number:

90C40

GUO Xian-Beng. The sample path optimality for nonstationary MDP with Average criterion[J].Acta mathematica scientia,Series A, 2000, 20(1): 31-35.

Trendmd

References

１　ＡｒａｐｏｓｔａｔｈｉｓＡ，ＢｏｒｋａｒＶ，ＧａｕｃｈｅｒａｎｄＥＦ，ＧｈｏｓｈＭ，ＭａｒｃｕｓＳ．ＤｉｓｃｒｅｔｅｔｉｍｅｃｏｎｔｒｏｌｌｅｄＭａｒｋｏｖｐｒｏｃｅｓｓｅｓｗｉｔｈａｖｅｒａｇｅｃｏｓｔｃｒｉｔｅｒｉｏｎ：ａｓｕｒｖｅｙ．ＳＩＡＭＪＣｏｎｔｒｏｌａｎｄＯｐｔｉｍｉｚａｔｉｏｎ，１９９３，３１（２）：２８２－３４４
２　ＨｉｎｄｅｒｅｒＫ．Ｆｏｕｎｄａｔｉｏｎｓｏｆｎｏｎｓｔａｔｉｏｎａｒｙｄｙｎａｍｉｃｐｒｏｇｒａｍｍｉｎｇｗｉｔｈｄｉｓｃｒｅｔｅｔｉｍｅｐａｒａｍｅｔｅｒ．ＮｅｗＹｏｒｋ：ＳｐｒｉｎｇｅｒＶｅｒｌａｇ，１９７０
３　ＲｏｌａｎｄｏＣＣ，ＥｍａｎｕｅｌＦＧ．ＤｅｎｕｍｅｒａｂｌｅｃｏｎｔｒｏｌｌｅｄＭａｒｋｏｖｃｈａｉｎｓｗｉｔｈａｖｅｒａｇｅｒｅｗａｒｄｃｒｉｔｅｒｉｏｎ：ｓａｍｐｌｅｐａｔｈｏｐｔｉｍａｌｉｔｙ，ＺＯＲＭａｔｈｅＭｅｔｈｏｄｓ．ＯｐｅｒＲｅｓ，１９９５，４１：８９－１０８
４　ＬｅｒｍａＯ．Ａｄａｐｔｉｖｅｍａｒｋｏｖｃｏｎｔｒｏｌｌｅｄｐｒｏｃｅｓｓｅｓ．ＮｅｗＹｏｒｋ：ＳｐｒｉｎｇｅｒＶｅｒｌａｇ，１９８９
５　ＰａｒｋＹ，ＢｅａｎＩＣ，ＳｍｉｔｈＲＬ．ＯｐｔｉｍａｌａｖｅｒａｇｅｖａｌｕｅｃｏｎｖｅｎｇｅｎｃｅｉｎｎｏｎｈｏｍｏｇｅｎｅｏｕｓＭａｒｋｏｖｄｅｃｉｓｉｏｎｐｒｏｃｅｓｓｅｓ．Ｊ
ＭａｔｈＡｎａｌＡｐｐ，１９９３，１７９：５２６－５３６
６　魏力仁，郭先平．非平稳ＭＤＰ平均模型．科学通报，１９９１，１０：７２８－７３０

Metrics

Viewed

Full text

280

HTML			PDF

Just accepted	Online first	Issue	Just accepted	Online first	Issue
0	0	0	0	0	280

	From	local

	Times	280
	Rate	100%

Abstract

Just accepted	Online first	Issue

0	0	55

	From	Others

	Times	55
	Rate	100%

Cited

Web of Science	Crossref	ScienceDirect	Search for Citations in Google Scholar >>


This page requires you have already subscribed to WoS.

Shared

Discussed

The sample path optimality for nonstationary MDP with Average criterion

PDF (PC)

Abstract

Cite this article

share this article

References

Related Articles 0

Metrics

Comments

Recommended 10