Xia, L. (2018) Mean-Variance Optimization of Discrete Time Discounted Markov Decision Processes. Automatica, 88, 76-82. - References

Journals by Subject

Publish with us

Follow SCIRP

	+1 323-425-8868
	customer@scirp.org
	+86 18163351462(WhatsApp)
	1655362766

	Paper Publishing WeChat

Article citationsMore>>

Xia, L. (2018) Mean-Variance Optimization of Discrete Time Discounted Markov Decision Processes. Automatica, 88, 76-82.
https://doi.org/10.1016/j.automatica.2017.11.012

has been cited by the following article:

TITLE: Variance Optimization for Continuous-Time Markov Decision Processes

AUTHORS: Yaqing Fu

KEYWORDS: Continuous-Time Markov Decision Process, Variance Optimality of Average Reward, Optimal Policy of Variance, Policy Iteration

JOURNAL NAME: Open Journal of Statistics, Vol.9 No.2, April 2, 2019

ABSTRACT: This paper considers the variance optimization problem of average reward in continuous-time Markov decision process (MDP). It is assumed that the state space is countable and the action space is Borel measurable space. The main purpose of this paper is to find the policy with the minimal variance in the deterministic stationary policy space. Unlike the traditional Markov decision process, the cost function in the variance criterion will be affected by future actions. To this end, we convert the variance minimization problem into a standard (MDP) by introducing a concept called pseudo-variance. Further, by giving the policy iterative algorithm of pseudo-variance optimization problem, the optimal policy of the original variance optimization problem is derived, and a sufficient condition for the variance optimal policy is given. Finally, we use an example to illustrate the conclusion of this paper.

Open Access

Articles

Variance Optimization for Continuous-Time Markov Decision Processes

Yaqing Fu

Open Journal of Statistics Vol.9 No.2, April 2, 2019

DOI: 10.4236/ojs.2019.92014
Open Access

Articles

Discrete Time Markov Reward Processes a Motor Car Insurance Example

Guglielmo D’ Amico, Jacques Janssen, Raimondo Manca

Technology and Investment Vol.1 No.2, May 25, 2010

DOI: 10.4236/ti.2010.12016
Open Access

Articles

Stability Estimation for Markov Control Processes with Discounted Cost

Jaime Eduardo Martínez-Sánchez

Applied Mathematics Vol.11 No.6, June 22, 2020

DOI: 10.4236/am.2020.116036
Open Access

Articles

Modeling and Design of Real-Time Pricing Systems Based on Markov Decision Processes

Koichi Kobayashi, Ichiro Maruta, Kazunori Sakurama, Shun-ichi Azuma

Applied Mathematics Vol.5 No.10, June 3, 2014

DOI: 10.4236/am.2014.510141
Open Access

Articles

Continuous-Time Mean-Variance Portfolio Selection with Partial Information

Wan-Kai Pang, Yuan-Hua Ni, Xun Li, Ka-Fai Cedric Yiu

Journal of Mathematical Finance Vol.4 No.5, November 26, 2014

DOI: 10.4236/jmf.2014.45033

Follow SCIRP

	+1 323-425-8868
	customer@scirp.org
	+86 18163351462(WhatsApp)
	1655362766

	Paper Publishing WeChat

Journals by Subject

Publish with us

Article citationsMore>>

Home

About SCIRP

Service

Policies