Optimal control and optimal sensor activation for Markov decision problems with costly observations

2015 IEEE Conference on Control Applications (CCA) ◽

10.1109/cca.2015.7320814 ◽

2015 ◽

Author(s):

Rene K. Boel ◽

Jan H. van Schuppen

Keyword(s):

Optimal Control ◽

Decision Problems ◽

Markov Decision Problems ◽

Markov Decision ◽

Sensor Activation

Download Full-text

Model Acquisition for Markov Decision Problems

10.21236/ada373795 ◽

1998 ◽

Author(s):

Thomas L. Dean

Keyword(s):

Decision Problems ◽

Model Acquisition ◽

Markov Decision Problems ◽

Markov Decision

Download Full-text

Model Acquisition for Markov Decision Problems

10.21236/ada380049 ◽

1998 ◽

Author(s):

Thomas Dean

Keyword(s):

Decision Problems ◽

Model Acquisition ◽

Markov Decision Problems ◽

Markov Decision

Download Full-text

Solving Uncertain Markov Decision Problems: An Interval-Based Method

Lecture Notes in Computer Science - Advances in Natural Computation ◽

10.1007/11881223_120 ◽

2006 ◽

pp. 948-957 ◽

Author(s):

Shulin Cui ◽

Jigui Sun ◽

Minghao Yin ◽

Shuai Lu

Keyword(s):

Decision Problems ◽

Markov Decision Problems ◽

Markov Decision

Download Full-text

A simulation-based learning automata framework for solving semi-Markov decision problems under long-run average reward

IIE Transactions ◽

10.1080/07408170490438672 ◽

2004 ◽

Vol 36 (6) ◽

pp. 557-567 ◽

Author(s):

ABHIJIT GOSAVI ◽

TAPAS K. DAS ◽

SUDEEP SARKAR

Keyword(s):

Learning Automata ◽

Decision Problems ◽

Average Reward ◽

Markov Decision Problems ◽

Long Run ◽

Simulation Based ◽

Markov Decision ◽

Long Run Average Reward

Download Full-text

A reinforcement learning algorithm with fuzzy approximation for semi Markov decision problems

Journal of Intelligent & Fuzzy Systems ◽

10.3233/ifs-141460 ◽

2015 ◽

Vol 28 (4) ◽

pp. 1733-1744 ◽

Author(s):

Ufuk Kula ◽

Beyazıt Ocaktan

Keyword(s):

Reinforcement Learning ◽

Learning Algorithm ◽

Decision Problems ◽

Fuzzy Approximation ◽

Markov Decision Problems ◽

Markov Decision ◽

Reinforcement Learning Algorithm

Download Full-text

Infinite Horizon Markov Decision Problems

Optimized Response-Adaptive Clinical Trials ◽

10.1007/978-3-658-08344-1_3 ◽

2014 ◽

pp. 39-65

Author(s):

Thomas Ondra

Keyword(s):

Infinite Horizon ◽

Decision Problems ◽

Markov Decision Problems ◽

Markov Decision

Download Full-text

Finite Horizon Markov Decision Problems

Optimized Response-Adaptive Clinical Trials ◽

10.1007/978-3-658-08344-1_2 ◽

2014 ◽

pp. 19-37

Author(s):

Thomas Ondra

Keyword(s):

Finite Horizon ◽

Decision Problems ◽

Markov Decision Problems ◽

Markov Decision

Download Full-text

Optimization of Discounted Markov Decision Problems

Journal of the Operational Research Society ◽

10.1057/jors.1969.112 ◽

1969 ◽

Vol 20 (4) ◽

pp. 499-500 ◽

Author(s):

N. A. J. Hastings

Keyword(s):

Decision Problems ◽

Markov Decision Problems ◽

Markov Decision

Download Full-text

Generalized Value Bounds and Column Reduction in Finite Markov Decision Problems

Operations Research ◽

10.1287/opre.28.2.387 ◽

1980 ◽

Vol 28 (2) ◽

pp. 387-394 ◽

Author(s):

R. G. Vickson

Keyword(s):

Decision Problems ◽

Markov Decision Problems ◽

Markov Decision

Download Full-text

Geometric convergence of value-iteration in multichain Markov decision problems

Advances in Applied Probability ◽

10.1017/s000186780003175x ◽

1979 ◽

Vol 11 (01) ◽

pp. 188-217 ◽

Author(s):

P. J. Schweitzer ◽

A. Federgruen

Keyword(s):

Convergence Rate ◽

Iteration Method ◽

Chain Structure ◽

Decision Problems ◽

Value Iteration ◽

Convergence Factor ◽

Markov Decision Problems ◽

Geometric Convergence ◽

Markov Decision ◽

This paper considers undiscounted Markov decision problems. With no restriction (on either the periodicity or chain structure of the problem) we show that the value iteration method for finding maximal gain policies exhibits a geometric rate of convergence, whenever convergence occurs. In addition, we study the behaviour of the value-iteration operator; we give bounds for the number of steps needed for contraction, describe the ultimate behaviour of the convergence factor and give conditions for the existence of a uniform convergence rate.

Download Full-text