Enforcing Almost-Sure Reachability in POMDPs

Computer Aided Verification - Lecture Notes in Computer Science ◽

10.1007/978-3-030-81688-9_28 ◽

2021 ◽

pp. 602-625

Author(s):

Sebastian Junges ◽

Nils Jansen ◽

Sanjit A. Seshia

Keyword(s):

Markov Decision Processes ◽

Empirical Evaluation ◽

Decision Processes ◽

Limited Information ◽

Sequential Decision ◽

Learning Agent ◽

Markov Decision ◽

System Configurations ◽

Partially Observable

AbstractPartially-Observable Markov Decision Processes (POMDPs) are a well-known stochastic model for sequential decision making under limited information. We consider the EXPTIME-hard problem of synthesising policies that almost-surely reach some goal state without ever visiting a bad state. In particular, we are interested in computing the winning region, that is, the set of system configurations from which a policy exists that satisfies the reachability specification. A direct application of such a winning region is the safe exploration of POMDPs by, for instance, restricting the behavior of a reinforcement learning agent to the region. We present two algorithms: A novel SAT-based iterative approach and a decision-diagram based alternative. The empirical evaluation demonstrates the feasibility and efficacy of the approaches.

Download Full-text

An Introduction to Fully and Partially Observable Markov Decision Processes

Decision Theory Models for Applications in Artificial Intelligence ◽

10.4018/978-1-60960-165-2.ch003 ◽

2012 ◽

pp. 33-62 ◽

Author(s):

Pascal Poupart

Keyword(s):

Decision Making ◽

Markov Decision Processes ◽

Decision Processes ◽

Sequential Decision Making ◽

Decision Making Under Uncertainty ◽

Sequential Decision ◽

Markov Decision ◽

Partially Observable Markov ◽

Partially Observable

The goal of this chapter is to provide an introduction to Markov decision processes as a framework for sequential decision making under uncertainty. The aim of this introduction is to provide practitioners with a basic understanding of the common modeling and solution techniques. Hence, we will not delve into the details of the most recent algorithms, but rather focus on the main concepts and the issues that impact deployment in practice. More precisely, we will review fully and partially observable Markov decision processes, describe basic algorithms to find good policies and discuss modeling/computational issues that arise in practice.

Download Full-text

Oracular Partially Observable Markov Decision Processes: A Very Special Case

Proceedings 2007 IEEE International Conference on Robotics and Automation ◽

10.1109/robot.2007.363691 ◽

2007 ◽

Author(s):

Nicholas Armstrong-Crews ◽

Manuela Veloso

Keyword(s):

Markov Decision Processes ◽

Decision Processes ◽

Markov Decision ◽

Partially Observable Markov ◽

Partially Observable ◽

Download Full-text

Active Chemical Sensing With Partially Observable Markov Decision Processes

10.1063/1.3156617 ◽

2009 ◽

Author(s):

Rakesh Gosangi ◽

Ricardo Gutierrez-Osuna ◽

Matteo Pardo ◽

Giorgio Sberveglieri

Keyword(s):

Markov Decision Processes ◽

Chemical Sensing ◽

Decision Processes ◽

Active Chemical ◽

Markov Decision ◽

Partially Observable Markov ◽

Partially Observable

Download Full-text

Scalable grid‐based approximation algorithms for partially observable Markov decision processes

Concurrency and Computation Practice and Experience ◽

10.1002/cpe.6743 ◽

2021 ◽

Author(s):

Can Kavaklioglu ◽

Mucahit Cevik

Keyword(s):

Approximation Algorithms ◽

Markov Decision Processes ◽

Decision Processes ◽

Markov Decision ◽

Partially Observable Markov ◽

Partially Observable ◽

Download Full-text

Quasi-Deterministic Partially Observable Markov Decision Processes

Neural Information Processing - Lecture Notes in Computer Science ◽

10.1007/978-3-642-10677-4_27 ◽

2009 ◽

pp. 237-246 ◽

Author(s):

Camille Besse ◽

Brahim Chaib-draa

Keyword(s):

Markov Decision Processes ◽

Decision Processes ◽

Markov Decision ◽

Partially Observable Markov ◽

Partially Observable

Download Full-text

Partially Observable Markov Decision Processes

Universitext - Markov Decision Processes with Applications to Finance ◽

10.1007/978-3-642-18324-9_5 ◽

2011 ◽

pp. 147-174

Author(s):

Nicole Bäuerle ◽

Ulrich Rieder

Keyword(s):

Markov Decision Processes ◽

Decision Processes ◽

Markov Decision ◽

Partially Observable Markov ◽

Partially Observable

Download Full-text

A Continuous Internal-State Controller for Partially Observable Markov Decision Processes

Artificial Neural Networks - ICANN 2008 - Lecture Notes in Computer Science ◽

10.1007/978-3-540-87536-9_41 ◽

2008 ◽

pp. 397-406

Author(s):

Yuki Taniguchi ◽

Takeshi Mori ◽

Shin Ishii

Keyword(s):

Markov Decision Processes ◽

Internal State ◽

Decision Processes ◽

State Controller ◽

Markov Decision ◽

Partially Observable Markov ◽

Partially Observable

Download Full-text

Monotonicity properties for two-action partially observable Markov decision processes on partially ordered spaces

European Journal of Operational Research ◽

10.1016/j.ejor.2019.10.003 ◽

2020 ◽

Vol 282 (3) ◽

pp. 936-944

Author(s):

Erik Miehling ◽

Demosthenis Teneketzis

Keyword(s):

Markov Decision Processes ◽

Decision Processes ◽

Partially Ordered ◽

Monotonicity Properties ◽

Markov Decision ◽

Partially Observable Markov ◽

Partially Observable ◽

Partially Ordered Spaces

Download Full-text

Structural Results for Partially Observable Markov Decision Processes

Operations Research ◽

10.1287/opre.27.5.1041 ◽

1979 ◽

Vol 27 (5) ◽

pp. 1041-1053 ◽

Author(s):

S. Christian Albright

Keyword(s):

Markov Decision Processes ◽

Decision Processes ◽

Markov Decision ◽

Partially Observable Markov ◽

Partially Observable

Download Full-text

Partially observable Markov decision processes with imprecise parameters

Artificial Intelligence ◽

10.1016/j.artint.2007.03.004 ◽

2007 ◽

Vol 171 (8-9) ◽

pp. 453-490 ◽

Author(s):

Hideaki Itoh ◽

Kiyohiko Nakamura

Keyword(s):

Markov Decision Processes ◽

Decision Processes ◽

Markov Decision ◽

Partially Observable Markov ◽

Partially Observable ◽

Imprecise Parameters

Download Full-text