A New Reinforcement Learning Algorithm With Fixed Exploration for Semi-Markov Control in Preventive Maintenance

Numerical Experiments ◽

Learning Algorithm ◽

Decision Processes ◽

Control Problems ◽

Total Productive Maintenance ◽

Markov Decision ◽

Markov Control ◽

Artificial intelligence techniques can play a significant role in solving problems encountered in the domain of Total Productive Maintenance (TPM). This paper considers a new reinforcement learning algorithm called iSMART, which can solve semi-Markov decision processes underlying control problems related to TPM. The algorithm uses a constant exploration rate, unlike its precursor R-SMART, which required exploration decay. Numerical experiments conducted here show encouraging behavior with the new algorithm.

A pulse neural network reinforcement learning algorithm for partially observable Markov decision processes

Systems and Computers in Japan ◽

10.1002/scj.10645 ◽

2005 ◽

Vol 36 (3) ◽

pp. 42-52 ◽

Cited By ~ 3

Author(s):

Koichiro Takita ◽

Masafumi Hagiwara

Keyword(s):

Neural Network ◽

Reinforcement Learning ◽

Learning Algorithm ◽

Decision Processes ◽

Markov Decision ◽

Partially Observable Markov ◽

Partially Observable ◽

An inverse reinforcement learning algorithm for semi-Markov decision processes

2017 IEEE Symposium Series on Computational Intelligence (SSCI) ◽

10.1109/ssci.2017.8280816 ◽

2017 ◽

Cited By ~ 1

Author(s):

Chuanfang Tan ◽

Yanjie Li ◽

Yuhu Cheng

Keyword(s):

Reinforcement Learning ◽

Learning Algorithm ◽

Decision Processes ◽

Inverse Reinforcement Learning ◽

Markov Decision ◽

Proceedings of the 4th International Conference on Machine Learning and Soft Computing ◽

A Sublinear-Regret Reinforcement Learning Algorithm on Constrained Markov Decision Processes with reset action

10.1145/3380688.3380706 ◽

2020 ◽

Author(s):

Takashi Watanabe ◽

Takashi Sakuragawa

Keyword(s):

Reinforcement Learning ◽

Learning Algorithm ◽

Decision Processes ◽

Constrained Markov Decision Processes ◽

Markov Decision ◽

A Deep Hierarchical Reinforcement Learning Algorithm in Partially Observable Markov Decision Processes

IEEE Access ◽

10.1109/access.2018.2854283 ◽

2018 ◽

Vol 6 ◽

pp. 49089-49102 ◽

Cited By ~ 14

Author(s):

Tuyen P. Le ◽

Ngo Anh Vien ◽

TaeChoong Chung

Keyword(s):

Reinforcement Learning ◽

Learning Algorithm ◽

Decision Processes ◽

Hierarchical Reinforcement Learning ◽

Markov Decision ◽

Partially Observable Markov ◽

Partially Observable ◽

Proceedings of the first international joint conference on Autonomous agents and multiagent systems part 2 - AAMAS '02 ◽

A multiagent reinforcement learning algorithm by dynamically merging markov decision processes

10.1145/544862.544940 ◽

2002 ◽

Cited By ~ 4

Author(s):

Mohammad Ghavamzadeh ◽

Sridhar Mahadevan

Keyword(s):

Reinforcement Learning ◽

Learning Algorithm ◽

Decision Processes ◽

Multiagent Reinforcement Learning ◽

Markov Decision ◽

Statistically Model Checking PCTL Specifications on Markov Decision Processes via Reinforcement Learning

2020 59th IEEE Conference on Decision and Control (CDC) ◽

10.1109/cdc42340.2020.9303982 ◽

2020 ◽

Author(s):

Yu Wang ◽

Nima Roohi ◽

Matthew West ◽

Mahesh Viswanathan ◽

Geir E. Dullerud

Keyword(s):

Reinforcement Learning ◽

Model Checking ◽

Decision Processes ◽

Markov Decision

A reinforcement learning algorithm with fuzzy approximation for semi Markov decision problems

Journal of Intelligent & Fuzzy Systems ◽

10.3233/ifs-141460 ◽

2015 ◽

Vol 28 (4) ◽

pp. 1733-1744 ◽

Cited By ~ 1

Author(s):

Ufuk Kula ◽

Beyazıt Ocaktan

Keyword(s):

Reinforcement Learning ◽

Learning Algorithm ◽

Decision Problems ◽

Fuzzy Approximation ◽

Markov Decision Problems ◽

Markov Decision ◽

Average Reward Reinforcement Learning for Semi-Markov Decision Processes

Neural Information Processing - Lecture Notes in Computer Science ◽

10.1007/978-3-319-70087-8_79 ◽

2017 ◽

pp. 768-777

Author(s):

Jiayuan Yang ◽

Yanjie Li ◽

Haoyao Chen ◽

Jiangang Li

Keyword(s):

Reinforcement Learning ◽

Decision Processes ◽

Average Reward ◽

Markov Decision

Learning algorithms for Markov decision processes

Journal of Applied Probability ◽

10.1017/s0021900200030825 ◽

1987 ◽

Vol 24 (01) ◽

pp. 270-276

Author(s):

Masami Kurano

Keyword(s):

Optimal Policy ◽

Learning Algorithm ◽

Learning Algorithms ◽

Decision Processes ◽

The State ◽

Reward Structure ◽

Adaptive Policy ◽

Markov Decision ◽

Reward Criterion

This study is concerned with finite Markov decision processes whose dynamics and reward structure are unknown but the state is observable exactly. We establish a learning algorithm which yields an optimal policy and construct an adaptive policy which is optimal under the average expected reward criterion.

RVI reinforcement learning for semi-Markov decision processes with average reward

2010 8th World Congress on Intelligent Control and Automation ◽

10.1109/wcica.2010.5554785 ◽

2010 ◽

Author(s):

Yanjie Li ◽

Fang Cao

Keyword(s):

Reinforcement Learning ◽

Decision Processes ◽

Average Reward ◽

Markov Decision