Policy gradient reinforcement learning method for discrete-time linear quadratic regulation problem using estimated state value function

2017 56th Annual Conference of the Society of Instrument and Control Engineers of Japan (SICE) ◽

10.23919/sice.2017.8105539 ◽

2017 ◽

Author(s):

Tomotake Sasaki ◽

Eiji Uchibe ◽

Hidenao Iwane ◽

Hitoshi Yanami ◽

Hirokazu Anai ◽

...

Keyword(s):

Reinforcement Learning ◽

Discrete Time ◽

Value Function ◽

Learning Method ◽

Linear Quadratic ◽

Policy Gradient ◽

Linear Quadratic Regulation ◽

Download Full-text

Stochastic linear quadratic regulation for discrete-time linear systems with input delay

10.1016/j.automatica.2009.04.024 ◽

2009 ◽

Vol 45 (9) ◽

pp. 2067-2073 ◽

Author(s):

Xinmin Song ◽

Huanshui Zhang ◽

Lihua Xie

Keyword(s):

Linear Systems ◽

Discrete Time ◽

Input Delay ◽

Linear Quadratic ◽

Linear Quadratic Regulation ◽

Download Full-text

Adaptive dynamic programming for discrete-time linear quadratic regulation based on multirate generalised policy iteration

International Journal of Control ◽

10.1080/00207179.2017.1312669 ◽

2017 ◽

Vol 91 (6) ◽

pp. 1223-1240 ◽

Author(s):

Tae Yoon Chun ◽

Jae Young Lee ◽

Jin Bae Park ◽

Yoon Ho Choi

Keyword(s):

Dynamic Programming ◽

Discrete Time ◽

Policy Iteration ◽

Adaptive Dynamic Programming ◽

Linear Quadratic ◽

Adaptive Dynamic ◽

Linear Quadratic Regulation ◽

Download Full-text

Model-Free λ-Policy Iteration for Discrete-Time Linear Quadratic Regulation

IEEE Transactions on Neural Networks and Learning Systems ◽

10.1109/tnnls.2021.3098985 ◽

2021 ◽

pp. 1-15

Author(s):

Yongliang Yang ◽

Bahare Kiumarsi ◽

Hamidreza Modares ◽

Chengzhong Xu

Keyword(s):

Discrete Time ◽

Policy Iteration ◽

Linear Quadratic ◽

Linear Quadratic Regulation ◽

Download Full-text

Reinforcement Learning in Non-Stationary Discrete-Time Linear-Quadratic Mean-Field Games

2020 59th IEEE Conference on Decision and Control (CDC) ◽

10.1109/cdc42340.2020.9304279 ◽

2020 ◽

Author(s):

Muhammad Aneeq uz Zaman ◽

Kaiqing Zhang ◽

Erik Miehling ◽

Tamer Basar

Keyword(s):

Reinforcement Learning ◽

Discrete Time ◽

Mean Field Games ◽

Linear Quadratic ◽

Quadratic Mean ◽

Download Full-text

On the asymptotic properties of the Hessian in discrete-time linear quadratic control

Proceedings of the 2004 American Control Conference ◽

10.23919/acc.2004.1383611 ◽

2004 ◽

Author(s):

O.J. Rojas ◽

G.C. Goodwin

Keyword(s):

Discrete Time ◽

Asymptotic Properties ◽

Linear Quadratic Control ◽

Linear Quadratic ◽

Download Full-text

Robust Policy Iteration for Continuous-Time Linear Quadratic Regulation

IEEE Transactions on Automatic Control ◽

10.1109/tac.2021.3085510 ◽

2021 ◽

pp. 1-1

Author(s):

Bo Pang ◽

Tao Bian ◽

Zhong-Ping Jiang

Keyword(s):

Continuous Time ◽

Policy Iteration ◽

Linear Quadratic ◽

Linear Quadratic Regulation ◽

Download Full-text

Fault-tolerant optimised tracking control for unknown discrete-time linear systems using a combined reinforcement learning and residual compensation methodology

International Journal of Systems Science ◽

10.1080/00207721.2017.1344890 ◽

2017 ◽

Vol 48 (13) ◽

pp. 2811-2825 ◽

Author(s):

Ke-Zhen Han ◽

Jian Feng ◽

Xiaohong Cui

Keyword(s):

Reinforcement Learning ◽

Linear Systems ◽

Discrete Time ◽

Tracking Control ◽

Fault Tolerant ◽

Download Full-text

Linear Quadratic Regulation for Discrete-time Systems with Multiple Delays in Single Input Channel

IFAC Proceedings Volumes ◽

10.3182/20080706-5-kr-1001.02259 ◽

2008 ◽

Vol 41 (2) ◽

pp. 13336-13341 ◽

Author(s):

Shuai Liu ◽

Lihua Xie ◽

Huanshui Zhang

Keyword(s):

Discrete Time ◽

Multiple Delays ◽

Linear Quadratic ◽

Input Channel ◽

Discrete Time Systems ◽

Linear Quadratic Regulation ◽

Single Input ◽

Download Full-text

Policy Gradient Reinforcement Learning Method for Backward Motion Control of Tractor-Trailer Mobile Robot

10.1007/978-981-16-6554-7_35 ◽

2021 ◽

pp. 303-311

Author(s):

Qiqi Wang ◽

Jin Cheng ◽

Han Zhang

Keyword(s):

Reinforcement Learning ◽

Mobile Robot ◽

Motion Control ◽

Learning Method ◽

Policy Gradient

Download Full-text

Solver-Critic: A Reinforcement Learning Method for Discrete-Time-Constrained-Input Systems

IEEE Transactions on Cybernetics ◽

10.1109/tcyb.2020.2978088 ◽

2020 ◽

pp. 1-12

Author(s):

Xin Yuan ◽

Lu Dong ◽

Changyin Sun

Keyword(s):

Reinforcement Learning ◽

Discrete Time ◽

Learning Method ◽

Constrained Input

Download Full-text