Finite-Time Error Bounds For Linear Stochastic Approximation and TD Learning

3 February 2019

Papers citing "Finite-Time Error Bounds For Linear Stochastic Approximation and TD Learning"

28 / 78 papers shown

Title
On the Stability of Random Matrix Product with Markovian Noise: Application to Linear Stochastic Approximation and TD Learning Alain Durmus Eric Moulines A. Naumov S. Samsonov Hoi-To Wai 38 19 0 30 Jan 2021
Optimal oracle inequalities for solving projected fixed-point equations Wenlong Mou A. Pananjady Martin J. Wainwright 29 14 0 09 Dec 2020
CRPO: A New Approach for Safe Reinforcement Learning with Convergence Guarantee Tengyu Xu Yingbin Liang Guanghui Lan 52 122 0 11 Nov 2020
Nonlinear Two-Time-Scale Stochastic Approximation: Convergence and Finite-Time Performance Thinh T. Doan 16 45 0 03 Nov 2020
Variance-Reduced Off-Policy TDC Learning: Non-Asymptotic Convergence Analysis Shaocong Ma Yi Zhou Shaofeng Zou OffRL 22 14 0 26 Oct 2020
Single-Timescale Stochastic Nonconvex-Concave Optimization for Smooth Nonlinear TD Learning Shuang Qiu Zhuoran Yang Xiaohan Wei Jieping Ye Zhaoran Wang 33 38 0 23 Aug 2020
Regret Analysis of a Markov Policy Gradient Algorithm for Multi-arm Bandits D. Denisov N. Walton 29 8 0 20 Jul 2020
Least Squares Regression with Markovian Data: Fundamental Limits and Algorithms Guy Bresler Prateek Jain Dheeraj M. Nagaraj Praneeth Netrapalli Xian Wu 36 61 0 16 Jun 2020
Multi-Agent Reinforcement Learning in Stochastic Networked Systems Yiheng Lin Guannan Qu Longbo Huang Adam Wierman 34 38 0 11 Jun 2020
Can Temporal-Difference and Q-Learning Learn Representation? A Mean-Field Theory Yufeng Zhang Qi Cai Zhuoran Yang Yongxin Chen Zhaoran Wang OOD MLT 165 11 0 08 Jun 2020
Breaking the Sample Size Barrier in Model-Based Reinforcement Learning with a Generative Model Gen Li Yuting Wei Yuejie Chi Yuxin Chen 39 125 0 26 May 2020
Non-asymptotic Convergence Analysis of Two Time-scale (Natural) Actor-Critic Algorithms Tengyu Xu Zhe Wang Yingbin Liang 26 57 0 07 May 2020
A Finite Time Analysis of Two Time-Scale Actor Critic Methods Yue Wu Weitong Zhang Pan Xu Quanquan Gu 92 146 0 04 May 2020
Improving Sample Complexity Bounds for (Natural) Actor-Critic Algorithms Tengyu Xu Zhe Wang Yingbin Liang 27 25 0 27 Apr 2020
Explicit Mean-Square Error Bounds for Monte-Carlo and Linear Stochastic Approximation Shuhang Chen Adithya M. Devraj Ana Bušić Sean P. Meyn 24 31 0 07 Feb 2020
Finite-Time Analysis and Restarting Scheme for Linear Two-Time-Scale Stochastic Approximation Thinh T. Doan 21 36 0 23 Dec 2019
Scalable Reinforcement Learning for Multi-Agent Networked Systems Guannan Qu Adam Wierman Na Li 24 33 0 05 Dec 2019
A Unified Switching System Perspective and O.D.E. Analysis of Q-Learning Algorithms Dong-hwan Lee Niao He 23 28 0 04 Dec 2019
Multi-Agent Reinforcement Learning: A Selective Overview of Theories and Algorithms Kaipeng Zhang Zhuoran Yang Tamer Basar 68 1,184 0 24 Nov 2019
On the Sample Complexity of Actor-Critic Method for Reinforcement Learning with Function Approximation Harshat Kumar Alec Koppel Alejandro Ribeiro 104 80 0 18 Oct 2019
A Multistep Lyapunov Approach for Finite-Time Analysis of Biased Stochastic Approximation Gang Wang Bingcong Li G. Giannakis 33 28 0 10 Sep 2019
Finite-Time Performance of Distributed Temporal Difference Learning with Linear Function Approximation Thinh T. Doan S. T. Maguluri Justin Romberg 30 41 0 25 Jul 2019
Finite-Time Performance Bounds and Adaptive Learning Rate Selection for Two Time-Scale Reinforcement Learning Harsh Gupta R. Srikant Lei Ying 27 85 0 14 Jul 2019
Finite-Sample Analysis of Nonlinear Stochastic Approximation with Applications in Reinforcement Learning Zaiwei Chen Sheng Zhang Thinh T. Doan John-Paul Clarke S. T. Maguluri 33 58 0 27 May 2019
Neural Temporal-Difference and Q-Learning Provably Converge to Global Optima Qi Cai Zhuoran Yang Jason D. Lee Zhaoran Wang 42 29 0 24 May 2019
Target-Based Temporal Difference Learning Donghwan Lee Niao He OOD 30 31 0 24 Apr 2019
Finite-Sample Analysis for SARSA with Linear Function Approximation Shaofeng Zou Tengyu Xu Yingbin Liang 32 146 0 06 Feb 2019
Finite-Sample Analysis For Decentralized Batch Multi-Agent Reinforcement Learning With Networked Agents Kaipeng Zhang Zhuoran Yang Han Liu Tong Zhang Tamer Basar OffRL 29 26 0 06 Dec 2018