A Small Gain Analysis of Single Timescale Actor Critic

4 March 2022

Papers citing "A Small Gain Analysis of Single Timescale Actor Critic"

16 / 16 papers shown

Title
Global Optimality of Single-Timescale Actor-Critic under Continuous State-Action Space: A Study on Linear Quadratic Regulator Xuyang Chen Jingliang Duan Lin Zhao 59 1 0 02 May 2025
On The Global Convergence Of Online RLHF With Neural Parametrization Mudit Gaur Amrit Singh Bedi Raghu Pasupathy Vaneet Aggarwal 28 0 0 21 Oct 2024
Improved Sample Complexity for Global Convergence of Actor-Critic Algorithms Navdeep Kumar Priyank Agrawal Giorgia Ramponi Kfir Y. Levy Shie Mannor 40 0 0 11 Oct 2024
Heavy-Ball Momentum Accelerated Actor-Critic With Function Approximation Yanjie Dong Haijun Zhang Gang Wang Shisheng Cui Xiping Hu 53 1 0 13 Aug 2024
Fast Two-Time-Scale Stochastic Gradient Method with Applications in Reinforcement Learning Sihan Zeng Thinh T. Doan 54 5 0 15 May 2024
One-Shot Averaging for Distributed TD( $λ$ ) Under Markov Sampling Haoxing Tian I. Paschalidis Alexander Olshevsky OffRL 47 4 0 13 Mar 2024
Two-Timescale Critic-Actor for Average Reward MDPs with Function Approximation Prashansa Panda Shalabh Bhatnagar 38 1 0 02 Feb 2024
On the Second-Order Convergence of Biased Policy Gradient Algorithms Siqiao Mu Diego Klabjan 50 2 0 05 Nov 2023
Decision-Aware Actor-Critic with Function Approximation and Theoretical Guarantees Sharan Vaswani A. Kazemi Reza Babanezhad Nicolas Le Roux OffRL 32 3 0 24 May 2023
Finite-time analysis of single-timescale actor-critic Xu-yang Chen Lin Zhao OffRL 29 21 0 18 Oct 2022
Global Convergence of Two-timescale Actor-Critic for Solving Linear Quadratic Regulator Xu-yang Chen Jingliang Duan Yingbin Liang Lin Zhao 24 6 0 18 Aug 2022
A Single-Timescale Analysis For Stochastic Approximation With Multiple Coupled Sequences Han Shen Tianyi Chen 45 15 0 21 Jun 2022
Finite-Time Analysis of Fully Decentralized Single-Timescale Actor-Critic Qijun Luo Xiao Li 32 1 0 12 Jun 2022
Finite-Sample Analysis of Off-Policy Natural Actor-Critic Algorithm S. Khodadadian Zaiwei Chen S. T. Maguluri CML OffRL 71 26 0 18 Feb 2021
A Finite Time Analysis of Two Time-Scale Actor Critic Methods Yue Wu Weitong Zhang Pan Xu Quanquan Gu 90 146 0 04 May 2020
On the Sample Complexity of Actor-Critic Method for Reinforcement Learning with Function Approximation Harshat Kumar Alec Koppel Alejandro Ribeiro 104 79 0 18 Oct 2019