Beyond Exponentially Fast Mixing in Average-Reward Reinforcement
Learning via Multi-Level Monte Carlo Actor-Critic

Beyond Exponentially Fast Mixing in Average-Reward Reinforcement Learning via Multi-Level Monte Carlo Actor-Critic

28 January 2023

Wesley A Suttle

Amrit Singh Bedi

Papers citing "Beyond Exponentially Fast Mixing in Average-Reward Reinforcement Learning via Multi-Level Monte Carlo Actor-Critic"

11 / 11 papers shown

Title
IISE PG&E Energy Analytics Challenge 2025: Hourly-Binned Regression Models Beat Transformers in Load Forecasting Millend Roy Vladimir Pyltsov Yinbo Hu 7 0 0 16 May 2025
Towards Global Optimality for Practical Average Reward Reinforcement Learning without Mixing Time Oracles Bhrij Patel Wesley A Suttle Alec Koppel Vaneet Aggarwal Brian M Sadler Amrit Singh Bedi Dinesh Manocha 32 1 0 18 Mar 2024
Sampling-based Safe Reinforcement Learning for Nonlinear Dynamical Systems Wesley A Suttle Vipul K Sharma K. Kosaraju S. Sivaranjani Ji Liu Vijay Gupta Brian M Sadler 35 1 0 06 Mar 2024
Dynamic Byzantine-Robust Learning: Adapting to Switching Byzantine Workers Ron Dorfman Naseem Yehya Kfir Y. Levy 27 2 0 05 Feb 2024
Two-Timescale Critic-Actor for Average Reward MDPs with Function Approximation Prashansa Panda Shalabh Bhatnagar 30 1 0 02 Feb 2024
Finite-Time Analysis of Three-Timescale Constrained Actor-Critic and Constrained Natural Actor-Critic Algorithms Prashansa Panda Shalabh Bhatnagar 33 0 0 25 Oct 2023
Regret Analysis of Policy Gradient Algorithm for Infinite Horizon Average Reward Markov Decision Processes Qinbo Bai Washim Uddin Mondal Vaneet Aggarwal 28 9 0 05 Sep 2023
Adapting to Mixing Time in Stochastic Optimization with Markovian Data Ron Dorfman Kfir Y. Levy 37 28 0 09 Feb 2022
On the Hidden Biases of Policy Mirror Ascent in Continuous Action Spaces Amrit Singh Bedi Souradip Chakraborty Anjaly Parayil Brian M Sadler Pratap Tokekar Alec Koppel 43 17 0 28 Jan 2022
A Finite Time Analysis of Two Time-Scale Actor Critic Methods Yue Wu Weitong Zhang Pan Xu Quanquan Gu 90 146 0 04 May 2020
On the Sample Complexity of Actor-Critic Method for Reinforcement Learning with Function Approximation Harshat Kumar Alec Koppel Alejandro Ribeiro 102 79 0 18 Oct 2019