Regret Analysis of Policy Gradient Algorithm for Infinite Horizon Average Reward Markov Decision Processes

5 September 2023

Papers citing "Regret Analysis of Policy Gradient Algorithm for Infinite Horizon Average Reward Markov Decision Processes"

10 / 10 papers shown

Title
Natural Policy Gradient for Average Reward Non-Stationary RL Neharika Jali Eshika Pathak Pranay Sharma Guannan Qu Gauri Joshi 32 0 0 23 Apr 2025
Last-Iterate Convergence of General Parameterized Policies in Constrained MDPs Washim Uddin Mondal Vaneet Aggarwal 41 1 0 21 Aug 2024
Order-Optimal Regret with Novel Policy Gradient Approaches in Infinite-Horizon Average Reward MDPs Swetha Ganesh Washim Uddin Mondal Vaneet Aggarwal 47 3 0 02 Apr 2024
Towards Global Optimality for Practical Average Reward Reinforcement Learning without Mixing Time Oracles Bhrij Patel Wesley A Suttle Alec Koppel Vaneet Aggarwal Brian M Sadler Amrit Singh Bedi Dinesh Manocha 34 1 0 18 Mar 2024
On the Global Convergence of Policy Gradient in Average Reward Markov Decision Processes Navdeep Kumar Yashaswini Murthy Itai Shufaro Kfir Y. Levy R. Srikant Shie Mannor 36 2 0 11 Mar 2024
Improved Sample Complexity Analysis of Natural Policy Gradient Algorithm with General Parameterization for Infinite Horizon Discounted Reward Markov Decision Processes Washim Uddin Mondal Vaneet Aggarwal 30 9 0 18 Oct 2023
Adapting to Mixing Time in Stochastic Optimization with Markovian Data Ron Dorfman Kfir Y. Levy 37 28 0 09 Feb 2022
Learning Infinite-Horizon Average-Reward Markov Decision Processes with Constraints Liyu Chen R. Jain Haipeng Luo 57 25 0 31 Jan 2022
On the Convergence and Sample Efficiency of Variance-Reduced Policy Gradient Method Junyu Zhang Chengzhuo Ni Zheng Yu Csaba Szepesvári Mengdi Wang 44 67 0 17 Feb 2021
Model-free Reinforcement Learning in Infinite-horizon Average-reward Markov Decision Processes Chen-Yu Wei Mehdi Jafarnia-Jahromi Haipeng Luo Hiteshi Sharma R. Jain 107 99 0 15 Oct 2019