A Novel Framework for Policy Mirror Descent with General Parameterization and Linear Convergence

30 January 2023

Papers citing "A Novel Framework for Policy Mirror Descent with General Parameterization and Linear Convergence"

13 / 13 papers shown

Title
Ordering-based Conditions for Global Convergence of Policy Gradient Methods Jincheng Mei Bo Dai Alekh Agarwal Mohammad Ghavamzadeh Csaba Szepesvári Dale Schuurmans 60 4 0 02 Apr 2025
Mirror Descent Actor Critic via Bounded Advantage Learning Ryo Iwaki 93 0 0 06 Feb 2025
Functional Acceleration for Policy Mirror Descent Veronica Chelu Doina Precup 30 0 0 23 Jul 2024
Policy Mirror Descent Inherently Explores Action Space Yan Li Guanghui Lan OffRL 58 8 0 08 Mar 2023
Policy Mirror Ascent for Efficient and Independent Learning in Mean Field Games Batuhan Yardim Semih Cayci M. Geist Niao He 53 27 0 29 Dec 2022
Linear Convergence for Natural Policy Gradient with Log-linear Policy Parametrization Carlo Alfano Patrick Rebeschini 54 13 0 30 Sep 2022
Stochastic Second-Order Methods Improve Best-Known Sample Complexity of SGD for Gradient-Dominated Function Saeed Masiha Saber Salehkaleybar Niao He Negar Kiyavash Patrick Thiran 87 18 0 25 May 2022
Actor-critic is implicitly biased towards high entropy optimal policies Yuzheng Hu Ziwei Ji Matus Telgarsky 60 11 0 21 Oct 2021
Finite-Sample Analysis of Off-Policy Natural Actor-Critic Algorithm S. Khodadadian Zaiwei Chen S. T. Maguluri CML OffRL 71 26 0 18 Feb 2021
On the Convergence and Sample Efficiency of Variance-Reduced Policy Gradient Method Junyu Zhang Chengzhuo Ni Zheng Yu Csaba Szepesvári Mengdi Wang 46 67 0 17 Feb 2021
Policy Mirror Descent for Reinforcement Learning: Linear Convergence, New Sampling Complexity, and Generalized Problem Classes Guanghui Lan 91 136 0 30 Jan 2021
On Linear Convergence of Policy Gradient Methods for Finite MDPs Jalaj Bhandari Daniel Russo 59 59 0 21 Jul 2020
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 340 1,960 0 04 May 2020