A Hybrid Stochastic Policy Gradient Algorithm for Reinforcement Learning

1 March 2020

Papers citing "A Hybrid Stochastic Policy Gradient Algorithm for Reinforcement Learning"

7 / 7 papers shown

Title
On the Stochastic (Variance-Reduced) Proximal Gradient Method for Regularized Expected Reward Optimization Ling Liang Haizhao Yang 14 1 0 23 Jan 2024
Efficiently Escaping Saddle Points for Non-Convex Policy Optimization Sadegh Khorasani Saber Salehkaleybar Negar Kiyavash Niao He Matthias Grossglauser 29 1 0 15 Nov 2023
SoftTreeMax: Exponential Variance Reduction in Policy Gradient via Tree Search Gal Dalal Assaf Hallak Gugan Thoppe Shie Mannor Gal Chechik 34 3 0 30 Jan 2023
Stochastic Dimension-reduced Second-order Methods for Policy Optimization Jinsong Liu Chen Xie Qinwen Deng Dongdong Ge Yi-Li Ye 32 1 0 28 Jan 2023
An Improved Analysis of (Variance-Reduced) Policy Gradient and Natural Policy Gradient Methods Yanli Liu Kaipeng Zhang Tamer Basar W. Yin 48 102 0 15 Nov 2022
A general sample complexity analysis of vanilla policy gradient Rui Yuan Robert Mansel Gower A. Lazaric 82 62 0 23 Jul 2021
Sample Efficient Reinforcement Learning with REINFORCE Junzi Zhang Jongho Kim Brendan O'Donoghue Stephen P. Boyd 42 101 0 22 Oct 2020