Policy Optimization with Stochastic Mirror Descent

Policy Optimization with Stochastic Mirror Descent

25 June 2019

Qian Zheng

Gang Pan

Papers citing "Policy Optimization with Stochastic Mirror Descent"

8 / 8 papers shown

Title
Mirror Descent Actor Critic via Bounded Advantage Learning Ryo Iwaki 93 0 0 06 Feb 2025
Spurious Stationarity and Hardness Results for Mirror Descent He Chen Jiajin Li Anthony Man-Cho So 45 0 0 11 Apr 2024
On the Stochastic (Variance-Reduced) Proximal Gradient Method for Regularized Expected Reward Optimization Ling Liang Haizhao Yang 14 1 0 23 Jan 2024
Efficiently Escaping Saddle Points for Non-Convex Policy Optimization Sadegh Khorasani Saber Salehkaleybar Negar Kiyavash Niao He Matthias Grossglauser 29 1 0 15 Nov 2023
Constrained Update Projection Approach to Safe Policy Optimization Long Yang Jiaming Ji Juntao Dai Linrui Zhang Binbin Zhou Pengfei Li Yaodong Yang Gang Pan 38 43 0 15 Sep 2022
Learning to Constrain Policy Optimization with Virtual Trust Region Hung Le Thommen Karimpanal George Majid Abdolshah D. Nguyen Kien Do Sunil R. Gupta Svetha Venkatesh 30 3 0 20 Apr 2022
A general sample complexity analysis of vanilla policy gradient Rui Yuan Robert Mansel Gower A. Lazaric 79 62 0 23 Jul 2021
Sample Efficient Policy Gradient Methods with Recursive Variance Reduction Pan Xu F. Gao Quanquan Gu 31 83 0 18 Sep 2019