Policy Optimization for Constrained MDPs with Provable Fast Global Convergence

31 October 2021

Papers citing "Policy Optimization for Constrained MDPs with Provable Fast Global Convergence"

6 / 6 papers shown

Title
A Policy Gradient Primal-Dual Algorithm for Constrained MDPs with Uniform PAC Guarantees Toshinori Kitamura Tadashi Kozuno Masahiro Kato Yuki Ichihara Soichiro Nishimori Akiyoshi Sannai Sho Sonoda Wataru Kumagai Yutaka Matsuo 49 2 0 31 Jan 2024
Constraint-Generation Policy Optimization (CGPO): Nonlinear Programming for Policy Optimization in Mixed Discrete-Continuous MDPs Michael Gimelfarb Ayal Taitler Scott Sanner 33 0 0 20 Jan 2024
A safe exploration approach to constrained Markov decision processes Tingting Ni Maryam Kamgarpour 49 3 0 01 Dec 2023
Achieving Zero Constraint Violation for Constrained Reinforcement Learning via Conservative Natural Policy Gradient Primal-Dual Algorithm Qinbo Bai Amrit Singh Bedi Vaneet Aggarwal 31 20 0 12 Jun 2022
Algorithm for Constrained Markov Decision Process with Linear Convergence E. Gladin Maksim Lavrik-Karmazin K. Zainullina Varvara Rudenko Alexander V. Gasnikov Martin Takáč 35 6 0 03 Jun 2022
Policy Mirror Descent for Reinforcement Learning: Linear Convergence, New Sampling Complexity, and Generalized Problem Classes Guanghui Lan 102 137 0 30 Jan 2021