Escaping from Zero Gradient: Revisiting Action-Constrained Reinforcement
Learning via Frank-Wolfe Policy Optimization

v1v2 (latest)

Escaping from Zero Gradient: Revisiting Action-Constrained Reinforcement Learning via Frank-Wolfe Policy Optimization

22 February 2021

Ping-Chun Hsieh

ArXiv (abs)PDF HTML

Papers citing "Escaping from Zero Gradient: Revisiting Action-Constrained Reinforcement Learning via Frank-Wolfe Policy Optimization"

11 / 11 papers shown

Title
Efficient Action-Constrained Reinforcement Learning via Acceptance-Rejection Method and Augmented MDPs Wei-Ting Hung Shao-Hua Sun Ping-Chun Hsieh 90 0 0 17 Mar 2025
Leveraging Constraint Violation Signals For Action-Constrained Reinforcement Learning J. Brahmanage Jiajing Ling Akshat Kumar 151 0 0 08 Feb 2025
Safe Reinforcement Learning with Learned Non-Markovian Safety Constraints Siow Meng Low Akshat Kumar OffRL 86 0 0 05 May 2024
FlowPG: Action-constrained Policy Gradient with Normalizing Flows J. Brahmanage Jiajing Ling Akshat Kumar 78 4 0 07 Feb 2024
Generative Modelling of Stochastic Actions with Arbitrary Constraints in Reinforcement Learning Changyu Chen Ramesha Karunasena Thanh Hong Nguyen Arunesh Sinha Pradeep Varakantham 107 9 0 26 Nov 2023
Nonsmooth Projection-Free Optimization with Functional Constraints Kamiar Asgari Michael J. Neely 84 0 0 18 Nov 2023
DFWLayer: Differentiable Frank-Wolfe Optimization Layer Zixuan Liu Liu Liu Xueqian Wang P. Zhao AI4CE 109 0 0 21 Aug 2023
Benchmarking Actor-Critic Deep Reinforcement Learning Algorithms for Robotics Control with Action Constraints Kazumi Kasaura Shuwa Miura Tadashi Kozuno Ryo Yonetani Kenta Hoshino Y. Hosoe 86 14 0 18 Apr 2023
Neural Frank-Wolfe Policy Optimization for Region-of-Interest Intra-Frame Coding with HEVC/H.265 Yung-Han Ho Chia-Hao Kao Wen-Hsiao Peng Ping-Chun Hsieh 104 3 0 27 Sep 2022
Action-Constrained Reinforcement Learning for Frame-Level Bit Allocation in HEVC/H.265 through Frank-Wolfe Policy Optimization Yung-Han Ho Yun Liang Chia-Hao Kao Wen-Hsiao Peng 90 1 0 10 Mar 2022
Breaking the Linear Iteration Cost Barrier for Some Well-known Conditional Gradient Methods Using MaxIP Data-structures Anshumali Shrivastava Zhao Song Zhaozhuo Xu 112 28 0 30 Nov 2021

We use cookies and other tracking technologies to improve your browsing experience on our website, to show you personalized content and targeted ads, to analyze our website traffic, and to understand where our visitors are coming from. See our policy.