Constrained Markov Decision Processes via Backward Value Functions

26 August 2020

Papers citing "Constrained Markov Decision Processes via Backward Value Functions"

14 / 14 papers shown

Title
Human-AI Collaboration in Real-World Complex Environment with Reinforcement Learning Md Saiful Islam Srijita Das S. Gottipati William Duguay Clodéric Mars Jalal Arabneydi Antoine Fagette Matthew J. Guzdial Matthew E. Taylor 41 1 0 23 Dec 2023
Adapting Static Fairness to Sequential Decision-Making: Bias Mitigation Strategies towards Equal Long-term Benefit Rate Yuancheng Xu Chenghao Deng Yanchao Sun Ruijie Zheng Xiyao Wang Jieyu Zhao Furong Huang 37 4 0 07 Sep 2023
ACPO: A Policy Optimization Algorithm for Average MDPs with Constraints Akhil Agnihotri R. Jain Haipeng Luo 29 2 0 02 Feb 2023
Guiding Safe Exploration with Weakest Preconditions Greg Anderson Swarat Chaudhuri Işıl Dillig 46 6 0 28 Sep 2022
Constrained Update Projection Approach to Safe Policy Optimization Long Yang Jiaming Ji Juntao Dai Linrui Zhang Binbin Zhou Pengfei Li Yaodong Yang Gang Pan 41 43 0 15 Sep 2022
A Review of Safe Reinforcement Learning: Methods, Theory and Applications Shangding Gu Longyu Yang Yali Du Guang Chen Florian Walter Jun Wang Alois C. Knoll OffRL AI4TS 117 241 0 20 May 2022
Safe Policy Optimization with Local Generalized Linear Function Approximations Akifumi Wachi Yunyue Wei Yanan Sui OffRL 35 10 0 09 Nov 2021
Offline Reinforcement Learning with Soft Behavior Regularization Haoran Xu Xianyuan Zhan Jianxiong Li Honglei Yin OffRL 31 31 0 14 Oct 2021
Constraints Penalized Q-learning for Safe Offline Reinforcement Learning Haoran Xu Xianyuan Zhan Xiangyu Zhu OffRL 16 86 0 19 Jul 2021
Escaping from Zero Gradient: Revisiting Action-Constrained Reinforcement Learning via Frank-Wolfe Policy Optimization Jyun-Li Lin Wei-Ting Hung Shangtong Yang Ping-Chun Hsieh Xi Liu 32 14 0 22 Feb 2021
Forethought and Hindsight in Credit Assignment Veronica Chelu Doina Precup H. V. Hasselt 22 25 0 26 Oct 2020
Learning with Safety Constraints: Sample Complexity of Reinforcement Learning for Constrained MDPs Aria HasanzadeZonuzy Archana Bura D. Kalathil S. Shakkottai 32 38 0 01 Aug 2020
Risk-Sensitive and Robust Decision-Making: a CVaR Optimization Approach Yinlam Chow Aviv Tamar Shie Mannor Marco Pavone 73 314 0 06 Jun 2015
Safe Exploration in Markov Decision Processes T. Moldovan Pieter Abbeel 78 308 0 22 May 2012