Safe Offline Reinforcement Learning with Feasibility-Guided Diffusion Model

19 January 2024

Shengbo Eben Li

Papers citing "Safe Offline Reinforcement Learning with Feasibility-Guided Diffusion Model"

34 / 34 papers shown

Title
Feasibility-Aware Pessimistic Estimation: Toward Long-Horizon Safety in Offline RL Zhikun Tao Gang Xiong He Fang Zhen Shen Yunjun Han Qing-Shan Jia OffRL 114 0 0 13 May 2025
Data Center Cooling System Optimization Using Offline Reinforcement Learning Xianyuan Zhan Xiangyu Zhu Peng Cheng Xiao Hu Ziteng He ... Chenhui Liu Tianshun Hong Huiwen Zheng Yunxin Liu Feng Zhao AI4CE 142 0 0 17 Feb 2025
Skill Expansion and Composition in Parameter Space Tenglong Liu Junjie Li Yinan Zheng Haoyi Niu Yixing Lan Xin Xu Xianyuan Zhan 111 4 0 09 Feb 2025
Datasets and Benchmarks for Offline Safe Reinforcement Learning Zuxin Liu Zijian Guo Haohong Lin Yi-Fan Yao Jiacheng Zhu ... Hanjiang Hu Wenhao Yu Tingnan Zhang Jie Tan Ding Zhao OffRL 61 43 0 15 Jun 2023
Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization Haoran Xu Li Jiang Jianxiong Li Zhuoran Yang Zhaoran Wang Victor Chan Xianyuan Zhan OffRL 82 83 0 28 Mar 2023
Constrained Decision Transformer for Offline Safe Reinforcement Learning Zuxin Liu Zijian Guo Yi-Fan Yao Zhepeng Cen Wenhao Yu Tingnan Zhang Ding Zhao OffRL 65 52 0 14 Feb 2023
Extreme Q-Learning: MaxEnt RL without Entropy Divyansh Garg Joey Hejna Matthieu Geist Stefano Ermon OffRL 65 77 0 05 Jan 2023
Is Conditional Generative Modeling all you need for Decision-Making? Anurag Ajay Yilun Du Abhi Gupta J. Tenenbaum Tommi Jaakkola Pulkit Agrawal DiffM 127 394 0 28 Nov 2022
Offline Reinforcement Learning via High-Fidelity Generative Behavior Modeling Huayu Chen Cheng Lu Chengyang Ying Hang Su Jun Zhu DiffM OffRL 157 116 0 29 Sep 2022
Classifier-Free Diffusion Guidance Jonathan Ho Tim Salimans FaML 193 3,889 0 26 Jul 2022
When to Trust Your Simulator: Dynamics-Aware Hybrid Offline-and-Online Reinforcement Learning Haoyi Niu Shubham Sharma Yiwen Qiu Ming Li Guyue Zhou Jianming Hu Xianyuan Zhan OffRL OnRL 92 50 0 27 Jun 2022
Mildly Conservative Q-Learning for Offline Reinforcement Learning Jiafei Lyu Xiaoteng Ma Xiu Li Zongqing Lu OffRL 65 110 0 09 Jun 2022
Reachability Constrained Reinforcement Learning Dongjie Yu Haitong Ma Sheng Li Jianyu Chen 93 58 0 16 May 2022
Saute RL: Almost Surely Safe Reinforcement Learning Using State Augmentation Aivar Sootla Alexander I. Cowen-Rivers Taher Jafferjee Ziyan Wang D. Mguni Jun Wang Haitham Bou-Ammar 86 54 0 14 Feb 2022
Offline Reinforcement Learning with Implicit Q-Learning Ilya Kostrikov Ashvin Nair Sergey Levine OffRL 286 910 0 12 Oct 2021
MetaDrive: Composing Diverse Driving Scenarios for Generalizable Reinforcement Learning Quanyi Li Zhenghao Peng Lan Feng Qihang Zhang Zhenghai Xue Bolei Zhou 94 252 0 26 Sep 2021
Constraints Penalized Q-learning for Safe Offline Reinforcement Learning Haoran Xu Xianyuan Zhan Xiangyu Zhu OffRL 62 90 0 19 Jul 2021
OptiDICE: Offline Policy Optimization via Stationary Distribution Correction Estimation Jongmin Lee Wonseok Jeon Byung-Jun Lee J. Pineau Kee-Eung Kim OffRL 170 99 0 21 Jun 2021
A Minimalist Approach to Offline Reinforcement Learning Scott Fujimoto S. Gu OffRL 127 822 0 12 Jun 2021
Diffusion Models Beat GANs on Image Synthesis Prafulla Dhariwal Alex Nichol 224 7,857 0 11 May 2021
Score-Based Generative Modeling through Stochastic Differential Equations Yang Song Jascha Narain Sohl-Dickstein Diederik P. Kingma Abhishek Kumar Stefano Ermon Ben Poole DiffM SyDa 335 6,480 0 26 Nov 2020
Recovery RL: Safe Reinforcement Learning with Learned Recovery Zones Brijen Thananjeyan Ashwin Balakrishna Suraj Nair Michael Luo K. Srinivasan M. Hwang Joseph E. Gonzalez Julian Ibarz Chelsea Finn Ken Goldberg OffRL 77 227 0 29 Oct 2020
Safe Reinforcement Learning in Constrained Markov Decision Processes Akifumi Wachi Yanan Sui 58 151 0 15 Aug 2020
Responsive Safety in Reinforcement Learning by PID Lagrangian Methods Adam Stooke Joshua Achiam Pieter Abbeel 76 299 0 08 Jul 2020
Conservative Q-Learning for Offline Reinforcement Learning Aviral Kumar Aurick Zhou George Tucker Sergey Levine OffRL OnRL 137 1,815 0 08 Jun 2020
Deep Reinforcement Learning for Autonomous Driving: A Survey B. R. Kiran Ibrahim Sobh V. Talpaert Patrick Mannion A. A. Sallab S. Yogamani P. Pérez 336 1,684 0 02 Feb 2020
Generative Modeling by Estimating Gradients of the Data Distribution Yang Song Stefano Ermon SyDa DiffM 258 3,916 0 12 Jul 2019
Stabilizing Off-Policy Q-Learning via Bootstrapping Error Reduction Aviral Kumar Justin Fu George Tucker Sergey Levine OffRL OnRL 129 1,060 0 03 Jun 2019
An Efficient Reachability-Based Framework for Provably Safe Autonomous Navigation in Unknown Environments Andrea V. Bajcsy Somil Bansal Eli Bronstein Varun Tolani Claire Tomlin 71 88 0 01 May 2019
Off-Policy Deep Reinforcement Learning without Exploration Scott Fujimoto David Meger Doina Precup OffRL BDL 226 1,613 0 07 Dec 2018
Reward Constrained Policy Optimization Chen Tessler D. Mankowitz Shie Mannor 83 540 0 28 May 2018
Addressing Function Approximation Error in Actor-Critic Methods Scott Fujimoto H. V. Hoof David Meger OffRL 172 5,187 0 26 Feb 2018
Safe Exploration in Continuous Action Spaces Gal Dalal Krishnamurthy Dvijotham Matej Vecerík Todd Hester Cosmin Paduraru Yuval Tassa 48 439 0 26 Jan 2018
Constrained Policy Optimization Joshua Achiam David Held Aviv Tamar Pieter Abbeel 110 1,325 0 30 May 2017