v1v2 (latest)

DiffCPS: Diffusion Model based Constrained Policy Search for Offline Reinforcement Learning

9 October 2023

Li Shen

Junbo Tan

ArXiv (abs)PDF HTML Github (8★)

Papers citing "DiffCPS: Diffusion Model based Constrained Policy Search for Offline Reinforcement Learning"

31 / 31 papers shown

Title
Enhancing Exploration with Diffusion Policies in Hybrid Off-Policy RL: Application to Non-Prehensile Manipulation Huy Le Miroslav Gabriel Tai Hoang Gerhard Neumann Ngo Anh Vien 148 1 0 22 Nov 2024
AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners Zhixuan Liang Yao Mu Mingyu Ding Fei Ni Masayoshi Tomizuka Ping Luo 131 108 0 03 Feb 2023
Is Conditional Generative Modeling all you need for Decision-Making? Anurag Ajay Yilun Du Abhi Gupta J. Tenenbaum Tommi Jaakkola Pulkit Agrawal DiffM 157 406 0 28 Nov 2022
Offline Reinforcement Learning via High-Fidelity Generative Behavior Modeling Huayu Chen Cheng Lu Chengyang Ying Hang Su Jun Zhu DiffM OffRL 171 120 0 29 Sep 2022
Classifier-Free Diffusion Guidance Jonathan Ho Tim Salimans FaML 196 3,963 0 26 Jul 2022
Generative Adversarial Networks Gilad Cohen Raja Giryes GAN 298 30,150 0 01 Mar 2022
Tackling the Generative Learning Trilemma with Denoising Diffusion GANs Zhisheng Xiao Karsten Kreis Arash Vahdat DiffM 102 558 0 15 Dec 2021
Offline Reinforcement Learning with Implicit Q-Learning Ilya Kostrikov Ashvin Nair Sergey Levine OffRL 301 927 0 12 Oct 2021
A Minimalist Approach to Offline Reinforcement Learning Scott Fujimoto S. Gu OffRL 132 829 0 12 Jun 2021
Diffusion Models Beat GANs on Image Synthesis Prafulla Dhariwal Alex Nichol 271 7,958 0 11 May 2021
Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of Pessimism Paria Rashidinejad Banghua Zhu Cong Ma Jiantao Jiao Stuart J. Russell OffRL 227 290 0 22 Mar 2021
Score-Based Generative Modeling through Stochastic Differential Equations Yang Song Jascha Narain Sohl-Dickstein Diederik P. Kingma Abhishek Kumar Stefano Ermon Ben Poole DiffM SyDa 353 6,586 0 26 Nov 2020
Critic Regularized Regression Ziyun Wang Alexander Novikov Konrad Zolna Jost Tobias Springenberg Scott E. Reed ... Noah Y. Siegel J. Merel Çağlar Gülçehre N. Heess Nando de Freitas OffRL 160 330 0 26 Jun 2020
AWAC: Accelerating Online Reinforcement Learning with Offline Datasets Ashvin Nair Abhishek Gupta Murtaza Dalal Sergey Levine OffRL OnRL 114 615 0 16 Jun 2020
Conservative Q-Learning for Offline Reinforcement Learning Aviral Kumar Aurick Zhou George Tucker Sergey Levine OffRL OnRL 143 1,835 0 08 Jun 2020
MOReL : Model-Based Offline Reinforcement Learning Rahul Kidambi Aravind Rajeswaran Praneeth Netrapalli Thorsten Joachims OffRL 101 676 0 12 May 2020
D4RL: Datasets for Deep Data-Driven Reinforcement Learning Justin Fu Aviral Kumar Ofir Nachum George Tucker Sergey Levine GP OffRL 231 1,381 0 15 Apr 2020
Behavior Regularized Offline Reinforcement Learning Yifan Wu George Tucker Ofir Nachum OffRL 97 690 0 26 Nov 2019
Constrained Reinforcement Learning Has Zero Duality Gap Santiago Paternain Luiz F. O. Chamon Miguel Calvo-Fullana Alejandro Ribeiro 59 193 0 29 Oct 2019
BAIL: Best-Action Imitation Learning for Batch Deep Reinforcement Learning Xinyue Chen Zijian Zhou Ziyi Wang Che Wang Yanqiu Wu George Andriopoulos OffRL 90 124 0 27 Oct 2019
Generative Modeling by Estimating Gradients of the Data Distribution Yang Song Stefano Ermon SyDa DiffM 258 3,961 0 12 Jul 2019
A Survey of Autonomous Driving: Common Practices and Emerging Technologies Ekim Yurtsever Jacob Lambert Alexander Carballo K. Takeda 93 1,389 0 12 Jun 2019
Stabilizing Off-Policy Q-Learning via Bootstrapping Error Reduction Aviral Kumar Justin Fu George Tucker Sergey Levine OffRL OnRL 137 1,066 0 03 Jun 2019
Soft Actor-Critic Algorithms and Applications Tuomas Haarnoja Aurick Zhou Kristian Hartikainen George Tucker Sehoon Ha ... Vikash Kumar Henry Zhu Abhishek Gupta Pieter Abbeel Sergey Levine 145 2,450 0 13 Dec 2018
Off-Policy Deep Reinforcement Learning without Exploration Scott Fujimoto David Meger Doina Precup OffRL BDL 251 1,625 0 07 Dec 2018
Addressing Function Approximation Error in Actor-Critic Methods Scott Fujimoto H. V. Hoof David Meger OffRL 189 5,218 0 26 Feb 2018
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor Tuomas Haarnoja Aurick Zhou Pieter Abbeel Sergey Levine 317 8,420 0 04 Jan 2018
Continuous control with deep reinforcement learning Timothy Lillicrap Jonathan J. Hunt Alexander Pritzel N. Heess Tom Erez Yuval Tassa David Silver Daan Wierstra 327 13,289 0 09 Sep 2015
Variational Inference with Normalizing Flows Danilo Jimenez Rezende S. Mohamed DRL BDL 322 4,197 0 21 May 2015
Deep Unsupervised Learning using Nonequilibrium Thermodynamics Jascha Narain Sohl-Dickstein Eric A. Weiss Niru Maheswaranathan Surya Ganguli SyDa DiffM 312 7,031 0 12 Mar 2015
Auto-Encoding Variational Bayes Diederik P. Kingma Max Welling BDL 455 16,922 0 20 Dec 2013