Offline Reinforcement Learning with Soft Behavior Regularization

14 October 2021

Papers citing "Offline Reinforcement Learning with Soft Behavior Regularization"

32 / 32 papers shown

Title
An Optimal Discriminator Weighted Imitation Perspective for Reinforcement Learning Haoran Xu Shuozhe Li Harshit S. Sikchi S. Niekum Amy Zhang OffRL 27 0 0 17 Apr 2025
ComaDICE: Offline Cooperative Multi-Agent Reinforcement Learning with Stationary Distribution Shift Regularization The Viet Bui Thanh Hong Nguyen Tien Mai OffRL 30 0 0 02 Oct 2024
Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement Learning Liyuan Mao Haoran Xu Weinan Zhang Xianyuan Zhan Amy Zhang OffRL 41 5 0 29 Jul 2024
Aligning Diffusion Behaviors with Q-functions for Efficient Continuous Control Huayu Chen Kaiwen Zheng Hang Su Jun Zhu 51 1 0 12 Jul 2024
UDQL: Bridging The Gap between MSE Loss and The Optimal Value Function in Offline Reinforcement Learning Yu Zhang Rui Yu Zhipeng Yao Wenyuan Zhang Jun Wang Liming Zhang OffRL 53 0 0 05 Jun 2024
A Model-Based Approach for Improving Reinforcement Learning Efficiency Leveraging Expert Observations E. C. Ozcan Vittorio Giammarino James Queeney I. Paschalidis OffRL 39 0 0 29 Feb 2024
ODICE: Revealing the Mystery of Distribution Correction Estimation via Orthogonal-gradient Update Liyuan Mao Haoran Xu Weinan Zhang Xianyuan Zhan 34 10 0 01 Feb 2024
Guided Data Augmentation for Offline Reinforcement Learning and Imitation Learning Nicholas Corrado Yu-Tao Qu John U. Balis Adam Labiosa Josiah P. Hanna OffRL 35 2 0 27 Oct 2023
Score Regularized Policy Optimization through Diffusion Behavior Huayu Chen Cheng Lu Zhengyi Wang Hang Su Jun Zhu 28 20 0 11 Oct 2023
Benchmarking Offline Reinforcement Learning on Real-Robot Hardware Nico Gürtler Sebastian Blaes Pavel Kolev Felix Widmaier Manuel Wüthrich Stefan Bauer Bernhard Schölkopf Georg Martius OffRL 33 28 0 28 Jul 2023
Offline Multi-Agent Reinforcement Learning with Implicit Global-to-Local Value Regularization Xiangsen Wang Haoran Xu Yinan Zheng Xianyuan Zhan OffRL 33 23 0 21 Jul 2023
Offline Diversity Maximization Under Imitation Constraints Marin Vlastelica Jin Cheng Georg Martius Pavel Kolev OffRL 44 0 0 21 Jul 2023
Offline Reinforcement Learning with Imbalanced Datasets Li Jiang Sijie Cheng Jielin Qiu Haoran Xu Wai Kin Victor Chan Zhao Ding OffRL 34 3 0 06 Jul 2023
Look Beneath the Surface: Exploiting Fundamental Symmetry for Sample-Efficient Offline RL Peng Cheng Xianyuan Zhan Zhihao Wu Wenjia Zhang Shoucheng Song Han Wang Youfang Lin Li Jiang OffRL 40 9 0 07 Jun 2023
PROTO: Iterative Policy Regularized Offline-to-Online Reinforcement Learning Jianxiong Li Xiao Hu Haoran Xu Jingjing Liu Xianyuan Zhan Ya-Qin Zhang OffRL OnRL 36 19 0 25 May 2023
Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization Haoran Xu Li Jiang Jianxiong Li Zhuoran Yang Zhaoran Wang Victor Chan Xianyuan Zhan OffRL 36 71 0 28 Mar 2023
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning Pengqin Wang Meixin Zhu Shaojie Shen OffRL 30 1 0 07 Mar 2023
Behavior Proximal Policy Optimization Zifeng Zhuang Kun Lei Jinxin Liu Donglin Wang Yilang Guo OffRL 27 34 0 22 Feb 2023
Mind the Gap: Offline Policy Optimization for Imperfect Rewards Jianxiong Li Xiao Hu Haoran Xu Jingjing Liu Xianyuan Zhan Qing-Shan Jia Ya-Qin Zhang OffRL 38 19 0 03 Feb 2023
State-Aware Proximal Pessimistic Algorithms for Offline Reinforcement Learning Cheng Chen Hongyao Tang Yi Ma Chao Wang Qianli Shen Dong Li Jianye Hao OffRL 28 0 0 28 Nov 2022
A Policy-Guided Imitation Approach for Offline Reinforcement Learning Haoran Xu Li Jiang Jianxiong Li Xianyuan Zhan OffRL 26 61 0 15 Oct 2022
Discriminator-Guided Model-Based Offline Imitation Learning Wenjia Zhang Haoran Xu Haoyi Niu Peng Cheng Ming Li Heming Zhang Guyue Zhou Xianyuan Zhan OffRL 14 16 0 01 Jul 2022
When to Trust Your Simulator: Dynamics-Aware Hybrid Offline-and-Online Reinforcement Learning Haoyi Niu Shubham Sharma Yiwen Qiu Ming Li Guyue Zhou Jianming Hu Xianyuan Zhan OffRL OnRL 27 46 0 27 Jun 2022
When Data Geometry Meets Deep Function: Generalizing Offline Reinforcement Learning Jianxiong Li Xianyuan Zhan Haoran Xu Xiangyu Zhu Jingjing Liu Ya-Qin Zhang OffRL 35 24 0 23 May 2022
How to Spend Your Robot Time: Bridging Kickstarting and Offline Reinforcement Learning for Vision-based Robotic Manipulation Alex X. Lee Coline Devin Jost Tobias Springenberg Yuxiang Zhou Thomas Lampe A. Abdolmaleki Konstantinos Bousmalis OffRL OnRL 18 15 0 06 May 2022
Supported Policy Optimization for Offline Reinforcement Learning Jialong Wu Haixu Wu Zihan Qiu Jianmin Wang Mingsheng Long OffRL 35 64 0 13 Feb 2022
Model-Based Offline Planning with Trajectory Pruning Xianyuan Zhan Xiangyu Zhu Haoran Xu OffRL 40 36 0 16 May 2021
DeepThermal: Combustion Optimization for Thermal Power Generating Units Using Offline Reinforcement Learning Xianyuan Zhan Haoran Xu Yueying Zhang Xiangyu Zhu Honglei Yin Yu Zheng OffRL AI4CE 40 67 0 23 Feb 2021
EMaQ: Expected-Max Q-Learning Operator for Simple Yet Effective Offline and Online RL Seyed Kamyar Seyed Ghasemipour Dale Schuurmans S. Gu OffRL 209 119 0 21 Jul 2020
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 340 1,960 0 04 May 2020
BRPO: Batch Residual Policy Optimization Kentaro Kanamori Yinlam Chow Takuya Takagi Hiroki Arimura Honglak Lee Ken Kobayashi Craig Boutilier OffRL 139 46 0 08 Feb 2020
Off-Policy Actor-Critic T. Degris Martha White R. Sutton OffRL CML 163 220 0 22 May 2012