A Minimalist Approach to Offline Reinforcement Learning

12 June 2021

Papers citing "A Minimalist Approach to Offline Reinforcement Learning"

50 / 524 papers shown

Title
A Simple Unified Uncertainty-Guided Framework for Offline-to-Online Reinforcement Learning Siyuan Guo Yanchao Sun Jifeng Hu Sili Huang Hechang Chen Haiyin Piao Lichao Sun Yi-Ju Chang OffRL OnRL 31 7 0 13 Jun 2023
Improving Offline-to-Online Reinforcement Learning with Q-Ensembles Kai-Wen Zhao Yi Ma Jianye Hao Jinyi Liu Yan Zheng Zhaopeng Meng OffRL OnRL 20 12 0 12 Jun 2023
Policy Regularization with Dataset Constraint for Offline Reinforcement Learning Yuhang Ran Yi-Chen Li Fuxiang Zhang Zongzhang Zhang Yang Yu OffRL 21 23 0 11 Jun 2023
HIPODE: Enhancing Offline Reinforcement Learning with High-Quality Synthetic Data from a Policy-Decoupled Approach Shixi Lian Yi Ma Jinyi Liu Yan Zheng Zhaopeng Meng OffRL 18 1 0 10 Jun 2023
Decision Stacks: Flexible Reinforcement Learning via Modular Generative Models Siyan Zhao Aditya Grover OffRL 16 7 0 09 Jun 2023
Value function estimation using conditional diffusion models for control Bogdan Mazoure Walter A. Talbott Miguel Angel Bautista R. Devon Hjelm Alexander Toshev J. Susskind DiffM 27 4 0 09 Jun 2023
Iteratively Refined Behavior Regularization for Offline Reinforcement Learning Xiao Hu Yi Ma Chenjun Xiao Yan Zheng Zhaopeng Meng OffRL 18 4 0 09 Jun 2023
Decoupled Prioritized Resampling for Offline RL Yang Yue Bingyi Kang Xiao Ma Qisen Yang Gao Huang S. Song Shuicheng Yan OffRL 27 0 0 08 Jun 2023
Instructed Diffuser with Temporal Condition Guidance for Offline Reinforcement Learning Jifeng Hu Yan Sun Sili Huang Siyuan Guo Hechang Chen Li Shen Lichao Sun Yi-Ju Chang Dacheng Tao DiffM OffRL 40 13 0 08 Jun 2023
Look Beneath the Surface: Exploiting Fundamental Symmetry for Sample-Efficient Offline RL Peng Cheng Xianyuan Zhan Zhihao Wu Wenjia Zhang Shoucheng Song Han Wang Youfang Lin Li Jiang OffRL 40 9 0 07 Jun 2023
Value Functions are Control Barrier Functions: Verification of Safe Policies using Control Theory Daniel C.H. Tan Fernando Acero Robert McCarthy Dimitrios Kanoulas Zhibin Li OffRL 30 2 0 06 Jun 2023
Mildly Constrained Evaluation Policy for Offline Reinforcement Learning Linjie Xu Zhengyao Jiang Jinyu Wang Lei Song Jiang Bian OffRL 33 0 0 06 Jun 2023
Boosting Offline Reinforcement Learning with Action Preference Query Qisen Yang Shenzhi Wang Matthieu Lin S. Song Gao Huang OffRL 13 9 0 06 Jun 2023
Stabilizing Contrastive RL: Techniques for Robotic Goal Reaching from Offline Data Chongyi Zheng Benjamin Eysenbach Homer Walke Patrick Yin Kuan Fang Ruslan Salakhutdinov Sergey Levine SSL OffRL 39 4 0 06 Jun 2023
Survival Instinct in Offline Reinforcement Learning Anqi Li Dipendra Kumar Misra Andrey Kolobov Ching-An Cheng OffRL 22 16 0 05 Jun 2023
Seizing Serendipity: Exploiting the Value of Past Success in Off-Policy Actor-Critic Tianying Ji Yuping Luo Gang Hua Xianyuan Zhan Jianwei Zhang Huazhe Xu OffRL OnRL 37 14 0 05 Jun 2023
For SALE: State-Action Representation Learning for Deep Reinforcement Learning Scott Fujimoto Wei-Di Chang Edward James Smith S. Gu Doina Precup D. Meger OffRL 25 44 0 04 Jun 2023
Delphic Offline Reinforcement Learning under Nonidentifiable Hidden Confounding Alizée Pace Hugo Yèche Bernhard Schölkopf Gunnar Rätsch Guy Tennenholtz OffRL 16 6 0 01 Jun 2023
Improving and Benchmarking Offline Reinforcement Learning Algorithms Bingyi Kang Xiao Ma Yi-Ren Wang Yang Yue Shuicheng Yan OffRL 10 9 0 01 Jun 2023
IQL-TD-MPC: Implicit Q-Learning for Hierarchical Model Predictive Control Rohan Chitnis Yingchen Xu B. Hashemi Lucas Lehnert Ürün Dogan Zheqing Zhu Olivier Delalleau OffRL 26 9 0 01 Jun 2023
Safe Offline Reinforcement Learning with Real-Time Budget Constraints Qian Lin Bo Tang Zifan Wu Chao Yu Shangqin Mao Qianlong Xie Xingxing Wang Dong Wang OffRL 34 11 0 01 Jun 2023
Improving Offline RL by Blending Heuristics Sinong Geng Aldo Pacchiano Andrey Kolobov Ching-An Cheng OffRL 30 7 0 01 Jun 2023
Efficient Diffusion Policies for Offline Reinforcement Learning Bingyi Kang Xiao Ma Chao Du Tianyu Pang Shuicheng Yan OffRL 34 62 0 31 May 2023
What is Essential for Unseen Goal Generalization of Offline Goal-conditioned RL? Rui Yang Yong Lin Xiaoteng Ma Haotian Hu Chongjie Zhang Tong Zhang OffRL 29 22 0 30 May 2023
Diffusion Model is an Effective Planner and Data Synthesizer for Multi-Task Reinforcement Learning Haoran He Chenjia Bai Kang Xu Zhuoran Yang Weinan Zhang Dong Wang Bingyan Zhao Xuelong Li DiffM OffRL 32 89 0 29 May 2023
Cross-Domain Policy Adaptation via Value-Guided Data Filtering Kang Xu Chenjia Bai Xiaoteng Ma Dong Wang Bingyan Zhao Zhen Wang Xuelong Li Wei Li 31 14 0 28 May 2023
A Model-Based Solution to the Offline Multi-Agent Reinforcement Learning Coordination Problem Paul Barde Jakob N. Foerster Derek Nowrouzezahrai Amy Zhang OffRL 25 8 0 26 May 2023
Emergent Agentic Transformer from Chain of Hindsight Experience Hao Liu Pieter Abbeel OffRL 35 25 0 26 May 2023
PROTO: Iterative Policy Regularized Offline-to-Online Reinforcement Learning Jianxiong Li Xiao Hu Haoran Xu Jingjing Liu Xianyuan Zhan Ya-Qin Zhang OffRL OnRL 36 19 0 25 May 2023
Making Offline RL Online: Collaborative World Models for Offline Visual Reinforcement Learning Q. Wang Jun Yang Yunbo Wang Xin Jin Wenjun Zeng Xiaokang Yang OffRL OnRL 35 3 0 24 May 2023
OER: Offline Experience Replay for Continual Offline Reinforcement Learning Sibo Gai Donglin Wang Li He CLL OffRL 45 3 0 23 May 2023
Bayesian Reparameterization of Reward-Conditioned Reinforcement Learning with Energy-based Models Wenhao Ding Tong Che Ding Zhao Marco Pavone BDL OffRL 14 2 0 18 May 2023
Revisiting the Minimalist Approach to Offline Reinforcement Learning Denis Tarasov Vladislav Kurenkov Alexander Nikulin Sergey Kolesnikov OffRL 33 36 0 16 May 2023
Federated Ensemble-Directed Offline Reinforcement Learning Desik Rengarajan N. Ragothaman D. Kalathil S. Shakkottai OffRL 32 1 0 04 May 2023
CCIL: Context-conditioned imitation learning for urban driving Ke Guo Wei Jing Junbo Chen Jia-Yu Pan 49 9 0 04 May 2023
Distance Weighted Supervised Learning for Offline Interaction Data Joey Hejna Jensen Gao Dorsa Sadigh OffRL 36 12 0 26 Apr 2023
IDQL: Implicit Q-Learning as an Actor-Critic Method with Diffusion Policies Philippe Hansen-Estruch Ilya Kostrikov Michael Janner J. Kuba Sergey Levine OffRL 25 130 0 20 Apr 2023
Hyper-Decision Transformer for Efficient Online Policy Adaptation Mengdi Xu Yuchen Lu Yikang Shen Shun Zhang Ding Zhao Chuang Gan OffRL 28 39 0 17 Apr 2023
Uncertainty-driven Trajectory Truncation for Data Augmentation in Offline Reinforcement Learning Junjie Zhang Jiafei Lyu Xiaoteng Ma Jiangpeng Yan Jun Yang Le Wan Xiu Li OffRL 13 5 0 10 Apr 2023
Optimal Goal-Reaching Reinforcement Learning via Quasimetric Learning Tongzhou Wang Antonio Torralba Phillip Isola Amy Zhang OffRL 32 31 0 03 Apr 2023
Reduce, Reuse, Recycle: Selective Reincarnation in Multi-Agent Reinforcement Learning Claude Formanek C. Tilbury Jonathan P. Shock Kale-ab Tessera Arnu Pretorius 29 3 0 31 Mar 2023
Finetuning from Offline Reinforcement Learning: Challenges, Trade-offs and Practical Solutions Yicheng Luo Jackie Kay Edward Grefenstette M. Deisenroth OffRL OnRL 13 15 0 30 Mar 2023
MAHALO: Unifying Offline Reinforcement Learning and Imitation Learning from Observations Anqi Li Byron Boots Ching-An Cheng OffRL 28 16 0 30 Mar 2023
Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization Haoran Xu Li Jiang Jianxiong Li Zhuoran Yang Zhaoran Wang Victor Chan Xianyuan Zhan OffRL 36 71 0 28 Mar 2023
Inverse Reinforcement Learning without Reinforcement Learning Gokul Swamy Sanjiban Choudhury J. Andrew Bagnell Zhiwei Steven Wu 21 34 0 26 Mar 2023
Optimal Transport for Offline Imitation Learning Yicheng Luo Zhengyao Jiang Samuel N. Cohen Edward Grefenstette M. Deisenroth OffRL 40 26 0 24 Mar 2023
Boosting Reinforcement Learning and Planning with Demonstrations: A Survey Tongzhou Mu H. Su OffRL 35 1 0 23 Mar 2023
Bridging Imitation and Online Reinforcement Learning: An Optimistic Tale Botao Hao Rahul Jain Dengwang Tang Zheng Wen OffRL 29 3 0 20 Mar 2023
A Survey of Demonstration Learning André Rosa de Sousa Porfírio Correia Luís A. Alexandre OffRL 36 17 0 20 Mar 2023
DataLight: Offline Data-Driven Traffic Signal Control Li Zhang Yutong Zhang J. Deng Chen Li OffRL 16 0 0 20 Mar 2023