Revisiting Design Choices in Offline Model-Based Reinforcement Learning

8 October 2021

Papers citing "Revisiting Design Choices in Offline Model-Based Reinforcement Learning"

42 / 42 papers shown

Title
VIPO: Value Function Inconsistency Penalized Offline Reinforcement Learning Xuyang Chen Guojian Wang Keyu Yan Lin Zhao OffRL 37 1 0 16 Apr 2025
A Clean Slate for Offline Reinforcement Learning Matthew Jackson Uljad Berdica Jarek Liesen Shimon Whiteson Jakob Foerster OffRL OnRL 49 0 0 15 Apr 2025
Dual Alignment Maximin Optimization for Offline Model-based RL Chi Zhou Wang Luo Haoran Li Congying Han Tiande Guo Zicheng Zhang OffRL 71 0 0 02 Feb 2025
HopCast: Calibration of Autoregressive Dynamics Models Muhammad Bilal Shahid Cody H. Fleming UQCV 45 0 0 27 Jan 2025
Deterministic Uncertainty Propagation for Improved Model-Based Offline Reinforcement Learning Abdullah Akgul Manuel Haußmann M. Kandemir OffRL 71 1 0 17 Jan 2025
Bayes Adaptive Monte Carlo Tree Search for Offline Model-based Reinforcement Learning Jiayu Chen Wentse Chen Jeff Schneider OffRL 31 1 0 15 Oct 2024
Scaling Offline Model-Based RL via Jointly-Optimized World-Action Model Pretraining Jie Cheng Ruixi Qiao Gang Xiong Binhua Li Yingwei Ma Binhua Li Yongbin Li Yisheng Lv OffRL OnRL LM&Ro 50 3 0 01 Oct 2024
SUMO: Search-Based Uncertainty Estimation for Model-Based Offline Reinforcement Learning Zhongjian Qiao Jiafei Lyu Kechen Jiao Qi Liu Xiu Li OffRL 35 4 0 23 Aug 2024
SAMBO-RL: Shifts-aware Model-based Offline Reinforcement Learning Wang Luo Haoran Li Zicheng Zhang Congying Han Jiayu Lv Tiande Guo OffRL 46 1 0 23 Aug 2024
Temporal Abstraction in Reinforcement Learning with Offline Data Ranga Shaarad Ayyagari Anurita Ghosh Ambedkar Dukkipati OffRL 21 0 0 21 Jul 2024
On the consistency of hyper-parameter selection in value-based deep reinforcement learning J. Obando-Ceron J. G. Araújo Aaron C. Courville Pablo Samuel Castro 42 6 0 25 Jun 2024
Trust the Model Where It Trusts Itself -- Model-Based Actor-Critic with Uncertainty-Aware Rollout Adaption Bernd Frauenknecht Artur Eisele Devdutt Subhasish Friedrich Solowjow Sebastian Trimpe 49 5 0 29 May 2024
GTA: Generative Trajectory Augmentation with Guidance for Offline Reinforcement Learning Jaewoo Lee Sujin Yun Taeyoung Yun Jinkyoo Park 46 6 0 27 May 2024
Is Mamba Compatible with Trajectory Optimization in Offline Reinforcement Learning? Yang Dai Oubo Ma Longfei Zhang Xingxing Liang Shengchao Hu Mengzhu Wang Shouling Ji Jincai Huang Li Shen Mamba 31 4 0 20 May 2024
Policy-Guided Diffusion Matthew Jackson Michael T. Matthews Cong Lu Benjamin Ellis Shimon Whiteson Jakob N. Foerster OffRL 49 17 0 09 Apr 2024
The Edge-of-Reach Problem in Offline Model-Based Reinforcement Learning Anya Sims Cong Lu Yee Whye Teh OffRL 35 3 0 19 Feb 2024
SEABO: A Simple Search-Based Method for Offline Imitation Learning Jiafei Lyu Xiaoteng Ma Le Wan Runze Liu Xiu Li Zongqing Lu OffRL 19 9 0 06 Feb 2024
Uncertainty-Penalized Reinforcement Learning from Human Feedback with Diverse Reward LoRA Ensembles Yuanzhao Zhai Han Zhang Yu Lei Yue Yu Kele Xu Dawei Feng Bo Ding Huaimin Wang AI4CE 72 32 0 30 Dec 2023
Improving Offline-to-Online Reinforcement Learning with Q Conditioned State Entropy Exploration Ziqi Zhang Xiao Xiong Zifeng Zhuang Jinxin Liu Donglin Wang OffRL OnRL 42 0 0 07 Oct 2023
Efficient Planning with Latent Diffusion Wenhao Li DiffM 40 4 0 30 Sep 2023
How to Fine-tune the Model: Unified Model Shift and Model Bias Policy Optimization Hai Zhang Hang Yu Junqiao Zhao Di Zhang Chang Huang Hongtu Zhou Xiao Zhang Chen Ye 11 9 0 22 Sep 2023
A Bayesian Approach to Robust Inverse Reinforcement Learning Ran Wei Siliang Zeng Chenliang Li Alfredo García Anthony D. McDonald Mingyi Hong OffRL 28 4 0 15 Sep 2023
Model-based Offline Reinforcement Learning with Count-based Conservatism Byeongchang Kim Min Hwan Oh OffRL 17 12 0 21 Jul 2023
Reward-Free Curricula for Training Robust World Models Marc Rigter Minqi Jiang Ingmar Posner VLM OffRL 31 6 0 15 Jun 2023
HIPODE: Enhancing Offline Reinforcement Learning with High-Quality Synthetic Data from a Policy-Decoupled Approach Shixi Lian Yi Ma Jinyi Liu Yan Zheng Zhaopeng Meng OffRL 16 1 0 10 Jun 2023
Offline Meta Reinforcement Learning with In-Distribution Online Adaptation Jianhao Wang Jin Zhang Haozhe Jiang Junyu Zhang Liwei Wang Chongjie Zhang OffRL 26 9 0 31 May 2023
Synthetic Experience Replay Cong Lu Philip J. Ball Yee Whye Teh Jack Parker-Holder OffRL 94 67 0 12 Mar 2023
When Demonstrations Meet Generative World Models: A Maximum Likelihood Framework for Offline Inverse Reinforcement Learning Siliang Zeng Chenliang Li Alfredo García Min-Fong Hong OffRL 34 13 0 15 Feb 2023
One Risk to Rule Them All: A Risk-Sensitive Perspective on Model-Based Offline Reinforcement Learning Marc Rigter Bruno Lacerda Nick Hawes OffRL 16 6 0 30 Nov 2022
Efficient Planning in a Compact Latent Action Space Zhengyao Jiang Tianjun Zhang Michael Janner Yueying Li Tim Rocktaschel Edward Grefenstette Yuandong Tian OffRL 18 36 0 22 Aug 2022
Double Check Your State Before Trusting It: Confidence-Aware Bidirectional Offline Model-Based Imagination Jiafei Lyu Xiu Li Zongqing Lu OffRL 29 25 0 16 Jun 2022
Adversarial Counterfactual Environment Model Learning Xiong-Hui Chen Yang Yu Zhenghong Zhu Zhihua Yu Zhen-Yu Chen ... Yinan Wu Hongqiu Wu Rongjun Qin Rui Ding Fangsheng Huang CML OffRL 13 12 0 10 Jun 2022
Challenges and Opportunities in Offline Reinforcement Learning from Visual Observations Cong Lu Philip J. Ball Tim G. J. Rudner Jack Parker-Holder Michael A. Osborne Yee Whye Teh OffRL 24 52 0 09 Jun 2022
Offline Policy Comparison with Confidence: Benchmarks and Baselines Anurag Koul Mariano Phielipp Alan Fern OffRL 25 0 0 22 May 2022
User-Interactive Offline Reinforcement Learning Phillip Swazinna Steffen Udluft Thomas Runkler OffRL 25 11 0 21 May 2022
Automated Reinforcement Learning (AutoRL): A Survey and Open Problems Jack Parker-Holder Raghunandan Rajan Xingyou Song André Biedenkapp Yingjie Miao ... Vu-Linh Nguyen Roberto Calandra Aleksandra Faust Frank Hutter Marius Lindauer AI4CE 33 100 0 11 Jan 2022
Offline Reinforcement Learning with Implicit Q-Learning Ilya Kostrikov Ashvin Nair Sergey Levine OffRL 214 839 0 12 Oct 2021
COMBO: Conservative Offline Model-Based Policy Optimization Tianhe Yu Aviral Kumar Rafael Rafailov Aravind Rajeswaran Sergey Levine Chelsea Finn OffRL 219 413 0 16 Feb 2021
Model-based Policy Optimization with Unsupervised Model Adaptation Jian Shen Han Zhao Weinan Zhang Yong Yu 30 27 0 19 Oct 2020
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 340 1,955 0 04 May 2020
Provably Efficient Online Hyperparameter Optimization with Population-Based Bandits Jack Parker-Holder Vu Nguyen Stephen J. Roberts OffRL 72 83 0 06 Feb 2020
Simple and Scalable Predictive Uncertainty Estimation using Deep Ensembles Balaji Lakshminarayanan Alexander Pritzel Charles Blundell UQCV BDL 276 5,661 0 05 Dec 2016