MOReL : Model-Based Offline Reinforcement Learning

12 May 2020

Aravind Rajeswaran

Papers citing "MOReL : Model-Based Offline Reinforcement Learning"

50 / 172 papers shown

Title
Offline RL for Natural Language Generation with Implicit Language Q Learning Charles Burton Snell Ilya Kostrikov Yi Su Mengjiao Yang Sergey Levine OffRL 144 102 0 05 Jun 2022
Incorporating Explicit Uncertainty Estimates into Deep Offline Reinforcement Learning David Brandfonbrener Rémi Tachet des Combes Romain Laroche OffRL 37 5 0 02 Jun 2022
Minimax Optimal Online Imitation Learning via Replay Estimation Gokul Swamy Nived Rajaraman Matt Peng Sanjiban Choudhury J. Andrew Bagnell Zhiwei Steven Wu Jiantao Jiao Kannan Ramchandran OffRL 29 18 0 30 May 2022
Pessimism in the Face of Confounders: Provably Efficient Offline Reinforcement Learning in Partially Observable Markov Decision Processes Miao Lu Yifei Min Zhaoran Wang Zhuoran Yang OffRL 57 22 0 26 May 2022
Offline Policy Comparison with Confidence: Benchmarks and Baselines Anurag Koul Mariano Phielipp Alan Fern OffRL 28 0 0 22 May 2022
User-Interactive Offline Reinforcement Learning Phillip Swazinna Steffen Udluft Thomas Runkler OffRL 25 11 0 21 May 2022
Planning with Diffusion for Flexible Behavior Synthesis Michael Janner Yilun Du J. Tenenbaum Sergey Levine DiffM 202 632 0 20 May 2022
Data Valuation for Offline Reinforcement Learning Amir Abolfazli Gregory Palmer D. Kudenko OffRL 23 0 0 19 May 2022
BATS: Best Action Trajectory Stitching I. Char Viraj Mehta Adam R. Villaflor John M. Dolan J. Schneider OffRL 30 8 0 26 Apr 2022
Forgetting and Imbalance in Robot Lifelong Learning with Off-policy Data Wenxuan Zhou Steven Bohez Jan Humplik A. Abdolmaleki Dushyant Rao Markus Wulfmeier Tuomas Haarnoja N. Heess OffRL 37 6 0 12 Apr 2022
RB2: Robotic Manipulation Benchmarking with a Twist Sudeep Dasari Jianren Wang Joyce Hong Shikhar Bahl Yixin Lin ... David Held Lerrel Pinto Deepak Pathak Vikash Kumar Abhi Gupta 32 27 0 15 Mar 2022
The Efficacy of Pessimism in Asynchronous Q-Learning Yuling Yan Gen Li Yuxin Chen Jianqing Fan OffRL 78 40 0 14 Mar 2022
DARA: Dynamics-Aware Reward Augmentation in Offline Reinforcement Learning Jinxin Liu Hongyin Zhang Donglin Wang OffRL 38 32 0 13 Mar 2022
Near-optimal Offline Reinforcement Learning with Linear Representation: Leveraging Variance Information with Pessimism Ming Yin Yaqi Duan Mengdi Wang Yu-Xiang Wang OffRL 34 66 0 11 Mar 2022
Temporal Difference Learning for Model Predictive Control Nicklas Hansen Xiaolong Wang H. Su PINN MU 36 224 0 09 Mar 2022
Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement Learning Chenjia Bai Lingxiao Wang Zhuoran Yang Zhihong Deng Animesh Garg Peng Liu Zhaoran Wang OffRL 37 132 0 23 Feb 2022
TransDreamer: Reinforcement Learning with Transformer World Models Changgu Chen Yi-Fu Wu Jaesik Yoon Sungjin Ahn OffRL 32 90 0 19 Feb 2022
Model-Based Offline Meta-Reinforcement Learning with Regularization Sen Lin Jialin Wan Tengyu Xu Yingbin Liang Junshan Zhang OffRL 31 17 0 07 Feb 2022
Adversarially Trained Actor Critic for Offline Reinforcement Learning Ching-An Cheng Tengyang Xie Nan Jiang Alekh Agarwal OffRL 11 125 0 05 Feb 2022
Versatile Offline Imitation from Observations and Examples via Regularized State-Occupancy Matching Yecheng Jason Ma Andrew Shen Dinesh Jayaraman Osbert Bastani OffRL 23 32 0 04 Feb 2022
Offline Reinforcement Learning for Road Traffic Control Mayuresh Kunjir S. Chawla OffRL 32 4 0 07 Jan 2022
Can Reinforcement Learning Find Stackelberg-Nash Equilibria in General-Sum Markov Games with Myopic Followers? Han Zhong Zhuoran Yang Zhaoran Wang Michael I. Jordan 29 30 0 27 Dec 2021
RvS: What is Essential for Offline RL via Supervised Learning? Scott Emmons Benjamin Eysenbach Ilya Kostrikov Sergey Levine OffRL 31 170 0 20 Dec 2021
ED2: Environment Dynamics Decomposition World Models for Continuous Control Jianye Hao Yifu Yuan Cong Wang Zhen Wang OffRL 16 1 0 06 Dec 2021
Pessimistic Model Selection for Offline Deep Reinforcement Learning Chao-Han Huck Yang Zhengling Qi Yifan Cui Pin-Yu Chen OffRL 39 4 0 29 Nov 2021
Measuring Data Quality for Dataset Selection in Offline Reinforcement Learning Phillip Swazinna Steffen Udluft Thomas Runkler OffRL 25 6 0 26 Nov 2021
Sample Efficient Imitation Learning via Reward Function Trained in Advance Lihua Zhang 22 1 0 23 Nov 2021
UMBRELLA: Uncertainty-Aware Model-Based Offline Reinforcement Learning Leveraging Planning Christopher P. Diehl Timo Sievernich Martin Krüger F. Hoffmann Torsten Bertram OffRL 26 26 0 22 Nov 2021
Exploiting Action Impact Regularity and Exogenous State Variables for Offline Reinforcement Learning Vincent Liu James Wright Martha White OffRL 31 1 0 15 Nov 2021
Dealing with the Unknown: Pessimistic Offline Reinforcement Learning Jinning Li Chen Tang Masayoshi Tomizuka Wei Zhan OffRL 19 21 0 09 Nov 2021
Curriculum Offline Imitation Learning Minghuan Liu Hanye Zhao Zhengyu Yang Jian Shen Weinan Zhang Li Zhao Tie-Yan Liu OffRL 29 1 0 03 Nov 2021
Efficient Robotic Manipulation Through Offline-to-Online Reinforcement Learning and Goal-Aware State Information Jin Li Xianyuan Zhan Zixu Xiao Guyue Zhou OffRL OnRL 27 2 0 21 Oct 2021
Representation Learning for Online and Offline RL in Low-rank MDPs Masatoshi Uehara Xuezhou Zhang Wen Sun OffRL 62 127 0 09 Oct 2021
Evaluating model-based planning and planner amortization for continuous control Arunkumar Byravan Leonard Hasenclever Piotr Trochim M. Berk Mirza Alessandro Davide Ialongo ... Jost Tobias Springenberg A. Abdolmaleki N. Heess J. Merel Martin Riedmiller 55 17 0 07 Oct 2021
NeurWIN: Neural Whittle Index Network For Restless Bandits Via Deep RL Khaled Nakhleh Santosh Ganji Ping-Chun Hsieh I.-Hong Hou S. Shakkottai 61 38 0 05 Oct 2021
Uncertainty-Based Offline Reinforcement Learning with Diversified Q-Ensemble Gaon An Seungyong Moon Jang-Hyun Kim Hyun Oh Song OffRL 105 262 0 04 Oct 2021
Learning Dynamics Models for Model Predictive Agents M. Lutter Leonard Hasenclever Arunkumar Byravan Gabriel Dulac-Arnold Piotr Trochim N. Heess J. Merel Yuval Tassa AI4CE 57 26 0 29 Sep 2021
A Workflow for Offline Model-Free Robotic Reinforcement Learning Aviral Kumar Anika Singh Stephen Tian Chelsea Finn Sergey Levine OffRL 143 85 0 22 Sep 2021
Conservative Data Sharing for Multi-Task Offline Reinforcement Learning Tianhe Yu Aviral Kumar Yevgen Chebotar Karol Hausman Sergey Levine Chelsea Finn OffRL 35 77 0 16 Sep 2021
Video2Skill: Adapting Events in Demonstration Videos to Skills in an Environment using Cyclic MDP Homomorphisms Sumedh Anand Sontakke Sumegh Roychowdhury Mausoom Sarkar Nikaash Puri Balaji Krishnamurthy Laurent Itti 34 1 0 08 Sep 2021
Provable Benefits of Actor-Critic Methods for Offline Reinforcement Learning Andrea Zanette Martin J. Wainwright Emma Brunskill OffRL 29 113 0 19 Aug 2021
Model Selection for Offline Reinforcement Learning: Practical Considerations for Healthcare Settings Shengpu Tang Jenna Wiens OffRL 26 78 0 23 Jul 2021
Constraints Penalized Q-learning for Safe Offline Reinforcement Learning Haoran Xu Xianyuan Zhan Xiangyu Zhu OffRL 16 85 0 19 Jul 2021
Visual Adversarial Imitation Learning using Variational Models Rafael Rafailov Tianhe Yu Aravind Rajeswaran Chelsea Finn SSL 28 49 0 16 Jul 2021
Conservative Offline Distributional Reinforcement Learning Yecheng Jason Ma Dinesh Jayaraman Osbert Bastani OffRL 70 78 0 12 Jul 2021
Evaluating the progress of Deep Reinforcement Learning in the real world: aligning domain-agnostic and domain-specific research J. Luis E. Crawley B. Cameron OffRL 25 6 0 07 Jul 2021
Variance-Aware Off-Policy Evaluation with Linear Function Approximation Yifei Min Tianhao Wang Dongruo Zhou Quanquan Gu OffRL 37 38 0 22 Jun 2021
OptiDICE: Offline Policy Optimization via Stationary Distribution Correction Estimation Jongmin Lee Wonseok Jeon Byung-Jun Lee J. Pineau Kee-Eung Kim OffRL 37 90 0 21 Jun 2021
Behavioral Priors and Dynamics Models: Improving Performance and Domain Transfer in Offline RL Catherine Cang Aravind Rajeswaran Pieter Abbeel Michael Laskin OffRL 27 29 0 16 Jun 2021
Bellman-consistent Pessimism for Offline Reinforcement Learning Tengyang Xie Ching-An Cheng Nan Jiang Paul Mineiro Alekh Agarwal OffRL LRM 27 269 0 13 Jun 2021