Conservative Q-Learning for Offline Reinforcement Learning

8 June 2020

Papers citing "Conservative Q-Learning for Offline Reinforcement Learning"

50 / 431 papers shown

Title
DR3: Value-Based Deep Reinforcement Learning Requires Explicit Regularization Aviral Kumar Rishabh Agarwal Tengyu Ma Aaron Courville George Tucker Sergey Levine OffRL 31 65 0 09 Dec 2021
Godot Reinforcement Learning Agents E. Beeching Jilles Debangoye Olivier Simonin Christian Wolf GP OnRL 24 5 0 07 Dec 2021
Offline Pre-trained Multi-Agent Decision Transformer: One Big Sequence Model Tackles All SMAC Tasks Linghui Meng Muning Wen Yaodong Yang Chenyang Le Xiyun Li Weinan Zhang Ying Wen Haifeng Zhang Jun Wang Bo Xu OffRL 28 38 0 06 Dec 2021
Quantile Filtered Imitation Learning David Brandfonbrener William F. Whitney Rajesh Ranganath Joan Bruna 33 6 0 02 Dec 2021
Pessimistic Model Selection for Offline Deep Reinforcement Learning Chao-Han Huck Yang Zhengling Qi Yifan Cui Pin-Yu Chen OffRL 39 4 0 29 Nov 2021
Measuring Data Quality for Dataset Selection in Offline Reinforcement Learning Phillip Swazinna Steffen Udluft Thomas Runkler OffRL 27 6 0 26 Nov 2021
The Impact of Data Distribution on Q-learning with Function Approximation Pedro P. Santos Diogo S. Carvalho Alberto Sardinha Francisco S. Melo OffRL 19 2 0 23 Nov 2021
UMBRELLA: Uncertainty-Aware Model-Based Offline Reinforcement Learning Leveraging Planning Christopher P. Diehl Timo Sievernich Martin Krüger F. Hoffmann Torsten Bertram OffRL 31 26 0 22 Nov 2021
Compressive Features in Offline Reinforcement Learning for Recommender Systems Hung Nguyen Minh Nguyen Long Pham Jennifer Adorno Nieves OffRL 18 2 0 16 Nov 2021
Exploiting Action Impact Regularity and Exogenous State Variables for Offline Reinforcement Learning Vincent Liu James Wright Martha White OffRL 31 1 0 15 Nov 2021
Dealing with the Unknown: Pessimistic Offline Reinforcement Learning Jinning Li Chen Tang Masayoshi Tomizuka Wei Zhan OffRL 19 21 0 09 Nov 2021
AW-Opt: Learning Robotic Skills with Imitation and Reinforcement at Scale Yao Lu Karol Hausman Yevgen Chebotar Mengyuan Yan Eric Jang ... Ted Xiao A. Irpan Mohi Khansari Dmitry Kalashnikov Sergey Levine OffRL 95 59 0 09 Nov 2021
d3rlpy: An Offline Deep Reinforcement Learning Library Takuma Seno M. Imai OffRL GP 65 100 0 06 Nov 2021
Curriculum Offline Imitation Learning Minghuan Liu Hanye Zhao Zhengyu Yang Jian Shen Weinan Zhang Li Zhao Tie-Yan Liu OffRL 29 1 0 03 Nov 2021
The Difficulty of Passive Learning in Deep Reinforcement Learning Georg Ostrovski Pablo Samuel Castro Will Dabney OffRL 19 57 0 26 Oct 2021
Efficient Robotic Manipulation Through Offline-to-Online Reinforcement Learning and Goal-Aware State Information Jin Li Xianyuan Zhan Zixu Xiao Guyue Zhou OffRL OnRL 29 2 0 21 Oct 2021
Data-Driven Offline Optimization For Architecting Hardware Accelerators Aviral Kumar Amir Yazdanbakhsh Milad Hashemi Kevin Swersky Sergey Levine 29 36 0 20 Oct 2021
Continuous Control with Action Quantization from Demonstrations Robert Dadashi Léonard Hussenot Damien Vincent Sertan Girgin Anton Raichuk M. Geist Olivier Pietquin OffRL 33 23 0 19 Oct 2021
No RL, No Simulation: Learning to Navigate without Navigating Meera Hahn Devendra Singh Chaplot Shubham Tulsiani Mustafa Mukadam James M. Rehg Abhinav Gupta 75 71 0 18 Oct 2021
Value Penalized Q-Learning for Recommender Systems Chengqian Gao Ke Xu Kuangqi Zhou Lanqing Li Xueqian Wang Bo Yuan P. Zhao OffRL 54 20 0 15 Oct 2021
Safe Autonomous Racing via Approximate Reachability on Ego-vision Bingqing Chen Jonathan M Francis Jean Oh Eric Nyberg Sylvia Herbert 59 14 0 14 Oct 2021
Offline Reinforcement Learning with Soft Behavior Regularization Haoran Xu Xianyuan Zhan Jianxiong Li Honglei Yin OffRL 28 31 0 14 Oct 2021
On Covariate Shift of Latent Confounders in Imitation and Reinforcement Learning Guy Tennenholtz Assaf Hallak Gal Dalal Shie Mannor Gal Chechik Uri Shalit OOD OffRL 55 15 0 13 Oct 2021
Offline Reinforcement Learning with Implicit Q-Learning Ilya Kostrikov Ashvin Nair Sergey Levine OffRL 214 852 0 12 Oct 2021
Fast Block Linear System Solver Using Q-Learning Schduling for Unified Dynamic Power System Simulations Yingshi Chen Xinli Song Han-Sen Dai Tao Liu Wuzhi Zhong Guoyang Wu 22 0 0 12 Oct 2021
A Closer Look at Advantage-Filtered Behavioral Cloning in High-Noise Datasets J. E. Grigsby Yanjun Qi OffRL 29 5 0 10 Oct 2021
Representation Learning for Online and Offline RL in Low-rank MDPs Masatoshi Uehara Xuezhou Zhang Wen Sun OffRL 62 127 0 09 Oct 2021
Offline Meta-Reinforcement Learning for Industrial Insertion Tony Zhao Jianlan Luo Oleg O. Sushkov Rugile Pevceviciute N. Heess Jonathan Scholz S. Schaal Sergey Levine OffRL OnRL 27 80 0 08 Oct 2021
Offline RL With Resource Constrained Online Deployment Jayanth Reddy Regatti A. Deshmukh Frank Cheng Young Hun Jung Abhishek Gupta Ürün Dogan OffRL 13 2 0 07 Oct 2021
Uncertainty-Based Offline Reinforcement Learning with Diversified Q-Ensemble Gaon An Seungyong Moon Jang-Hyun Kim Hyun Oh Song OffRL 105 265 0 04 Oct 2021
MetaDrive: Composing Diverse Driving Scenarios for Generalizable Reinforcement Learning Quanyi Li Zhenghao Peng Lan Feng Qihang Zhang Zhenghai Xue Bolei Zhou 43 232 0 26 Sep 2021
A Workflow for Offline Model-Free Robotic Reinforcement Learning Aviral Kumar Anika Singh Stephen Tian Chelsea Finn Sergey Levine OffRL 143 85 0 22 Sep 2021
Greedy UnMixing for Q-Learning in Multi-Agent Reinforcement Learning Chapman Siu Jason M. Traish R. Xu 33 2 0 19 Sep 2021
Conservative Data Sharing for Multi-Task Offline Reinforcement Learning Tianhe Yu Aviral Kumar Yevgen Chebotar Karol Hausman Sergey Levine Chelsea Finn OffRL 35 77 0 16 Sep 2021
Implicit Behavioral Cloning Peter R. Florence Corey Lynch Andy Zeng Oscar Ramirez Ayzaan Wahid Laura Downs Adrian S. Wong Johnny Lee Igor Mordatch Jonathan Tompson OffRL 72 369 0 01 Sep 2021
Provable Benefits of Actor-Critic Methods for Offline Reinforcement Learning Andrea Zanette Martin J. Wainwright Emma Brunskill OffRL 29 115 0 19 Aug 2021
Offline Decentralized Multi-Agent Reinforcement Learning Jiechuan Jiang Zongqing Lu OffRL 30 37 0 04 Aug 2021
ManiSkill: Generalizable Manipulation Skill Benchmark with Large-Scale Demonstrations Tongzhou Mu Z. Ling Fanbo Xiang Derek Yang Xuanlin Li Stone Tao Zhiao Huang Zhiwei Jia Hao Su 39 130 0 30 Jul 2021
Model Selection for Offline Reinforcement Learning: Practical Considerations for Healthcare Settings Shengpu Tang Jenna Wiens OffRL 26 78 0 23 Jul 2021
Constraints Penalized Q-learning for Safe Offline Reinforcement Learning Haoran Xu Xianyuan Zhan Xiangyu Zhu OffRL 16 86 0 19 Jul 2021
Visual Adversarial Imitation Learning using Variational Models Rafael Rafailov Tianhe Yu Aravind Rajeswaran Chelsea Finn SSL 28 49 0 16 Jul 2021
Conservative Objective Models for Effective Offline Model-Based Optimization Brandon Trabucco Aviral Kumar Xinyang Geng Sergey Levine OffRL 44 86 0 14 Jul 2021
Conservative Offline Distributional Reinforcement Learning Yecheng Jason Ma Dinesh Jayaraman Osbert Bastani OffRL 73 79 0 12 Jul 2021
Offline reinforcement learning with uncertainty for treatment strategies in sepsis Ran Liu J. Greenstein J. Fackler Jules Bergmann M. Bembea R. Winslow OffRL 14 7 0 09 Jul 2021
Supervised Off-Policy Ranking Yue Jin Yue Zhang Tao Qin Xudong Zhang Jian Yuan Houqiang Li Tie-Yan Liu OffRL 32 5 0 03 Jul 2021
IQ-Learn: Inverse soft-Q Learning for Imitation Divyansh Garg Shuvam Chakraborty Chris Cundy Jiaming Song Matthieu Geist Stefano Ermon 51 178 0 23 Jun 2021
OptiDICE: Offline Policy Optimization via Stationary Distribution Correction Estimation Jongmin Lee Wonseok Jeon Byung-Jun Lee J. Pineau Kee-Eung Kim OffRL 37 91 0 21 Jun 2021
Behavioral Priors and Dynamics Models: Improving Performance and Domain Transfer in Offline RL Catherine Cang Aravind Rajeswaran Pieter Abbeel Michael Laskin OffRL 32 29 0 16 Jun 2021
Offline RL Without Off-Policy Evaluation David Brandfonbrener William F. Whitney Rajesh Ranganath Joan Bruna OffRL 42 162 0 16 Jun 2021
Bellman-consistent Pessimism for Offline Reinforcement Learning Tengyang Xie Ching-An Cheng Nan Jiang Paul Mineiro Alekh Agarwal OffRL LRM 27 271 0 13 Jun 2021