Deep Reinforcement Learning at the Edge of the Statistical Precipice

30 August 2021

Aaron Courville

Papers citing "Deep Reinforcement Learning at the Edge of the Statistical Precipice"

50 / 453 papers shown

Title
Model-based Offline Reinforcement Learning with Local Misspecification Kefan Dong Yannis Flet-Berliac Allen Nie Emma Brunskill OffRL 18 4 0 26 Jan 2023
Automatic Intrinsic Reward Shaping for Exploration in Deep Reinforcement Learning Mingqi Yuan Bo Li Xin Jin Wenjun Zeng OffRL 24 8 0 26 Jan 2023
Generalization through Diversity: Improving Unsupervised Environment Design Wenjun Li Pradeep Varakantham Dexun Li 27 7 0 19 Jan 2023
Human-Timescale Adaptation in an Open-Ended Task Space Adaptive Agent Team Jakob Bauer Kate Baumli Satinder Baveja Feryal M. P. Behbahani ... Jakub Sygnowski K. Tuyls Sarah York Alexander Zacherl Lei Zhang LM&Ro OffRL AI4CE LRM 38 108 0 18 Jan 2023
A reinforcement learning path planning approach for range-only underwater target localization with autonomous vehicles Ivan Masmitja Mario Martin K. Katija S. Gomáriz J. Navarro 19 5 0 17 Jan 2023
PRUDEX-Compass: Towards Systematic Evaluation of Reinforcement Learning in Financial Markets Shuo Sun Molei Qin Xinrun Wang Bo An FaML OffRL AIFin 24 4 0 14 Jan 2023
Mutation Testing of Deep Reinforcement Learning Based on Real Faults Florian Tambon Vahid Majdinasab Amin Nikanjam Foutse Khomh G. Antoniol 28 7 0 13 Jan 2023
Benchmarks and Algorithms for Offline Preference-Based Reward Learning Daniel Shin Anca Dragan Daniel S. Brown OffRL 14 53 0 03 Jan 2023
Scalable Multi-Agent Reinforcement Learning for Warehouse Logistics with Robotic and Human Co-Workers Aleksandar Krnjaic Raul D. Steleac Jonathan D. Thomas Georgios Papoudakis Lukas Schafer ... Kuan-Ho Lao Murat Cubuktepe Matthew Haley Peter Borsting Stefano V. Albrecht OffRL 14 17 0 22 Dec 2022
Bridging the Gap Between Offline and Online Reinforcement Learning Evaluation Methodologies Shivakanth Sujit Pedro H. M. Braga J. Bornschein Samira Ebrahimi Kahou OffRL 17 1 0 15 Dec 2022
Measuring Data Margaret Mitchell A. Luccioni Nathan Lambert Marissa Gerchick Angelina McMillan-Major Ezinwanne Ozoani Nazneen Rajani Tristan Thrush Yacine Jernite Douwe Kiela 27 16 0 09 Dec 2022
Confidence-Conditioned Value Functions for Offline Reinforcement Learning Joey Hong Aviral Kumar Sergey Levine OffRL 36 20 0 08 Dec 2022
Offline Reinforcement Learning with Closed-Form Policy Improvement Operators Jiachen Li Edwin Zhang Ming Yin Qinxun Bai Yu-Xiang Wang William Yang Wang OffRL 31 15 0 29 Nov 2022
The Effectiveness of World Models for Continual Reinforcement Learning Samuel Kessler M. Ostaszewski Michal Bortkiewicz M. Żarski Maciej Wołczyk Jack Parker-Holder Stephen J. Roberts Piotr Milo's KELM OffRL CLL 27 7 0 29 Nov 2022
Offline Q-Learning on Diverse Multi-Task Data Both Scales And Generalizes Aviral Kumar Rishabh Agarwal Xinyang Geng George Tucker Sergey Levine OffRL 44 48 0 28 Nov 2022
Learning to design without prior data: Discovering generalizable design strategies using deep learning and tree search Ayush Raina Jonathan Cagan Christopher McComb AI4CE 25 9 0 28 Nov 2022
Choreographer: Learning and Adapting Skills in Imagination Pietro Mazzaglia Tim Verbelen Bart Dhoedt Alexandre Lacoste Sai Rajeswar 29 21 0 23 Nov 2022
Data-Driven Offline Decision-Making via Invariant Representation Learning Qi Yi-Hsun Su Aviral Kumar Sergey Levine OffRL 32 19 0 21 Nov 2022
Redeeming Intrinsic Rewards via Constrained Optimization Eric Chen Zhang-Wei Hong Joni Pajarinen Pulkit Agrawal OnRL 36 24 0 14 Nov 2022
Pretraining in Deep Reinforcement Learning: A Survey Zhihui Xie Zichuan Lin Junyou Li Shuai Li Deheng Ye OffRL OnRL AI4CE 26 23 0 08 Nov 2022
Wall Street Tree Search: Risk-Aware Planning for Offline Reinforcement Learning D. Elbaz Gal Novik Oren Salzman OffRL 25 0 0 06 Nov 2022
Contrastive Value Learning: Implicit Models for Simple Offline RL Bogdan Mazoure Benjamin Eysenbach Ofir Nachum Jonathan Tompson SSL OffRL 38 7 0 03 Nov 2022
Large Language Models Are Human-Level Prompt Engineers Yongchao Zhou Andrei Ioan Muresanu Ziwen Han Keiran Paster Silviu Pitis Harris Chan Jimmy Ba ALM LLMAG 21 829 0 03 Nov 2022
Behavior Prior Representation learning for Offline Reinforcement Learning Hongyu Zang Xin Li Jie Yu Chen Liu Riashat Islam Rémi Tachet des Combes Romain Laroche OffRL OnRL 35 10 0 02 Nov 2022
Reachability Verification Based Reliability Assessment for Deep Reinforcement Learning Controlled Robotics and Autonomous Systems Yizhen Dong Xingyu Zhao Sen Wang Xiaowei Huang 24 7 0 26 Oct 2022
Avalon: A Benchmark for RL Generalization Using Procedurally Generated Worlds Joshua Albrecht Abraham J. Fetterman Bryden Fogelman Ellie Kitanidis Bartosz Wróblewski ... Michael Rosenthal Maksis Knutins Zachary Polizzi James B. Simon Kanjun Qiu OffRL 21 23 0 24 Oct 2022
On Many-Actions Policy Gradient Michal Nauman Marek Cygan 17 0 0 24 Oct 2022
TAPE: Assessing Few-shot Russian Language Understanding Ekaterina Taktasheva Tatiana Shavrina Alena Fenogenova Denis Shevelev Nadezhda Katricheva ... Svetlana Iordanskaia Alena Spiridonova Valentina Kurenshchikova Ekaterina Artemova Vladislav Mikhailov AAML 45 10 0 23 Oct 2022
Learning General World Models in a Handful of Reward-Free Deployments Yingchen Xu Jack Parker-Holder Aldo Pacchiano Philip J. Ball Oleh Rybkin Stephen J. Roberts Tim Rocktaschel Edward Grefenstette OffRL 55 8 0 23 Oct 2022
Bridging the Gap Between Target Networks and Functional Regularization Alexandre Piché Valentin Thomas Joseph Marino Rafael Pardiñas Gian Maria Marconi C. Pal Mohammad Emtiyaz Khan 14 1 0 21 Oct 2022
Rethinking Value Function Learning for Generalization in Reinforcement Learning Seungyong Moon JunYeong Lee Hyun Oh Song OOD OffRL 16 16 0 18 Oct 2022
Deep Black-Box Reinforcement Learning with Movement Primitives Fabian Otto Onur Celik Hongyi Zhou Hanna Ziesche Ngo Anh Vien Gerhard Neumann OffRL 24 19 0 18 Oct 2022
On Uncertainty in Deep State Space Models for Model-Based Reinforcement Learning P. Becker Gerhard Neumann 27 9 0 17 Oct 2022
The Impact of Task Underspecification in Evaluating Deep Reinforcement Learning Vindula Jayawardana Catherine Tang Sirui Li Da Suo Cathy Wu OffRL 14 13 0 16 Oct 2022
Model-based Safe Deep Reinforcement Learning via a Constrained Proximal Policy Optimization Algorithm Ashish Kumar Jayant S. Bhatnagar OffRL 18 37 0 14 Oct 2022
A Scalable Finite Difference Method for Deep Reinforcement Learning Matthew Allen John C. Raisbeck Hakho Lee 11 0 0 14 Oct 2022
CORL: Research-oriented Deep Offline Reinforcement Learning Library Denis Tarasov Alexander Nikulin Dmitry Akimov Vladislav Kurenkov Sergey Kolesnikov OffRL 54 78 0 13 Oct 2022
Policy Gradient With Serial Markov Chain Reasoning Edoardo Cetin Oya Celiktutan BDL LRM 19 2 0 13 Oct 2022
A Mixture of Surprises for Unsupervised Reinforcement Learning Andrew Zhao Matthieu Lin Yangguang Li Yong-Jin Liu Gao Huang 28 13 0 13 Oct 2022
Semi-Supervised Offline Reinforcement Learning with Action-Free Trajectories Qinqing Zheng Mikael Henaff Brandon Amos Aditya Grover OffRL 23 20 0 12 Oct 2022
Exploration via Elliptical Episodic Bonuses Mikael Henaff Roberta Raileanu Minqi Jiang Tim Rocktaschel OffRL 29 39 0 11 Oct 2022
Voteñ'Rank: Revision of Benchmarking with Social Choice Theory Mark Rofin Vladislav Mikhailov Mikhail Florinskiy A. Kravchenko E. Tutubalina Tatiana Shavrina Daniel Karabekyan Ekaterina Artemova 24 8 0 11 Oct 2022
VER: Scaling On-Policy RL Leads to the Emergence of Navigation in Embodied Rearrangement Erik Wijmans Irfan Essa Dhruv Batra OffRL 40 13 0 11 Oct 2022
Conservative Bayesian Model-Based Value Expansion for Offline Policy Optimization Jihwan Jeong Xiaoyu Wang Michael Gimelfarb Hyunwoo J. Kim Baher Abdulhai Scott Sanner OffRL 79 10 0 07 Oct 2022
CW-ERM: Improving Autonomous Driving Planning with Closed-loop Weighted Empirical Risk Minimization Eesha Kumar Yiming Zhang S. Pini Simon Stent Ana Ferreira Sergey Zagoruyko C. Perone OffRL 20 1 0 05 Oct 2022
Pretraining the Vision Transformer using self-supervised methods for vision based Deep Reinforcement Learning Manuel Goulão Arlindo L. Oliveira ViT 38 6 0 22 Sep 2022
Towards a Standardised Performance Evaluation Protocol for Cooperative MARL R. Gorsane Omayma Mahjoub Ruan de Kock Roland Dubb Siddarth S. Singh Arnu Pretorius OffRL 39 49 0 21 Sep 2022
Soft Action Priors: Towards Robust Policy Transfer M. Centa Philippe Preux OffRL OnRL 13 1 0 20 Sep 2022
Human-level Atari 200x faster Steven Kapturowski Victor Campos Ray Jiang Nemanja Rakićević Hado van Hasselt Charles Blundell Adria Puigdomenech Badia OffRL 52 28 0 15 Sep 2022
Continuous MDP Homomorphisms and Homomorphic Policy Gradient S. Rezaei-Shoshtari Rosie Zhao Prakash Panangaden D. Meger Doina Precup 33 18 0 15 Sep 2022