Title
Meta-Sim2: Unsupervised Learning of Scene Structure for Synthetic Data Generation Jeevan Devaranjan Amlan Kar Sanja Fidler 81 89 0 20 Aug 2020
Deep Model-Based Reinforcement Learning for High-Dimensional Problems, a Survey Aske Plaat W. Kosters Mike Preuss BDL OffRL 127 17 0 11 Aug 2020
TriFinger: An Open-Source Robot for Learning Dexterity Manuel Wüthrich Felix Widmaier F. Grimminger J. Akpo S. Joshi ... Julian Viereck M. Naveau Ludovic Righetti Bernhard Schölkopf Stefan Bauer 82 72 0 08 Aug 2020
Deep Reinforcement Learning for Tactile Robotics: Learning to Type on a Braille Keyboard Alex Church John Lloyd R. Hadsell Nathan Lepora 80 31 0 06 Aug 2020
Contrastive Variational Reinforcement Learning for Complex Observations Xiao Ma Siwei Chen David Hsu W. Lee OffRL 81 23 0 06 Aug 2020
Learning to Drive (L2D) as a Low-Cost Benchmark for Real-World Reinforcement Learning A. Viitala Rinu Boney Yi Zhao Alexander Ilin Arno Solin OffRL 57 7 0 03 Aug 2020
Dreaming: Model-based Reinforcement Learning by Latent Imagination without Reconstruction Masashi Okada T. Taniguchi OffRL 116 84 0 29 Jul 2020
Weak Human Preference Supervision For Deep Reinforcement Learning Zehong Cao Kaichiu Wong Chin-Teng Lin 60 5 0 25 Jul 2020
Maximum Mutation Reinforcement Learning for Scalable Control Karush Suri Xiaolong Shi Konstantinos N. Plataniotis Y. Lawryshyn 92 4 0 24 Jul 2020
Monte-Carlo Tree Search as Regularized Policy Optimization Jean-Bastien Grill Florent Altché Yunhao Tang Thomas Hubert Michal Valko Ioannis Antonoglou Rémi Munos 124 75 0 24 Jul 2020
Predictive Information Accelerates Learning in RL Kuang-Huei Lee Ian S. Fischer Anthony Z. Liu Yijie Guo Honglak Lee John F. Canny S. Guadarrama 127 73 0 24 Jul 2020
Probabilistic Active Meta-Learning Jean Kaddour Steindór Sæmundsson M. Deisenroth 98 35 0 17 Jul 2020
Learning Robust State Abstractions for Hidden-Parameter Block MDPs Amy Zhang Shagun Sodhani Khimya Khetarpal Joelle Pineau 93 5 0 14 Jul 2020
Data-Efficient Reinforcement Learning with Self-Predictive Representations Max Schwarzer Ankesh Anand Rishab Goel R. Devon Hjelm Aaron Courville Philip Bachman 126 321 0 12 Jul 2020
SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep Reinforcement Learning Kimin Lee Michael Laskin A. Srinivas Pieter Abbeel OffRL 119 205 0 09 Jul 2020
Self-Supervised Policy Adaptation during Deployment Nicklas Hansen Rishabh Jangir Yu Sun Guillem Alenyà Pieter Abbeel Alexei A. Efros Lerrel Pinto Xiaolong Wang 110 163 0 08 Jul 2020
robo-gym -- An Open Source Toolkit for Distributed Deep Reinforcement Learning on Real and Simulated Robots M. Lucchi Friedemann Zindler Stephan Mühlbacher-Karrer Horst Pichler OffRL 86 30 0 06 Jul 2020
Debiased Contrastive Learning Ching-Yao Chuang Joshua Robinson Yen-Chen Lin Antonio Torralba Stefanie Jegelka SSL 174 569 0 01 Jul 2020
Distributed Uplink Beamforming in Cell-Free Networks Using Deep Reinforcement Learning Firas Fredj Yasser F. Al-Eryani S. Maghsudi Mohamed Akrout Ekram Hossain OffRL 77 29 0 26 Jun 2020
Critic Regularized Regression Ziyun Wang Alexander Novikov Konrad Zolna Jost Tobias Springenberg Scott E. Reed ... Noah Y. Siegel J. Merel Çağlar Gülçehre N. Heess Nando de Freitas OffRL 224 333 0 26 Jun 2020
RL Unplugged: A Suite of Benchmarks for Offline Reinforcement Learning Çağlar Gülçehre Ziyun Wang Alexander Novikov T. Paine Sergio Gomez Colmenarejo ... Matthew W. Hoffman Ofir Nachum George Tucker N. Heess Nando de Freitas OffRL 134 72 0 24 Jun 2020
dm_control: Software and Tasks for Continuous Control Yuval Tassa S. Tunyasuvunakool Alistair Muldal Yotam Doron Piotr Trochim ... Steven Bohez J. Merel Tom Erez Timothy Lillicrap N. Heess LM&Ro 174 419 0 22 Jun 2020
Learning Invariant Representations for Reinforcement Learning without Reconstruction Amy Zhang R. McAllister Roberto Calandra Y. Gal Sergey Levine OOD SSL 200 481 0 18 Jun 2020
Analytic Manifold Learning: Unifying and Evaluating Representations for Continuous Control Rika Antonova Maksim Maydanskiy Danica Kragic Sam Devlin Katja Hofmann 84 9 0 15 Jun 2020
Efficient Model-Based Reinforcement Learning through Optimistic Policy Search and Planning Sebastian Curi Felix Berkenkamp Andreas Krause 132 85 0 15 Jun 2020
Online Hyper-parameter Tuning in Off-policy Learning via Evolutionary Strategies Yunhao Tang K. Choromanski OffRL 41 14 0 13 Jun 2020
Self-Imitation Learning via Generalized Lower Bound Q-learning Yunhao Tang SSL 121 24 0 12 Jun 2020
Adaptive Checkpoint Adjoint Method for Gradient Estimation in Neural ODE Juntang Zhuang Nicha Dvornek Xiaoxiao Li S. Tatikonda X. Papademetris James Duncan BDL 138 112 0 03 Jun 2020
Temporally-Extended ε-Greedy Exploration Will Dabney Georg Ostrovski André Barreto 84 34 0 02 Jun 2020
Acme: A Research Framework for Distributed Reinforcement Learning Matthew W. Hoffman Bobak Shahriari John Aslanides Gabriel Barth-Maron Nikola Momchev ... Srivatsan Srinivasan A. Cowie Ziyun Wang Bilal Piot Nando de Freitas 143 226 0 01 Jun 2020
Mutual Information Maximization for Robust Plannable Representations Yiming Ding I. Clavera Pieter Abbeel 62 15 0 16 May 2020
A Distributional View on Multi-Objective Policy Optimization A. Abdolmaleki Sandy H. Huang Leonard Hasenclever Michael Neunert H. F. Song Martina Zambelli M. Martins N. Heess R. Hadsell Martin Riedmiller 78 76 0 15 May 2020
Planning to Explore via Self-Supervised World Models Ramanan Sekar Oleh Rybkin Kostas Daniilidis Pieter Abbeel Danijar Hafner Deepak Pathak SSL 132 413 0 12 May 2020
Improving Robustness via Risk Averse Distributional Reinforcement Learning Rahul Singh Qinsheng Zhang Yongxin Chen OOD 69 44 0 01 May 2020
Reinforcement Learning with Augmented Data Michael Laskin Kimin Lee Adam Stooke Lerrel Pinto Pieter Abbeel A. Srinivas OffRL 168 661 0 30 Apr 2020
Bootstrap Latent-Predictive Representations for Multitask Reinforcement Learning Z. Guo Bernardo Avila-Pires Bilal Piot Jean-Bastien Grill Florent Altché Rémi Munos M. G. Azar BDL DRL SSL 192 143 0 30 Apr 2020
Actor-Critic Reinforcement Learning for Control with Stability Guarantee Minghao Han Lixian Zhang Jun Wang Wei Pan 95 113 0 29 Apr 2020
Image Augmentation Is All You Need: Regularizing Deep Reinforcement Learning from Pixels Ilya Kostrikov Denis Yarats Rob Fergus OffRL 206 794 0 28 Apr 2020
PBCS : Efficient Exploration and Exploitation Using a Synergy between Reinforcement Learning and Motion Planning Guillaume Matheron Nicolas Perrin Olivier Sigaud 58 19 0 24 Apr 2020
Model-Predictive Control via Cross-Entropy and Gradient-Based Optimization Homanga Bharadhwaj Kevin Xie Florian Shkurti 62 50 0 19 Apr 2020
Thinking While Moving: Deep Reinforcement Learning with Concurrent Control Ted Xiao Eric Jang Dmitry Kalashnikov Sergey Levine Julian Ibarz Karol Hausman Alexander Herzog 124 39 0 13 Apr 2020
Energy Shaping Control of a CyberOctopus Soft Arm Heng-Sheng Chang Udit Halder Chia-Hsien Shih Arman Tekinalp Tejaswin Parthasarathy Ekaterina D. Gribkova Girish Chowdhary R. Gillette M. Gazzola P. Mehta 43 29 0 13 Apr 2020
CURL: Contrastive Unsupervised Representations for Reinforcement Learning A. Srinivas Michael Laskin Pieter Abbeel SSL DRL OffRL 168 1,097 0 08 Apr 2020
Model-based actor-critic: GAN (model generator) + DRL (actor-critic) => AGI Aras R. Dargazany OffRL AI4CE 36 1 0 04 Apr 2020
An empirical investigation of the challenges of real-world reinforcement learning Gabriel Dulac-Arnold Nir Levine D. Mankowitz Jerry Li Cosmin Paduraru Sven Gowal Todd Hester OffRL 105 125 0 24 Mar 2020
SAPIEN: A SimulAted Part-based Interactive ENvironment Fanbo Xiang Yuzhe Qin Kaichun Mo Yikuan Xia Hao Zhu ... He Wang Li Yi Angel X. Chang Leonidas Guibas Hao Su 321 514 0 19 Mar 2020
Invariant Causal Prediction for Block MDPs Amy Zhang Clare Lyle Shagun Sodhani Angelos Filos Marta Z. Kwiatkowska Joelle Pineau Y. Gal Doina Precup OffRL AI4CE OOD 134 144 0 12 Mar 2020
Learning Predictive Representations for Deformable Objects Using Contrastive Estimation Wilson Yan Ashwin Vangipuram Pieter Abbeel Lerrel Pinto 108 191 0 11 Mar 2020
SQUIRL: Robust and Efficient Learning from Video Demonstration of Long-Horizon Robotic Manipulation Tasks Bohan Wu Feng Xu Zhanpeng He Abhi Gupta Peter K. Allen OffRL 173 13 0 10 Mar 2020
Hierarchically Decoupled Imitation for Morphological Transfer D. Hejna Pieter Abbeel Lerrel Pinto LM&Ro 77 43 0 03 Mar 2020