Title
Continuous Control for High-Dimensional State Spaces: An Interactive Learning Approach Rodrigo Pérez-Dattari C. Celemin Javier Ruiz-del-Solar Jens Kober OffRL 31 14 0 14 Aug 2019
Behaviour Suite for Reinforcement Learning Ian Osband Yotam Doron Matteo Hessel John Aslanides Eren Sezener ... Satinder Singh Benjamin Van Roy R. Sutton David Silver H. V. Hasselt OffRL 124 183 0 09 Aug 2019
DoorGym: A Scalable Door Opening Environment And Baseline Agent Y. Urakami Alec Hodgkinson Casey Carlin Randall Leu Luca Rigazio Pieter Abbeel OffRL 109 57 0 05 Aug 2019
Google Research Football: A Novel Reinforcement Learning Environment Karol Kurach Anton Raichuk Piotr Stańczyk Michal Zajac Olivier Bachem ... C. Riquelme Damien Vincent Marcin Michalski Olivier Bousquet Sylvain Gelly 228 410 0 25 Jul 2019
Arena: a toolkit for Multi-Agent Reinforcement Learning Qing Wang Jiechao Xiong Lei Han Meng Fang Xinghai Sun Zhuobin Zheng Peng Sun Zhengyou Zhang 59 4 0 20 Jul 2019
An Actor-Critic-Attention Mechanism for Deep Reinforcement Learning in Multi-view Environments Elaheh Barati Xuewen Chen 69 13 0 19 Jul 2019
Accelerating Reinforcement Learning through GPU Atari Emulation Steven Dalton I. Frosio M. Garland ELM 58 9 0 19 Jul 2019
Latent ODEs for Irregularly-Sampled Time Series Yulia Rubanova Ricky T. Q. Chen David Duvenaud BDL AI4TS 102 260 0 08 Jul 2019
Benchmarking Model-Based Reinforcement Learning Tingwu Wang Xuchan Bao I. Clavera Jerrick Hoang Yeming Wen Eric D. Langlois Matthew Shunshi Zhang Guodong Zhang Pieter Abbeel Jimmy Ba OffRL 122 365 0 03 Jul 2019
Stochastic Latent Actor-Critic: Deep Reinforcement Learning with a Latent Variable Model Alex X. Lee Anusha Nagabandi Pieter Abbeel Sergey Levine OffRL BDL 113 383 0 01 Jul 2019
Compositional Transfer in Hierarchical Reinforcement Learning Markus Wulfmeier A. Abdolmaleki Roland Hafner Jost Tobias Springenberg Michael Neunert Tim Hertweck Thomas Lampe Noah Y. Siegel N. Heess Martin Riedmiller 119 27 0 26 Jun 2019
Continual Reinforcement Learning with Diversity Exploration and Adversarial Self-Correction Fengda Zhu Xiaojun Chang Runhao Zeng Mingkui Tan CLL 52 3 0 21 Jun 2019
Unsupervised Learning of Object Keypoints for Perception and Control Tejas D. Kulkarni Ankush Gupta Catalin Ionescu Sebastian Borgeaud Malcolm Reynolds Andrew Zisserman Volodymyr Mnih SSL OCL 85 197 0 19 Jun 2019
Unsupervised Learning of Object Structure and Dynamics from Videos Matthias Minderer Chen Sun Ruben Villegas Forrester Cole Kevin Patrick Murphy Honglak Lee 120 150 0 19 Jun 2019
Robust Reinforcement Learning for Continuous Control with Model Misspecification D. Mankowitz Nir Levine Rae Jeong Yuanyuan Shi Jackie Kay A. Abdolmaleki Jost Tobias Springenberg Timothy A. Mann Todd Hester Martin Riedmiller OOD 135 123 0 18 Jun 2019
Neural Graph Evolution: Towards Efficient Automatic Robot Design Tingwu Wang Yuhao Zhou Sanja Fidler Jimmy Ba 65 63 0 12 Jun 2019
Learning to Score Behaviors for Guided Policy Optimization Aldo Pacchiano Jack Parker-Holder Yunhao Tang A. Choromańska K. Choromanski Michael I. Jordan 96 39 0 11 Jun 2019
Interactive Differentiable Simulation Eric Heiden David Millard Hejia Zhang Gaurav Sukhatme OOD AI4CE PINN 94 50 0 26 May 2019
Arena: A General Evaluation Platform and Building Toolkit for Multi-Agent Intelligence Yuhang Song Andrzej Wojcicki Thomas Lukasiewicz Jianyi Wang Abi Aryan Zhenghua Xu Mai Xu Zihan Ding Lianlong Wu AI4CE ELM 126 34 0 17 May 2019
Meta reinforcement learning as task inference Jan Humplik Alexandre Galashov Leonard Hasenclever Pedro A. Ortega Yee Whye Teh N. Heess OffRL 129 128 0 15 May 2019
Attention-based Deep Reinforcement Learning for Multi-view Environments Elaheh Barati Xuewen Chen Z. Zhong 86 6 0 10 May 2019
Accelerated Target Updates for Q-learning Bowen Weng Huaqing Xiong Wei Zhang 23 0 0 07 May 2019
Deep Residual Reinforcement Learning Shangtong Zhang Wendelin Bohmer Shimon Whiteson 91 32 0 03 May 2019
Challenges of Real-World Reinforcement Learning Gabriel Dulac-Arnold D. Mankowitz Todd Hester OffRL 131 553 0 29 Apr 2019
DAC: The Double Actor-Critic Architecture for Learning Options Shangtong Zhang Shimon Whiteson 149 73 0 29 Apr 2019
Baconian: A Unified Open-source Framework for Model-Based Reinforcement Learning Linsen Dong Guanyu Gao Xinyi Zhang Liangyu Chen Yonggang Wen 45 3 0 23 Apr 2019
Decoupled Data Based Approach for Learning to Control Nonlinear Dynamical Systems Ran A. Wang Karthikeya S. Parunandi Dan Yu D. Kalathil S. Chakravorty 43 12 0 17 Apr 2019
Learning a Multi-Modal Policy via Imitating Demonstrations with Mixed Behaviors Fang-I Hsiao Jui-Hsuan Kuo Min Sun OffRL 49 14 0 25 Mar 2019
Scheduled Intrinsic Drive: A Hierarchical Take on Intrinsically Motivated Exploration Jingwei Zhang Niklas Wetzel Nicolai Dorka Joschka Boedecker Wolfram Burgard 67 26 0 18 Mar 2019
MinAtar: An Atari-Inspired Testbed for Thorough and Reproducible Reinforcement Learning Experiments K. Young Tian Tian 61 25 0 07 Mar 2019
Model Primitive Hierarchical Lifelong Reinforcement Learning Bohan Wu Jayesh K. Gupta Mykel J. Kochenderfer OffRL 45 10 0 04 Mar 2019
Verification of Non-Linear Specifications for Neural Networks Chongli Qin Krishnamurthy Dvijotham Dvijotham Brendan O'Donoghue Rudy Bunel Robert Stanforth Sven Gowal J. Uesato G. Swirszcz Pushmeet Kohli AAML 75 44 0 25 Feb 2019
Emergent Coordination Through Competition Siqi Liu Guy Lever J. Merel S. Tunyasuvunakool N. Heess T. Graepel 134 151 0 19 Feb 2019
Investigating Generalisation in Continuous Deep Reinforcement Learning Chenyang Zhao Olivier Sigaud F. Stulp Timothy M. Hospedales OffRL 94 48 0 19 Feb 2019
Sufficiently Accurate Model Learning Clark Zhang Arbaaz Khan Santiago Paternain Alejandro Ribeiro 40 3 0 19 Feb 2019
CrossQ: Batch Normalization in Deep Reinforcement Learning for Greater Sample Efficiency and Simplicity Aditya Bhatt Daniel Palenicek Boris Belousov Max Argus Artemij Amiranashvili Thomas Brox Jan Peters 134 57 0 14 Feb 2019
Value constrained model-free continuous control Steven Bohez A. Abdolmaleki Michael Neunert J. Buchli N. Heess R. Hadsell 68 63 0 12 Feb 2019
TF-Replicator: Distributed Machine Learning for Researchers P. Buchlovsky David Budden Dominik Grewe Chris Jones John Aslanides ... Aidan Clark Sergio Gomez Colmenarejo Aedan Pope Fabio Viola Dan Belov GNN OffRL AI4CE 81 20 0 01 Feb 2019
Motion Perception in Reinforcement Learning with Dynamic Objects Artemij Amiranashvili Alexey Dosovitskiy V. Koltun Thomas Brox 74 35 0 10 Jan 2019
Dopamine: A Research Framework for Deep Reinforcement Learning Pablo Samuel Castro Subhodeep Moitra Carles Gelada Saurabh Kumar Marc G. Bellemare OffRL 91 279 0 14 Dec 2018
Relative Entropy Regularized Policy Iteration A. Abdolmaleki Jost Tobias Springenberg Jonas Degrave Steven Bohez Yuval Tassa Dan Belov N. Heess Martin Riedmiller 78 72 0 05 Dec 2018
Composing Entropic Policies using Divergence Correction Jonathan J. Hunt André Barreto Timothy Lillicrap N. Heess 52 2 0 05 Dec 2018
Rigorous Agent Evaluation: An Adversarial Approach to Uncover Catastrophic Failures Junhui Yin Jiayan Qiu Csaba Szepesvári Siqing Zhang Avraham Ruderman Jiyang Xie Krishnamurthy Dvijotham Zhanyu Ma N. Heess Pushmeet Kohli AAML 107 82 0 04 Dec 2018
CompILE: Compositional Imitation Learning and Execution Thomas Kipf Yujia Li H. Dai V. Zambaldi Alvaro Sanchez-Gonzalez Edward Grefenstette Pushmeet Kohli Peter W. Battaglia VLM 93 14 0 04 Dec 2018
Adversarial Domain Randomization Rawal Khirodkar Kris Kitani 42 5 0 03 Dec 2018
Unsupervised Control Through Non-Parametric Discriminative Rewards David Warde-Farley T. Wiele Tejas D. Kulkarni Catalin Ionescu Steven Hansen Volodymyr Mnih DRL OffRL SSL 101 178 0 28 Nov 2018
Hierarchical visuomotor control of humanoids J. Merel Arun Ahuja Vu Pham S. Tunyasuvunakool Siqi Liu Dhruva Tirumala N. Heess Greg Wayne 128 97 0 23 Nov 2018
Learning Latent Dynamics for Planning from Pixels Danijar Hafner Timothy Lillicrap Ian S. Fischer Ruben Villegas David R Ha Honglak Lee James Davidson BDL 200 1,452 0 12 Nov 2018
ACE: An Actor Ensemble Algorithm for Continuous Control with Tree Search Gary Cheng Kannan Ramchandran L. Ghaoui 58 24 0 06 Nov 2018
Deep Reinforcement Learning Yuxi Li VLM OffRL 194 144 0 15 Oct 2018