Title
RB2: Robotic Manipulation Benchmarking with a Twist Sudeep Dasari Jianren Wang Joyce Hong Shikhar Bahl Yixin Lin ... David Held Lerrel Pinto Deepak Pathak Vikash Kumar Abhi Gupta 77 27 0 15 Mar 2022
PLATO: Predicting Latent Affordances Through Object-Centric Play Suneel Belkhale Dorsa Sadigh OffRL 68 13 0 10 Mar 2022
Policy Architectures for Compositional Generalization in Control Allan Zhou Vikash Kumar Chelsea Finn Aravind Rajeswaran 95 23 0 10 Mar 2022
Neuro-symbolic Natural Logic with Introspective Revision for Natural Language Inference Yufei Feng Xiaoyu Yang Xiao-Dan Zhu Michael A. Greenspan LRM NAI 124 11 0 09 Mar 2022
Multi-Objective reward generalization: Improving performance of Deep Reinforcement Learning for applications in single-asset trading F. Cornalba C. Disselkamp Davide Scassola Christopher Helf 60 6 0 09 Mar 2022
Policy-Based Bayesian Experimental Design for Non-Differentiable Implicit Models Vincent Lim Ellen R. Novoseller Jeffrey Ichnowski Huang Huang Ken Goldberg OffRL 71 11 0 08 Mar 2022
Learning Sensorimotor Primitives of Sequential Manipulation Tasks from Visual Demonstrations Junchi Liang Bowen Wen Kostas Bekris Abdeslam Boularias SSL 67 14 0 08 Mar 2022
AutoDIME: Automatic Design of Interesting Multi-Agent Environments I. Kanitscheider Harrison Edwards 49 0 0 04 Mar 2022
Self-Supervised Learning for Joint Pushing and Grasping Policies in Highly Cluttered Environments Yongliang Wang Kamal Mokhtar C. Heemskerk Hamidreza Kasaei SSL 88 11 0 04 Mar 2022
Evolving Curricula with Regret-Based Environment Design Jack Parker-Holder Minqi Jiang Michael Dennis Mikayel Samvelyan Jakob N. Foerster Edward Grefenstette Tim Rocktaschel 116 125 0 02 Mar 2022
Model-free Neural Lyapunov Control for Safe Robot Navigation Zikang Xiong Joe Eappen A. H. Qureshi Suresh Jagannathan 57 8 0 02 Mar 2022
GA+DDPG+HER: Genetic Algorithm-Based Function Optimizer in Deep Reinforcement Learning for Robotic Manipulation Tasks Adarsh Sehgal Nicholas Ward Hung M. La C. Papachristos S. Louis 24 4 0 28 Feb 2022
Weakly Supervised Disentangled Representation for Goal-conditioned Reinforcement Learning Zhifeng Qian Mingyu You Hongjun Zhou Bin He DRL OffRL 70 7 0 28 Feb 2022
Exploring with Sticky Mittens: Reinforcement Learning with Expert Interventions via Option Templates Souradeep Dutta Kaustubh Sridhar Osbert Bastani Yan Sun James Weimer Insup Lee J. Parish-Morris 99 2 0 25 Feb 2022
All You Need Is Supervised Learning: From Imitation Learning to Meta-RL With Upside Down RL Kai Arulkumaran Dylan R. Ashley Jürgen Schmidhuber R. Srivastava OffRL 100 7 0 24 Feb 2022
Learning Program Synthesis for Integer Sequences from Scratch Thibault Gauthier Josef Urban 119 9 0 24 Feb 2022
Using Deep Reinforcement Learning with Automatic Curriculum Learning for Mapless Navigation in Intralogistics Honghu Xue Benedikt Hein M. Bakr Georg Schildbach Bengt Abel Elmar Rueckert 125 18 0 23 Feb 2022
Reinforcement Learning in Practice: Opportunities and Challenges Yuxi Li OffRL 71 9 0 23 Feb 2022
Continual Auxiliary Task Learning Matt McLeod Chun-Ping Lo M. Schlegel Andrew Jacobsen Raksha Kumaraswamy Martha White Adam White CLL 60 9 0 22 Feb 2022
It Takes Four to Tango: Multiagent Selfplay for Automatic Curriculum Generation Yuqing Du Pieter Abbeel Aditya Grover 109 18 0 22 Feb 2022
CCPT: Automatic Gameplay Testing and Validation with Curiosity-Conditioned Proximal Trajectories Alessandro Sestini Linus Gisslén Joakim Bergdahl Konrad Tollmar Andrew D. Bagdanov 64 7 0 21 Feb 2022
Goal-directed Planning and Goal Understanding by Active Inference: Evaluation Through Simulated and Physical Robot Experiments Takazumi Matsumoto Wataru Ohata Fabien C. Y. Benureau Jun Tani 49 11 0 21 Feb 2022
AKB-48: A Real-World Articulated Object Knowledge Base Liu Liu Wenqiang Xu Haoyuan Fu Sucheng Qian Yong-Jin Han Cewu Lu 104 85 0 17 Feb 2022
Open-Ended Reinforcement Learning with Neural Reward Functions Robert Meier Asier Mujika 101 7 0 16 Feb 2022
End-to-end Reinforcement Learning of Robotic Manipulation with Robust Keypoints Representation Tianying Wang En Yen Puang Marcus Lee Yongpeng Wu Wei Jing SSL 67 5 0 12 Feb 2022
Online Decision Transformer Qinqing Zheng Amy Zhang Aditya Grover OffRL 91 209 0 11 Feb 2022
Help Me Explore: Minimal Social Interventions for Graph-Based Autotelic Agents Ahmed Akakzia Olivier Serris Olivier Sigaud Cédric Colas 52 6 0 10 Feb 2022
Rethinking Goal-conditioned Supervised Learning and Its Connection to Offline RL Rui Yang Yiming Lu Wenzhe Li Hao Sun Meng Fang Yali Du Xiu Li Lei Han Chongjie Zhang OffRL 107 72 0 09 Feb 2022
Approximating Gradients for Differentiable Quality Diversity in Reinforcement Learning Bryon Tjanaka Matthew C. Fontaine Julian Togelius Stefanos Nikolaidis 86 54 0 08 Feb 2022
Pre-Trained Language Models for Interactive Decision-Making Shuang Li Xavier Puig Chris Paxton Yilun Du Clinton Jia Wang ... Anima Anandkumar Jacob Andreas Igor Mordatch Antonio Torralba Yuke Zhu LM&Ro 133 264 0 03 Feb 2022
How to Leverage Unlabeled Data in Offline Reinforcement Learning Tianhe Yu Aviral Kumar Yevgen Chebotar Karol Hausman Chelsea Finn Sergey Levine OffRL 108 64 0 03 Feb 2022
Don't Change the Algorithm, Change the Data: Exploratory Data for Offline Reinforcement Learning Denis Yarats David Brandfonbrener Hao Liu Michael Laskin Pieter Abbeel A. Lazaric Lerrel Pinto OffRL OnRL 103 94 0 31 Jan 2022
Contrastive Learning from Demonstrations André Rosa de Sousa Porfírio Correia L. A. Alexandre SSL 70 2 0 30 Jan 2022
The Challenges of Exploration for Offline Reinforcement Learning Nathan Lambert Markus Wulfmeier William F. Whitney Arunkumar Byravan Michael Bloesch Vibhavari Dasagi Tim Hertweck Martin Riedmiller OffRL 91 29 0 27 Jan 2022
State-Conditioned Adversarial Subgoal Generation V. Wang Joni Pajarinen Tinghuai Wang Joni-Kristian Kämäräinen 94 12 0 24 Jan 2022
Pearl: Parallel Evolutionary and Reinforcement Learning Library Rohan Tangri Danilo P. Mandic A. Constantinides 53 2 0 24 Jan 2022
Goal-Conditioned Reinforcement Learning: Problems and Solutions Minghuan Liu Menghui Zhu Weinan Zhang 104 144 0 20 Jan 2022
Reinforcement Learning based Air Combat Maneuver Generation Muhammed Murat Özbek E. Koyuncu 29 4 0 14 Jan 2022
Automated Reinforcement Learning: An Overview Reza Refaei Afshar Yingqian Zhang Joaquin Vanschoren U. Kaymak OffRL 160 16 0 13 Jan 2022
Benchmarking Deep Reinforcement Learning Algorithms for Vision-based Robotics Swagat Kumar Hayden Sampson Ardhendu Behera 38 0 0 11 Jan 2022
Automated Reinforcement Learning (AutoRL): A Survey and Open Problems Jack Parker-Holder Raghunandan Rajan Xingyou Song André Biedenkapp Yingjie Miao ... Vu-Linh Nguyen Roberto Calandra Aleksandra Faust Frank Hutter Marius Lindauer AI4CE 112 107 0 11 Jan 2022
STIR $^2$ : Reward Relabelling for combined Reinforcement and Imitation Learning on sparse-reward tasks Jesús Bujalance Martín Fabien Moutarde OffRL 68 2 0 11 Jan 2022
Integrating Artificial Intelligence and Augmented Reality in Robotic Surgery: An Initial dVRK Study Using a Surgical Education Scenario Yonghao Long Jianfeng Cao Anton Deguet Russell H. Taylor Qi Dou 89 23 0 02 Jan 2022
Multiagent Model-based Credit Assignment for Continuous Control Dongge Han Chris Xiaoxuan Lu Tomasz P. Michalak Michael Wooldridge 61 6 0 27 Dec 2021
Off Environment Evaluation Using Convex Risk Minimization Pulkit Katdare Shuijing Liu Katherine Driggs-Campbell 53 2 0 21 Dec 2021
Proving Theorems using Incremental Learning and Hindsight Experience Replay Eser Aygun Laurent Orseau Ankit Anand Xavier Glorot Vlad Firoiu Lei M. Zhang Doina Precup Shibl Mourad CLL LRM 104 18 0 20 Dec 2021
Replay For Safety Liran Szlak Ohad Shamir OffRL 47 0 0 08 Dec 2021
CALVIN: A Benchmark for Language-Conditioned Policy Learning for Long-Horizon Robot Manipulation Tasks Oier Mees Lukás Hermann Erick Rosete-Beas Wolfram Burgard LM&Ro 143 263 0 06 Dec 2021
Hierarchical Reinforcement Learning with Timed Subgoals Nico Gürtler Le Chen Georg Martius 103 22 0 06 Dec 2021
Flexible-Joint Manipulator Trajectory Tracking with Learned Two-Stage Model employing One-Step Future Prediction D. Pavlichenko Sven Behnke 44 1 0 06 Dec 2021