v1v2 (latest)

Leveraging Sequentiality in Reinforcement Learning from a Single Demonstration

9 November 2022

Alexandre Chenu

Olivier Serris

Olivier Sigaud

Nicolas Perrin-Gilbert

ArXiv (abs)PDF HTML

Papers citing "Leveraging Sequentiality in Reinforcement Learning from a Single Demonstration"

29 / 29 papers shown

Title
Reinforcement learning Florentin Wörgötter 82 2,532 0 16 May 2024
Divide & Conquer Imitation Learning Alexandre Chenu Nicolas Perrin-Gilbert Olivier Sigaud 94 5 0 15 Apr 2022
Goal-Conditioned Reinforcement Learning with Imagined Subgoals Elliot Chane-Sane Cordelia Schmid Ivan Laptev 77 144 0 01 Jul 2021
Coarse-to-Fine Imitation Learning: Robot Manipulation from a Single Demonstration Edward Johns SSL 64 130 0 13 May 2021
Reset-Free Reinforcement Learning via Multi-Task Learning: Learning Dexterous Manipulation Behaviors without Human Intervention Abhishek Gupta Justin Yu Tony Zhao Vikash Kumar Aaron Rovinsky Kelvin Xu Thomas Devlin Sergey Levine OffRL 124 98 0 22 Apr 2021
Primal Wasserstein Imitation Learning Robert Dadashi Léonard Hussenot Matthieu Geist Olivier Pietquin 74 129 0 08 Jun 2020
Controlling Overestimation Bias with Truncated Mixture of Continuous Distributional Quantile Critics Arsenii Kuznetsov Pavel Shvechikov Alexander Grishin Dmitry Vetrov 232 195 0 08 May 2020
First return, then explore Adrien Ecoffet Joost Huizinga Joel Lehman Kenneth O. Stanley Jeff Clune 82 363 0 27 Apr 2020
PBCS : Efficient Exploration and Exploitation Using a Synergy between Reinforcement Learning and Motion Planning Guillaume Matheron Nicolas Perrin Olivier Sigaud 46 19 0 24 Apr 2020
Planning with Goal-Conditioned Policies Soroush Nasiriany Vitchyr H. Pong Steven Lin Sergey Levine OffRL 140 219 0 19 Nov 2019
Solving Rubik's Cube with a Robot Hand OpenAI Ilge Akkaya Marcin Andrychowicz Maciek Chociej Ma-teusz Litwin ... Peter Welinder Lilian Weng Qiming Yuan Wojciech Zaremba Lei Zhang ODL 121 1,232 0 16 Oct 2019
Search on the Replay Buffer: Bridging Planning and Reinforcement Learning Benjamin Eysenbach Ruslan Salakhutdinov Sergey Levine OffRL 75 292 0 12 Jun 2019
Go-Explore: a New Approach for Hard-Exploration Problems Adrien Ecoffet Joost Huizinga Joel Lehman Kenneth O. Stanley Jeff Clune AI4TS 97 370 0 30 Jan 2019
Learning Montezuma's Revenge from a Single Demonstration Tim Salimans Richard J. Chen 110 139 0 08 Dec 2018
Hierarchical visuomotor control of humanoids J. Merel Arun Ahuja Vu Pham S. Tunyasuvunakool Siqi Liu Dhruva Tirumala N. Heess Greg Wayne 94 97 0 23 Nov 2018
Learning from Demonstration in the Wild Bertrand Higy K. Shiarlis Xi Chen Vitaly Kurin Sudhanshu Kasewa ... João Gomes Supratik Paul F. Oliehoek João Messias Shimon Whiteson 82 76 0 08 Nov 2018
Exploration by Random Network Distillation Yuri Burda Harrison Edwards Amos Storkey Oleg Klimov 159 1,342 0 30 Oct 2018
Discriminator-Actor-Critic: Addressing Sample Inefficiency and Reward Bias in Adversarial Imitation Learning Ilya Kostrikov Kumar Krishna Agrawal Debidatta Dwibedi Sergey Levine Jonathan Tompson 92 260 0 09 Sep 2018
Backplay: "Man muss immer umkehren" Cinjon Resnick R. Raileanu Sanyam Kapoor Alex Peysakhovich Kyunghyun Cho Joan Bruna OffRL 62 45 0 18 Jul 2018
Visual Reinforcement Learning with Imagined Goals Ashvin Nair Vitchyr H. Pong Murtaza Dalal Shikhar Bahl Steven Lin Sergey Levine SSL 84 544 0 12 Jul 2018
DeepMimic: Example-Guided Deep Reinforcement Learning of Physics-Based Character Skills Xue Bin Peng Pieter Abbeel Sergey Levine M. van de Panne AI4CE 237 499 0 08 Apr 2018
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor Tuomas Haarnoja Aurick Zhou Pieter Abbeel Sergey Levine 314 8,396 0 04 Jan 2018
Learnings Options End-to-End for Continuous Action Tasks Martin Klissarov Pierre-Luc Bacon J. Harb Doina Precup 50 55 0 30 Nov 2017
When Waiting is not an Option : Learning Options with a Deliberation Cost J. Harb Pierre-Luc Bacon Martin Klissarov Doina Precup 55 148 0 14 Sep 2017
Hindsight Experience Replay Marcin Andrychowicz Dwight Crow Alex Ray Jonas Schneider Rachel Fong Peter Welinder Bob McGrew Joshua Tobin Pieter Abbeel Wojciech Zaremba OffRL 271 2,337 0 05 Jul 2017
The Option-Critic Architecture Pierre-Luc Bacon J. Harb Doina Precup OffRL 64 1,088 0 16 Sep 2016
Generative Adversarial Imitation Learning Jonathan Ho Stefano Ermon GAN 159 3,119 0 10 Jun 2016
Unifying Count-Based Exploration and Intrinsic Motivation Marc G. Bellemare S. Srinivasan Georg Ostrovski Tom Schaul D. Saxton Rémi Munos 176 1,483 0 06 Jun 2016
OpenAI Gym Greg Brockman Vicki Cheung Ludwig Pettersson Jonas Schneider John Schulman Jie Tang Wojciech Zaremba OffRL ODL 223 5,085 0 05 Jun 2016