Grounding Aleatoric Uncertainty for Unsupervised Environment Design

11 July 2022

Papers citing "Grounding Aleatoric Uncertainty for Unsupervised Environment Design"

40 / 40 papers shown

Title
Replay-Guided Adversarial Environment Design Minqi Jiang Michael Dennis Jack Parker-Holder Jakob N. Foerster Edward Grefenstette Tim Rocktaschel 166 98 0 06 Oct 2021
MiniHack the Planet: A Sandbox for Open-Ended Reinforcement Learning Research Mikayel Samvelyan Robert Kirk Vitaly Kurin Jack Parker-Holder Minqi Jiang Eric Hambro Fabio Petroni Heinrich Küttler Edward Grefenstette Tim Rocktaschel OffRL 270 89 0 27 Sep 2021
Open-Ended Learning Leads to Generally Capable Agents Open-Ended Learning Team Adam Stooke Anuj Mahajan Catarina Barros Charlie Deck ... Nicolas Porcel Roberta Raileanu Steph Hughes-Fitt Valentin Dalibard Wojciech M. Czarnecki 75 184 0 27 Jul 2021
Off-Belief Learning Hengyuan Hu Adam Lerer Brandon Cui David J. Wu Luis Pineda Noam Brown Jakob N. Foerster OffRL 32 70 0 06 Mar 2021
Asymmetric self-play for automatic goal discovery in robotic manipulation OpenAI OpenAI Matthias Plappert Raul Sampedro Tao Xu Ilge Akkaya ... Hyeonwoo Noh Lilian Weng Qiming Yuan Casey Chu Wojciech Zaremba SSL 105 77 0 13 Jan 2021
When Do Curricula Work? Xiaoxia Wu Ethan Dyer Behnam Neyshabur 50 115 0 05 Dec 2020
Emergent Complexity and Zero-shot Transfer via Unsupervised Environment Design Michael Dennis Natasha Jaques Eugene Vinitsky Alexandre M. Bayen Stuart J. Russell Andrew Critch Sergey Levine 62 228 0 03 Dec 2020
Prioritized Level Replay Minqi Jiang Edward Grefenstette Tim Rocktaschel OffRL 51 154 0 08 Oct 2020
The NetHack Learning Environment Heinrich Küttler Nantas Nardelli Alexander H. Miller Roberta Raileanu Marco Selvatici Edward Grefenstette Tim Rocktaschel 56 179 0 24 Jun 2020
Learning with AMIGo: Adversarially Motivated Intrinsic Goals Andres Campero Roberta Raileanu Heinrich Küttler J. Tenenbaum Tim Rocktaschel Edward Grefenstette 73 127 0 22 Jun 2020
Learning Invariant Representations for Reinforcement Learning without Reconstruction Amy Zhang R. McAllister Roberto Calandra Y. Gal Sergey Levine OOD SSL 96 469 0 18 Jun 2020
What Matters In On-Policy Reinforcement Learning? A Large-Scale Empirical Study Marcin Andrychowicz Anton Raichuk Piotr Stańczyk Manu Orsini Sertan Girgin ... Matthieu Geist Olivier Pietquin Marcin Michalski Sylvain Gelly Olivier Bachem OffRL 52 217 0 10 Jun 2020
Enhanced POET: Open-Ended Reinforcement Learning through Unbounded Invention of Learning Challenges and their Solutions Rui Wang Joel Lehman Aditya Rawal Jiale Zhi Yulun Li Jeff Clune Kenneth O. Stanley 62 127 0 19 Mar 2020
Neuroevolution of Self-Interpretable Agents Yujin Tang Duong Nguyen David R Ha 74 112 0 18 Mar 2020
Curriculum Learning for Reinforcement Learning Domains: A Framework and Survey Sanmit Narvekar Bei Peng Matteo Leonetti Jivko Sinapov Matthew E. Taylor Peter Stone ODL 223 466 0 10 Mar 2020
Automatic Curriculum Learning For Deep RL: A Short Survey Rémy Portelas Cédric Colas Lilian Weng Katja Hofmann Pierre-Yves Oudeyer ODL 57 171 0 10 Mar 2020
"Other-Play" for Zero-Shot Coordination Hengyuan Hu Adam Lerer A. Peysakhovich Jakob N. Foerster VLM OffRL 150 219 0 06 Mar 2020
VariBAD: A Very Good Method for Bayes-Adaptive Deep RL via Meta-Learning L. Zintgraf K. Shiarlis Maximilian Igl Sebastian Schulze Y. Gal Katja Hofmann Shimon Whiteson OffRL 53 273 0 18 Oct 2019
RTFM: Generalising to Novel Environment Dynamics via Reading Victor Zhong Tim Rocktaschel Edward Grefenstette LLMAG OffRL AI4CE 44 54 0 18 Oct 2019
Adaptive Trade-Offs in Off-Policy Learning Mark Rowland Will Dabney Rémi Munos OffRL 97 22 0 16 Oct 2019
Teacher algorithms for curriculum learning of Deep RL in continuously parameterized environments Rémy Portelas Cédric Colas Katja Hofmann Pierre-Yves Oudeyer 51 144 0 16 Oct 2019
Invariant Risk Minimization Martín Arjovsky Léon Bottou Ishaan Gulrajani David Lopez-Paz OOD 164 2,190 0 05 Jul 2019
Learning Causal State Representations of Partially Observable Environments Amy Zhang Zachary Chase Lipton Luis Villaseñor-Pineda Kamyar Azizzadenesheli Anima Anandkumar Laurent Itti Joelle Pineau Tommaso Furlanello CML 56 49 0 25 Jun 2019
Off-Policy Deep Reinforcement Learning by Bootstrapping the Covariate Shift Carles Gelada Marc G. Bellemare OffRL 54 97 0 27 Jan 2019
Paired Open-Ended Trailblazer (POET): Endlessly Generating Increasingly Complex and Diverse Learning Environments and Their Solutions Rui Wang Joel Lehman Jeff Clune Kenneth O. Stanley 84 245 0 07 Jan 2019
IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures L. Espeholt Hubert Soyer Rémi Munos Karen Simonyan Volodymyr Mnih ... Vlad Firoiu Tim Harley Iain Dunning Shane Legg Koray Kavukcuoglu 165 1,584 0 05 Feb 2018
Sim-to-Real Transfer of Robotic Control with Dynamics Randomization Xue Bin Peng Marcin Andrychowicz Wojciech Zaremba Pieter Abbeel 93 1,355 0 18 Oct 2017
Proximal Policy Optimization Algorithms John Schulman Filip Wolski Prafulla Dhariwal Alec Radford Oleg Klimov OffRL 285 18,685 0 20 Jul 2017
Teacher-Student Curriculum Learning Tambet Matiisen Avital Oliver Taco S. Cohen John Schulman ODL 81 376 0 01 Jul 2017
Automatic Goal Generation for Reinforcement Learning Agents Carlos Florensa David Held Xinyang Geng Pieter Abbeel 100 506 0 17 May 2017
Domain Randomization for Transferring Deep Neural Networks from Simulation to the Real World Joshua Tobin Rachel Fong Alex Ray Jonas Schneider Wojciech Zaremba Pieter Abbeel 191 2,948 0 20 Mar 2017
Intrinsic Motivation and Automatic Curricula via Asymmetric Self-Play Sainbayar Sukhbaatar Zeming Lin Ilya Kostrikov Gabriel Synnaeve Arthur Szlam Rob Fergus SSL 53 335 0 15 Mar 2017
Robust Adversarial Reinforcement Learning Lerrel Pinto James Davidson Rahul Sukthankar Abhinav Gupta OOD 83 848 0 08 Mar 2017
Consistent On-Line Off-Policy Evaluation Assaf Hallak Shie Mannor OffRL 59 93 0 23 Feb 2017
CAD2RL: Real Single-Image Flight without a Single Real Image Fereshteh Sadeghi Sergey Levine SSL 295 814 0 13 Nov 2016
Data-Efficient Off-Policy Policy Evaluation for Reinforcement Learning Philip S. Thomas Emma Brunskill OffRL 276 573 0 04 Apr 2016
High-Dimensional Continuous Control Using Generalized Advantage Estimation John Schulman Philipp Moritz Sergey Levine Michael I. Jordan Pieter Abbeel OffRL 60 3,368 0 08 Jun 2015
An Emphatic Approach to the Problem of Off-policy Temporal-Difference Learning R. Sutton A. R. Mahmood Martha White 72 269 0 14 Mar 2015
(More) Efficient Reinforcement Learning via Posterior Sampling Ian Osband Daniel Russo Benjamin Van Roy 105 529 0 04 Jun 2013
The Complexity of Decentralized Control of Markov Decision Processes D. Bernstein S. Zilberstein N. Immerman 90 1,588 0 16 Jan 2013