Evaluating Long-Term Memory in 3D Mazes

24 October 2022

Papers citing "Evaluating Long-Term Memory in 3D Mazes"

23 / 23 papers shown

Title
DayDreamer: World Models for Physical Robot Learning Philipp Wu Alejandro Escontrela Danijar Hafner Ken Goldberg Pieter Abbeel 97 293 0 28 Jun 2022
MuZero with Self-competition for Rate Control in VP9 Video Compression Amol Mandhane A. Zhernov Maribeth Rauh Chenjie Gu Miaosen Wang ... Jackson Broshear Julian Schrittwieser Thomas Hubert Oriol Vinyals Timothy A. Mann 48 44 0 14 Feb 2022
Don't Change the Algorithm, Change the Data: Exploratory Data for Offline Reinforcement Learning Denis Yarats David Brandfonbrener Hao Liu Michael Laskin Pieter Abbeel A. Lazaric Lerrel Pinto OffRL OnRL 61 89 0 31 Jan 2022
Benchmarking the Spectrum of Agent Capabilities Danijar Hafner ELM 62 136 0 14 Sep 2021
Mastering Atari with Discrete World Models Danijar Hafner Timothy Lillicrap Mohammad Norouzi Jimmy Ba DRL 93 849 0 05 Oct 2020
dm_control: Software and Tasks for Continuous Control Yuval Tassa S. Tunyasuvunakool Alistair Muldal Yotam Doron Piotr Trochim ... Steven Bohez J. Merel Tom Erez Timothy Lillicrap N. Heess LM&Ro 75 411 0 22 Jun 2020
Agent57: Outperforming the Atari Human Benchmark Adria Puigdomenech Badia Bilal Piot Steven Kapturowski Pablo Sprechmann Alex Vitvitskyi Daniel Guo Charles Blundell OffRL 63 519 0 30 Mar 2020
Decision-Making with Auto-Encoding Variational Bayes Romain Lopez Pierre Boyeau Nir Yosef Michael I. Jordan Jeffrey Regier BDL 312 10,591 0 17 Feb 2020
A Simple Framework for Contrastive Learning of Visual Representations Ting-Li Chen Simon Kornblith Mohammad Norouzi Geoffrey E. Hinton SSL 321 18,686 0 13 Feb 2020
Leveraging Procedural Generation to Benchmark Reinforcement Learning K. Cobbe Christopher Hesse Jacob Hilton John Schulman 72 554 0 03 Dec 2019
Generalization of Reinforcement Learners with Working and Episodic Memory Meire Fortunato Melissa Tan Ryan Faulkner Steven Hansen Adria Puigdomenech Badia Gavin Buttimore Charlie Deck Joel Z Leibo Charles Blundell 69 70 0 29 Oct 2019
Solving Rubik's Cube with a Robot Hand OpenAI Ilge Akkaya Marcin Andrychowicz Maciek Chociej Ma-teusz Litwin ... Peter Welinder Lilian Weng Qiming Yuan Wojciech Zaremba Lei Zhang ODL 111 1,225 0 16 Oct 2019
Stabilizing Transformers for Reinforcement Learning Emilio Parisotto H. F. Song Jack W. Rae Razvan Pascanu Çağlar Gülçehre ... Aidan Clark Seb Noury M. Botvinick N. Heess R. Hadsell OffRL 78 364 0 13 Oct 2019
Fine-Tuning Language Models from Human Preferences Daniel M. Ziegler Nisan Stiennon Jeff Wu Tom B. Brown Alec Radford Dario Amodei Paul Christiano G. Irving ALM 449 1,717 0 18 Sep 2019
Shaping Belief States with Generative Environment Models for RL Karol Gregor Danilo Jimenez Rezende F. Besse Yan Wu Hamza Merzic Aaron van den Oord OffRL AI4CE 80 119 0 21 Jun 2019
Unsupervised State Representation Learning in Atari Ankesh Anand Evan Racah Sherjil Ozair Yoshua Bengio Marc-Alexandre Côté R. Devon Hjelm SSL 51 255 0 19 Jun 2019
Learning Latent Dynamics for Planning from Pixels Danijar Hafner Timothy Lillicrap Ian S. Fischer Ruben Villegas David R Ha Honglak Lee James Davidson BDL 84 1,430 0 12 Nov 2018
Representation Learning with Contrastive Predictive Coding Aaron van den Oord Yazhe Li Oriol Vinyals DRL SSL 280 10,253 0 10 Jul 2018
World Models David R Ha Jürgen Schmidhuber SyDa 113 1,075 0 27 Mar 2018
IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures L. Espeholt Hubert Soyer Rémi Munos Karen Simonyan Volodymyr Mnih ... Vlad Firoiu Tim Harley Iain Dunning Shane Legg Koray Kavukcuoglu 179 1,594 0 05 Feb 2018
DeepMind Control Suite Yuval Tassa Yotam Doron Alistair Muldal Tom Erez Yazhe Li ... A. Abdolmaleki J. Merel Andrew Lefrancq Timothy Lillicrap Martin Riedmiller ELM LM&Ro BDL 125 1,126 0 02 Jan 2018
Action-Conditional Video Prediction using Deep Networks in Atari Games Junhyuk Oh Xiaoxiao Guo Honglak Lee Richard L. Lewis Satinder Singh 103 852 0 31 Jul 2015
The Arcade Learning Environment: An Evaluation Platform for General Agents Marc G. Bellemare Yavar Naddaf J. Veness Michael Bowling 106 3,002 0 19 Jul 2012