Bigger, Better, Faster: Human-level Atari with human-level efficiency

Bigger, Better, Faster: Human-level Atari with human-level efficiency

30 May 2023

J. Obando-Ceron

Aaron C. Courville

Marc G. Bellemare

Rishabh Agarwal

Pablo Samuel Castro

Papers citing "Bigger, Better, Faster: Human-level Atari with human-level efficiency"

17 / 67 papers shown

Title
DrM: Mastering Visual Reinforcement Learning through Dormant Ratio Minimization Guowei Xu Ruijie Zheng Yongyuan Liang Xiyao Wang Zhecheng Yuan ... Shuzhen Li Yanjie Ze Hal Daumé Furong Huang Huazhe Xu 40 28 0 30 Oct 2023
On the Theory of Risk-Aware Agents: Bridging Actor-Critic and Economics Michal Nauman Marek Cygan 35 1 0 30 Oct 2023
AMAGO: Scalable In-Context Reinforcement Learning for Adaptive Agents Jake Grigsby Linxi Fan Yuke Zhu OffRL LM&Ro 38 10 0 15 Oct 2023
STORM: Efficient Stochastic Transformer based World Models for Reinforcement Learning Weipu Zhang Gang Wang Jian Sun Yetian Yuan Gao Huang 63 31 0 14 Oct 2023
Revisiting Plasticity in Visual Reinforcement Learning: Data, Modules and Training Stages Guozheng Ma Lu Li Sen Zhang Zixuan Liu Zhen Wang Yixin Chen Li Shen Xueqian Wang Dacheng Tao OffRL 45 16 0 11 Oct 2023
Small batch deep reinforcement learning J. Obando-Ceron Marc G. Bellemare Pablo Samuel Castro VLM 34 14 0 05 Oct 2023
BarlowRL: Barlow Twins for Data-Efficient Reinforcement Learning Omer Veysel Cagatan Barış Akgün BDL OffRL 35 3 0 08 Aug 2023
PASTA: Pretrained Action-State Transformer Agents Raphael Boige Yannis Flet-Berliac Arthur Flajolet Guillaume Richard Thomas Pierrot LM&Ro OffRL 37 5 0 20 Jul 2023
Maintaining Plasticity in Deep Continual Learning Shibhansh Dohare J. F. Hernandez-Garcia Parash Rahman A. R. Mahmood Richard S. Sutton KELM CLL 32 27 0 23 Jun 2023
PACER: A Fully Push-forward-based Distributional Reinforcement Learning Algorithm Wensong Bai Chao Zhang Yichao Fu Lingwei Peng Hui Qian Bin Dai 24 1 0 11 Jun 2023
Human-level Atari 200x faster Steven Kapturowski Victor Campos Ray Jiang Nemanja Rakićević Hado van Hasselt Charles Blundell Adria Puigdomenech Badia OffRL 52 28 0 15 Sep 2022
Using Forwards-Backwards Models to Approximate MDP Homomorphisms Augustine N. Mavor-Parker Matthew J. Sargent Christian Pehle Andrea Banino Lewis D. Griffin Caswell Barry 20 2 0 14 Sep 2022
Light-weight probing of unsupervised representations for Reinforcement Learning Wancong Zhang Anthony GX-Chen Vlad Sobal Yann LeCun Nicolas Carion SSL OffRL 41 13 0 25 Aug 2022
The Primacy Bias in Deep Reinforcement Learning Evgenii Nikishin Max Schwarzer P. DÓro Pierre-Luc Bacon Aaron C. Courville OnRL 96 180 0 16 May 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 325 11,953 0 04 Mar 2022
D2RL: Deep Dense Architectures in Reinforcement Learning Samarth Sinha Homanga Bharadhwaj A. Srinivas Animesh Garg OffRL AI4CE 51 56 0 19 Oct 2020
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 340 1,960 0 04 May 2020