AMAGO: Scalable In-Context Reinforcement Learning for Adaptive Agents

15 October 2023

Linxi Fan

Papers citing "AMAGO: Scalable In-Context Reinforcement Learning for Adaptive Agents"

50 / 50 papers shown

Title
Learning Policy Committees for Effective Personalization in MDPs with Diverse Tasks Luise Ge Michael Lanier Anindya Sarkar Bengisu Guresti Yevgeniy Vorobeychik Chongjie Zhang 145 0 0 26 Feb 2025
N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs Ilya Zisman Alexander Nikulin Andrei Polubarov Nikita Lyubaykin Vladislav Kurenkov Andrei Polubarov Igor Kiselev Vladislav Kurenkov OffRL 92 2 0 04 Nov 2024
When Do Transformers Shine in RL? Decoupling Memory from Credit Assignment Tianwei Ni Michel Ma Benjamin Eysenbach Pierre-Luc Bacon OffRL 73 39 0 07 Jul 2023
POPGym: Benchmarking Partially Observable Reinforcement Learning Steven D. Morad Ryan Kortvelesy Matteo Bettini Stephan Liwicki Amanda Prorok OffRL 53 38 0 03 Mar 2023
In-context Reinforcement Learning with Algorithm Distillation Michael Laskin Luyu Wang Junhyuk Oh Emilio Parisotto Stephen Spencer ... Ethan A. Brooks Maxime Gazeau Himanshu Sahni Satinder Singh Volodymyr Mnih OffRL 50 128 0 25 Oct 2022
Evaluating Long-Term Memory in 3D Mazes J. Pašukonis Timothy Lillicrap Danijar Hafner 3DV 36 22 0 24 Oct 2022
Prompting Decision Transformer for Few-Shot Policy Generalization Mengdi Xu Songlin Yang Shun Zhang Yuchen Lu Ding Zhao J. Tenenbaum Chuang Gan OffRL 54 144 0 27 Jun 2022
Imitating Past Successes can be Very Suboptimal Benjamin Eysenbach Soumith Udatha Sergey Levine Ruslan Salakhutdinov OffRL 52 19 0 07 Jun 2022
Generalization, Mayhems and Limits in Recurrent Proximal Policy Optimization Marco Pleines Matthias Pallasch F. Zimmer Mike Preuss 42 14 0 23 May 2022
A Generalist Agent Scott E. Reed Konrad Zolna Emilio Parisotto Sergio Gomez Colmenarejo Alexander Novikov ... Yutian Chen R. Hadsell Oriol Vinyals Mahyar Bordbar Nando de Freitas LM&Ro LLMAG AI4CE 186 810 0 12 May 2022
Online Decision Transformer Qinqing Zheng Amy Zhang Aditya Grover OffRL 61 208 0 11 Feb 2022
Rethinking Goal-conditioned Supervised Learning and Its Connection to Offline RL Rui Yang Yiming Lu Wenzhe Li Hao Sun Meng Fang Yali Du Xiu Li Lei Han Chongjie Zhang OffRL 71 70 0 09 Feb 2022
In Defense of the Unitary Scalarization for Deep Multi-Task Learning Vitaly Kurin Alessandro De Palma Ilya Kostrikov Shimon Whiteson M. P. Kumar 69 74 0 11 Jan 2022
Recurrent Off-policy Baselines for Memory-based Continuous Control Zhihan Yang Hai V. Nguyen CLL OffRL 53 24 0 25 Oct 2021
Recurrent Model-Free RL Can Be a Strong Baseline for Many POMDPs Tianwei Ni Benjamin Eysenbach Ruslan Salakhutdinov 58 107 0 11 Oct 2021
Why Generalization in RL is Difficult: Epistemic POMDPs and Implicit Partial Observability Dibya Ghosh Jad Rahme Aviral Kumar Amy Zhang Ryan P. Adams Sergey Levine OffRL 344 116 0 13 Jul 2021
Improving Context-Based Meta-Reinforcement Learning with Self-Supervised Trajectory Contrastive Learning Bernie Wang Si-ting Xu Kurt Keutzer Yang Gao Bichen Wu SSL OffRL 36 7 0 10 Mar 2021
Measuring Visual Generalization in Continuous Control from Pixels J. E. Grigsby Yanjun Qi 34 25 0 13 Oct 2020
Mastering Atari with Discrete World Models Danijar Hafner Timothy Lillicrap Mohammad Norouzi Jimmy Ba DRL 93 849 0 05 Oct 2020
Decoupling Exploration and Exploitation for Meta-Reinforcement Learning without Sacrifices Emmy Liu Aditi Raghunathan Percy Liang Chelsea Finn OffRL 52 66 0 06 Aug 2020
Do Transformers Need Deep Long-Range Memory Jack W. Rae Ali Razavi RALM 48 40 0 07 Jul 2020
Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention Angelos Katharopoulos Apoorv Vyas Nikolaos Pappas Franccois Fleuret 166 1,755 0 29 Jun 2020
Critic Regularized Regression Ziyun Wang Alexander Novikov Konrad Zolna Jost Tobias Springenberg Scott E. Reed ... Noah Y. Siegel J. Merel Çağlar Gülçehre N. Heess Nando de Freitas OffRL 138 324 0 26 Jun 2020
The NetHack Learning Environment Heinrich Küttler Nantas Nardelli Alexander H. Miller Roberta Raileanu Marco Selvatici Edward Grefenstette Tim Rocktaschel 61 181 0 24 Jun 2020
AWAC: Accelerating Online Reinforcement Learning with Offline Datasets Ashvin Nair Abhishek Gupta Murtaza Dalal Sergey Levine OffRL OnRL 88 607 0 16 Jun 2020
Rewriting History with Inverse RL: Hindsight Inference for Policy Improvement Benjamin Eysenbach Xinyang Geng Sergey Levine Ruslan Salakhutdinov OffRL 37 87 0 25 Feb 2020
On Layer Normalization in the Transformer Architecture Ruibin Xiong Yunchang Yang Di He Kai Zheng Shuxin Zheng Chen Xing Huishuai Zhang Yanyan Lan Liwei Wang Tie-Yan Liu AI4CE 112 988 0 12 Feb 2020
Generalized Hidden Parameter MDPs Transferable Model-based RL in a Handful of Trials Christian F. Perez F. Such Theofanis Karaletsos 44 36 0 08 Feb 2020
Reward-Conditioned Policies Aviral Kumar Xue Bin Peng Sergey Levine 57 96 0 31 Dec 2019
Dota 2 with Large Scale Deep Reinforcement Learning OpenAI OpenAI : Christopher Berner Greg Brockman Brooke Chan ... Szymon Sidor Ilya Sutskever Jie Tang Filip Wolski Susan Zhang GNN VLM CLL AI4CE LRM 140 1,819 0 13 Dec 2019
Training Agents using Upside-Down Reinforcement Learning R. Srivastava Pranav Shyam Filipe Wall Mutz Wojciech Ja'skowski Jürgen Schmidhuber OffRL 59 126 0 05 Dec 2019
Reinforcement Learning Upside Down: Don't Predict Rewards -- Just Map Them to Actions J. Schmidhuber 47 131 0 05 Dec 2019
Leveraging Procedural Generation to Benchmark Reinforcement Learning K. Cobbe Christopher Hesse Jacob Hilton John Schulman 72 554 0 03 Dec 2019
Soft Actor-Critic for Discrete Action Settings Petros Christodoulou OffRL 133 296 0 16 Oct 2019
Stabilizing Transformers for Reinforcement Learning Emilio Parisotto H. F. Song Jack W. Rae Razvan Pascanu Çağlar Gülçehre ... Aidan Clark Seb Noury M. Botvinick N. Heess R. Hadsell OffRL 78 364 0 13 Oct 2019
Improving Sample Efficiency in Model-Free Reinforcement Learning from Images Denis Yarats Amy Zhang Ilya Kostrikov Brandon Amos Joelle Pineau Rob Fergus DRL 93 445 0 02 Oct 2019
Soft Actor-Critic Algorithms and Applications Tuomas Haarnoja Aurick Zhou Kristian Hartikainen George Tucker Sehoon Ha ... Vikash Kumar Henry Zhu Abhishek Gupta Pieter Abbeel Sergey Levine 130 2,418 0 13 Dec 2018
Assessing Generalization in Deep Reinforcement Learning Charles Packer Katelyn Gao Jernej Kos Philipp Krahenbuhl V. Koltun D. Song OffRL 99 236 0 29 Oct 2018
A Dissection of Overfitting and Generalization in Continuous Reinforcement Learning Amy Zhang Nicolas Ballas Joelle Pineau CLL OffRL 77 178 0 20 Jun 2018
Some Considerations on Learning to Explore via Meta-Reinforcement Learning Bradly C. Stadie Ge Yang Rein Houthooft Xi Chen Yan Duan Yuhuai Wu Pieter Abbeel Ilya Sutskever LRM 70 115 0 03 Mar 2018
Overcoming Exploration in Reinforcement Learning with Demonstrations Ashvin Nair Bob McGrew Marcin Andrychowicz Wojciech Zaremba Pieter Abbeel OffRL 86 783 0 28 Sep 2017
Deep Reinforcement Learning that Matters Peter Henderson Riashat Islam Philip Bachman Joelle Pineau Doina Precup David Meger OffRL 116 1,946 0 19 Sep 2017
Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks Chelsea Finn Pieter Abbeel Sergey Levine OOD 803 11,866 0 09 Mar 2017
Learning to reinforcement learn Jane X. Wang Z. Kurth-Nelson Dhruva Tirumala Hubert Soyer Joel Z Leibo Rémi Munos Charles Blundell D. Kumaran M. Botvinick OffRL 95 977 0 17 Nov 2016
RL $^2$ : Fast Reinforcement Learning via Slow Reinforcement Learning Yan Duan John Schulman Xi Chen Peter L. Bartlett Ilya Sutskever Pieter Abbeel OffRL 76 1,015 0 09 Nov 2016
Layer Normalization Jimmy Lei Ba J. Kiros Geoffrey E. Hinton 334 10,467 0 21 Jul 2016
Memory-based control with recurrent neural networks N. Heess Jonathan J. Hunt Timothy Lillicrap David Silver 77 302 0 14 Dec 2015
Continuous control with deep reinforcement learning Timothy Lillicrap Jonathan J. Hunt Alexander Pritzel N. Heess Tom Erez Yuval Tassa David Silver Daan Wierstra 296 13,214 0 09 Sep 2015
Deep Recurrent Q-Learning for Partially Observable MDPs Matthew J. Hausknecht Peter Stone 104 1,677 0 23 Jul 2015
The Arcade Learning Environment: An Evaluation Platform for General Agents Marc G. Bellemare Yavar Naddaf J. Veness Michael Bowling 106 3,002 0 19 Jul 2012