When Do Transformers Shine in RL? Decoupling Memory from Credit
Assignment

When Do Transformers Shine in RL? Decoupling Memory from Credit Assignment

7 July 2023

Benjamin Eysenbach

Pierre-Luc Bacon

Papers citing "When Do Transformers Shine in RL? Decoupling Memory from Credit Assignment"

9 / 9 papers shown

Title
Uncertainty Representations in State-Space Layers for Deep Reinforcement Learning under Partial Observability Carlos E. Luis A. Bottero Julia Vinogradska Felix Berkenkamp Jan Peters 78 1 0 20 Feb 2025
TOP-ERL: Transformer-based Off-Policy Episodic Reinforcement Learning Ge Li Dong Tian Hongyi Zhou Xinkai Jiang Rudolf Lioutikov Gerhard Neumann OffRL 158 2 0 12 Oct 2024
UniZero: Generalized and Efficient Planning with Scalable Latent World Models Yuan Pu Yazhe Niu Jiyuan Ren Zhenjie Yang Hongsheng Li Yu Liu OffRL 41 1 0 15 Jun 2024
Efficient Recurrent Off-Policy RL Requires a Context-Encoder-Specific Learning Rate Fan Luo Zuolin Tu Zefang Huang Yang Yu OffRL 32 0 0 24 May 2024
Bridging State and History Representations: Understanding Self-Predictive RL Tianwei Ni Benjamin Eysenbach Erfan Seyedsalehi Michel Ma Clement Gehring Aditya Mahajan Pierre-Luc Bacon AI4TS AI4CE 17 20 0 17 Jan 2024
Memory-Consistent Neural Networks for Imitation Learning Kaustubh Sridhar Souradeep Dutta Dinesh Jayaraman James Weimer Insup Lee 36 8 0 09 Oct 2023
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 311 11,915 0 04 Mar 2022
Scaling Laws for Neural Language Models Jared Kaplan Sam McCandlish T. Henighan Tom B. Brown B. Chess R. Child Scott Gray Alec Radford Jeff Wu Dario Amodei 228 4,460 0 23 Jan 2020
Soft Actor-Critic for Discrete Action Settings Petros Christodoulou OffRL 104 292 0 16 Oct 2019