Optimizing Agent Behavior over Long Time Scales by Transporting Value

Optimizing Agent Behavior over Long Time Scales by Transporting Value

15 October 2018

Timothy Lillicrap

Federico Carnevale

Arun Ahuja

Papers citing "Optimizing Agent Behavior over Long Time Scales by Transporting Value"

18 / 18 papers shown

Title
Evolution and The Knightian Blindspot of Machine Learning Joel Lehman Elliot Meyerson Tarek El-Gaaly Kenneth O. Stanley Tarin Ziyaee 86 2 0 22 Jan 2025
Neuro-Inspired Fragmentation and Recall to Overcome Catastrophic Forgetting in Curiosity Jaedong Hwang Zhang-Wei Hong Eric Chen Akhilan Boopathy Pulkit Agrawal Ila Fiete CLL 35 5 0 26 Oct 2023
PCGPT: Procedural Content Generation via Transformers Sajad Mohaghegh Mohammad Amin Ramezan Dehnavi Golnoosh Abdollahinejad Matin Hashemi ViT 24 2 0 03 Oct 2023
Transformers in Reinforcement Learning: A Survey Pranav Agarwal A. Rahman P. St-Charles Simon J. D. Prince Samira Ebrahimi Kahou OffRL 26 19 0 12 Jul 2023
Off-Beat Multi-Agent Reinforcement Learning Wei Qiu Weixun Wang R. Wang Bo An Yujing Hu S. Obraztsova Zinovi Rabinovich Jianye Hao Yingfeng Chen Changjie Fan OffRL 29 2 0 27 May 2022
Selective Credit Assignment Veronica Chelu Diana Borsa Doina Precup Hado van Hasselt 29 2 0 20 Feb 2022
Bayesian sense of time in biological and artificial brains Z. Fountas Alexey Zakharov 35 0 0 14 Jan 2022
Model-Based Episodic Memory Induces Dynamic Hybrid Controls Hung Le Thommen George Karimpanal Majid Abdolshah T. Tran Svetha Venkatesh 25 19 0 03 Nov 2021
Biological learning in key-value memory networks Danil Tyulmankov Ching Fang Annapurna Vadaparty G. R. Yang 20 27 0 26 Oct 2021
Evaluating the progress of Deep Reinforcement Learning in the real world: aligning domain-agnostic and domain-specific research J. Luis E. Crawley B. Cameron OffRL 25 6 0 07 Jul 2021
Towards Practical Credit Assignment for Deep Reinforcement Learning Vyacheslav Alipov Riley Simmons-Edler N.Yu. Putintsev Pavel Kalinin Dmitry Vetrov OffRL 32 11 0 08 Jun 2021
Towards mental time travel: a hierarchical memory for reinforcement learning agents Andrew Kyle Lampinen Stephanie C. Y. Chan Andrea Banino Felix Hill 24 47 0 28 May 2021
An Information-Theoretic Perspective on Credit Assignment in Reinforcement Learning Dilip Arumugam Peter Henderson Pierre-Luc Bacon 24 17 0 10 Mar 2021
Forethought and Hindsight in Credit Assignment Veronica Chelu Doina Precup H. V. Hasselt 19 25 0 26 Oct 2020
Agent57: Outperforming the Atari Human Benchmark Adria Puigdomenech Badia Bilal Piot Steven Kapturowski Pablo Sprechmann Alex Vitvitskyi Daniel Guo Charles Blundell OffRL 18 509 0 30 Mar 2020
An empirical investigation of the challenges of real-world reinforcement learning Gabriel Dulac-Arnold Nir Levine D. Mankowitz Jerry Li Cosmin Paduraru Sven Gowal Todd Hester OffRL 34 120 0 24 Mar 2020
Shaping Belief States with Generative Environment Models for RL Karol Gregor Danilo Jimenez Rezende F. Besse Yan Wu Hamza Merzic Aaron van den Oord OffRL AI4CE 16 117 0 21 Jun 2019
RUDDER: Return Decomposition for Delayed Rewards Jose A. Arjona-Medina Michael Gillhofer Michael Widrich Thomas Unterthiner Johannes Brandstetter Sepp Hochreiter 30 212 0 20 Jun 2018