Learning How to Infer Partial MDPs for In-Context Adaptation and Exploration

8 February 2023

Papers citing "Learning How to Infer Partial MDPs for In-Context Adaptation and Exploration"

26 / 26 papers shown

Title
In-context Reinforcement Learning with Algorithm Distillation Michael Laskin Luyu Wang Junhyuk Oh Emilio Parisotto Stephen Spencer ... Ethan A. Brooks Maxime Gazeau Himanshu Sahni Satinder Singh Volodymyr Mnih OffRL 53 128 0 25 Oct 2022
What Can Transformers Learn In-Context? A Case Study of Simple Function Classes Shivam Garg Dimitris Tsipras Percy Liang Gregory Valiant 116 504 0 01 Aug 2022
Retrieval-Augmented Reinforcement Learning Anirudh Goyal A. Friesen Andrea Banino T. Weber Nan Rosemary Ke ... Michal Valko Simon Osindero Timothy Lillicrap N. Heess Charles Blundell OffRL 57 54 0 17 Feb 2022
Transformers Can Do Bayesian Inference Samuel G. Müller Noah Hollmann Sebastian Pineda Arango Josif Grabocka Frank Hutter BDL UQCV 66 169 0 20 Dec 2021
An Explanation of In-context Learning as Implicit Bayesian Inference Sang Michael Xie Aditi Raghunathan Percy Liang Tengyu Ma ReLM BDL VPVLM LRM 175 746 0 03 Nov 2021
Self-Attention Between Datapoints: Going Beyond Individual Input-Output Pairs in Deep Learning Jannik Kossen Neil Band Clare Lyle Aidan Gomez Tom Rainforth Y. Gal OOD 3DPC 80 139 0 04 Jun 2021
Alchemy: A benchmark and analysis toolkit for meta-reinforcement learning agents Jane X. Wang Michael King Nicolas Porcel Z. Kurth-Nelson Tina Zhu ... Neil C. Rabinowitz Loic Matthey Demis Hassabis Alexander Lerchner M. Botvinick OffRL 73 33 0 04 Feb 2021
Language Models are Few-Shot Learners Tom B. Brown Benjamin Mann Nick Ryder Melanie Subbiah Jared Kaplan ... Christopher Berner Sam McCandlish Alec Radford Ilya Sutskever Dario Amodei BDL 672 41,736 0 28 May 2020
Meta-Learning in Neural Networks: A Survey Timothy M. Hospedales Antreas Antoniou P. Micaelli Amos Storkey OOD 358 1,967 0 11 Apr 2020
Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables Kate Rakelly Aurick Zhou Deirdre Quillen Chelsea Finn Sergey Levine OffRL 78 653 0 19 Mar 2019
Learning to Adapt in Dynamic, Real-World Environments Through Meta-Reinforcement Learning Anusha Nagabandi I. Clavera Simin Liu R. Fearing Pieter Abbeel Sergey Levine Chelsea Finn 106 547 0 30 Mar 2018
World Models David R Ha Jürgen Schmidhuber SyDa 113 1,079 0 27 Mar 2018
Meta Reinforcement Learning with Latent Variable Gaussian Processes Steindór Sæmundsson Katja Hofmann M. Deisenroth BDL OffRL AI4CE 74 141 0 20 Mar 2018
Efficient Exploration through Bayesian Deep Q-Networks Kamyar Azizzadenesheli Anima Anandkumar OffRL BDL 77 163 0 13 Feb 2018
BBQ-Networks: Efficient Exploration in Deep Reinforcement Learning for Task-Oriented Dialogue Systems Zachary Chase Lipton Xiujun Li Jianfeng Gao Lihong Li Faisal Ahmed Li Deng 55 171 0 15 Nov 2017
Value Prediction Network Junhyuk Oh Satinder Singh Honglak Lee 74 333 0 11 Jul 2017
Noisy Networks for Exploration Meire Fortunato M. G. Azar Bilal Piot Jacob Menick Ian Osband ... Rémi Munos Demis Hassabis Olivier Pietquin Charles Blundell Shane Legg 79 893 0 30 Jun 2017
Structure Learning in Motor Control:A Deep Reinforcement Learning Model Ari Weinstein M. Botvinick 18 14 0 21 Jun 2017
Attention Is All You Need Ashish Vaswani Noam M. Shazeer Niki Parmar Jakob Uszkoreit Llion Jones Aidan Gomez Lukasz Kaiser Illia Polosukhin 3DV 640 130,942 0 12 Jun 2017
Deep Exploration via Randomized Value Functions Ian Osband Benjamin Van Roy Daniel Russo Zheng Wen 89 304 0 22 Mar 2017
The Predictron: End-To-End Learning and Planning David Silver H. V. Hasselt Matteo Hessel Tom Schaul A. Guez ... Gabriel Dulac-Arnold David P. Reichert Neil C. Rabinowitz André Barreto T. Degris 62 291 0 28 Dec 2016
Learning to reinforcement learn Jane X. Wang Z. Kurth-Nelson Dhruva Tirumala Hubert Soyer Joel Z Leibo Rémi Munos Charles Blundell D. Kumaran M. Botvinick OffRL 97 977 0 17 Nov 2016
RL $^2$ : Fast Reinforcement Learning via Slow Reinforcement Learning Yan Duan John Schulman Xi Chen Peter L. Bartlett Ilya Sutskever Pieter Abbeel OffRL 76 1,015 0 09 Nov 2016
Deep Exploration via Bootstrapped DQN Ian Osband Charles Blundell Alexander Pritzel Benjamin Van Roy 106 1,305 0 15 Feb 2016
Value Iteration Networks Aviv Tamar Yi Wu G. Thomas Sergey Levine Pieter Abbeel 73 653 0 09 Feb 2016
(More) Efficient Reinforcement Learning via Posterior Sampling Ian Osband Daniel Russo Benjamin Van Roy 116 531 0 04 Jun 2013