On Many-Actions Policy Gradient

24 October 2022

Papers citing "On Many-Actions Policy Gradient"

10 / 10 papers shown

Title
Mastering Visual Continuous Control: Improved Data-Augmented Reinforcement Learning Denis Yarats Rob Fergus A. Lazaric Lerrel Pinto OffRL 41 344 0 20 Jul 2021
Mastering Atari with Discrete World Models Danijar Hafner Timothy Lillicrap Mohammad Norouzi Jimmy Ba DRL 62 834 0 05 Oct 2020
What Matters In On-Policy Reinforcement Learning? A Large-Scale Empirical Study Marcin Andrychowicz Anton Raichuk Piotr Stańczyk Manu Orsini Sertan Girgin ... Matthieu Geist Olivier Pietquin Marcin Michalski Sylvain Gelly Olivier Bachem OffRL 33 217 0 10 Jun 2020
When to Trust Your Model: Model-Based Policy Optimization Michael Janner Justin Fu Marvin Zhang Sergey Levine OffRL 46 939 0 19 Jun 2019
Is the Policy Gradient a Gradient? Chris Nota Philip S. Thomas 31 58 0 17 Jun 2019
DeepMDP: Learning Continuous Latent Space Models for Representation Learning Carles Gelada Saurabh Kumar Jacob Buckman Ofir Nachum Marc G. Bellemare BDL 45 283 0 06 Jun 2019
Model-Based Value Estimation for Efficient Model-Free Reinforcement Learning Vladimir Feinberg Alvin Wan Ion Stoica Michael I. Jordan Joseph E. Gonzalez Sergey Levine OffRL 28 317 0 28 Feb 2018
The Mirage of Action-Dependent Baselines in Reinforcement Learning George Tucker Surya Bhupatiraju S. Gu Richard Turner Zoubin Ghahramani Sergey Levine OffRL 41 127 0 27 Feb 2018
Asynchronous Methods for Deep Reinforcement Learning Volodymyr Mnih Adria Puigdomenech Badia M. Berk Mirza Alex Graves Timothy Lillicrap Tim Harley David Silver Koray Kavukcuoglu 148 8,805 0 04 Feb 2016
Deep Reinforcement Learning with Double Q-learning H. V. Hasselt A. Guez David Silver OffRL 93 7,590 0 22 Sep 2015