Recurrent World Models Facilitate Policy Evolution

4 September 2018

Papers citing "Recurrent World Models Facilitate Policy Evolution"

50 / 325 papers shown

Title
On the Sensory Commutativity of Action Sequences for Embodied Agents Hugo Caselles-Dupré Michael Garcia Ortiz David Filliat 50 4 0 13 Feb 2020
Effective Reinforcement Learning through Evolutionary Surrogate-Assisted Prescription Olivier Francon Santiago Gonzalez Babak Hodjat Elliot Meyerson Risto Miikkulainen Xin Qiu Hormoz Shahrzad 80 17 0 13 Feb 2020
A Novel Evolution Strategy with Directional Gaussian Smoothing for Blackbox Optimization Jiaxin Zhang Hoang Tran Dan Lu Guannan Zhang 87 17 0 07 Feb 2020
Ready Policy One: World Building Through Active Learning Philip J. Ball Jack Parker-Holder Aldo Pacchiano K. Choromanski Stephen J. Roberts OffRL 92 49 0 07 Feb 2020
Deep Reinforcement Learning for Autonomous Driving: A Survey B. R. Kiran Ibrahim Sobh V. Talpaert Patrick Mannion A. A. Sallab S. Yogamani P. Pérez 367 1,710 0 02 Feb 2020
Domain-Adversarial and Conditional State Space Model for Imitation Learning Ryogo Okumura Masashi Okada T. Taniguchi 73 12 0 31 Jan 2020
Rotation, Translation, and Cropping for Zero-Shot Generalization Chang Ye Ahmed Khalifa Philip Bontrager Julian Togelius 93 38 0 27 Jan 2020
Improving Image Autoencoder Embeddings with Perceptual Loss G. Pihlgren Fredrik Sandin Marcus Liwicki 72 34 0 10 Jan 2020
Learning Predictive Models From Observation and Interaction Karl Schmeckpeper Annie Xie Oleh Rybkin Stephen Tian Kostas Daniilidis Sergey Levine Chelsea Finn DRL 91 60 0 30 Dec 2019
Deep Innovation Protection: Confronting the Credit Assignment Problem in Training Heterogeneous Neural Architectures S. Risi Kenneth O. Stanley 82 4 0 29 Dec 2019
SketchTransfer: A Challenging New Task for Exploring Detail-Invariance and the Abstractions Learned by Deep Networks Alex Lamb Sherjil Ozair Vikas Verma David R Ha AAML 137 4 0 25 Dec 2019
A Survey of Deep Reinforcement Learning in Video Games Kun Shao Zhentao Tang Yuanheng Zhu Nannan Li Dongbin Zhao OffRL AI4TS 131 193 0 23 Dec 2019
Variational Recurrent Models for Solving Partially Observable Control Tasks Dongqi Han Kenji Doya Jun Tani DRL OffRL 72 63 0 23 Dec 2019
Direct and indirect reinforcement learning Yang Guan Shengbo Eben Li Jingliang Duan Jie Li Yangang Ren Qi Sun B. Cheng OffRL 68 34 0 23 Dec 2019
Reinforcement Learning-based Visual Navigation with Information-Theoretic Regularization Qiaoyun Wu Kai Xu Jun Wang Mingliang Xu Xiaoxi Gong Tianyi Zhou 84 30 0 09 Dec 2019
Learning Human Objectives by Evaluating Hypothetical Behavior S. Reddy Anca Dragan Sergey Levine Shane Legg Jan Leike 87 77 0 05 Dec 2019
Increasing Generality in Machine Learning through Procedural Content Generation S. Risi Julian Togelius 67 127 0 29 Nov 2019
Learning Structured Representations of Spatial and Interactive Dynamics for Trajectory Prediction in Crowded Scenes Todor Davchev Michael G. Burke S. Ramamoorthy 43 0 0 29 Nov 2019
Social Attention for Autonomous Decision-Making in Dense Traffic Edouard Leurent Jean Pierre Mercat 72 87 0 27 Nov 2019
Scaling active inference Alexander Tschantz Manuel Baltieri A. Seth Christopher L. Buckley BDL AI4CE 68 69 0 24 Nov 2019
Crowd Density Forecasting by Modeling Patch-based Dynamics H. Minoura Ryo Yonetani Mai Nishimura Yoshitaka Ushiku 48 12 0 22 Nov 2019
Explicit Explore-Exploit Algorithms in Continuous State Spaces Mikael Henaff OffRL 115 32 0 01 Nov 2019
Learning to Predict Without Looking Ahead: World Models Without Forward Prediction C. Freeman Luke Metz David R Ha 82 36 0 29 Oct 2019
Multi-View Reinforcement Learning Minne Li Lisheng Wu Haitham Bou-Ammar Jun Wang 64 26 0 18 Oct 2019
Parallel Exploration via Negatively Correlated Search Peng Yang Qi Yang K. Tang Xin Yao 125 14 0 16 Oct 2019
Regularizing Model-Based Planning with Energy-Based Models Rinu Boney Arno Solin Alexander Ilin 76 18 0 12 Oct 2019
R-SQAIR: Relational Sequential Attend, Infer, Repeat Aleksandar Stanić Jürgen Schmidhuber 82 31 0 11 Oct 2019
Improving Generalization in Meta Reinforcement Learning using Learned Objectives Louis Kirsch Sjoerd van Steenkiste Jürgen Schmidhuber OffRL 95 119 0 09 Oct 2019
Making sense of sensory input Maciej Wołczyk Jacek Tabor Johannes Welbl Szymon Maszke Marek Sergot 92 53 0 05 Oct 2019
Improving Sample Efficiency in Model-Free Reinforcement Learning from Images Denis Yarats Amy Zhang Ilya Kostrikov Brandon Amos Joelle Pineau Rob Fergus DRL 139 450 0 02 Oct 2019
MERL: Multi-Head Reinforcement Learning Yannis Flet-Berliac Philippe Preux OffRL 122 13 0 26 Sep 2019
Mathematical Reasoning in Latent Space Dennis Lee Christian Szegedy M. Rabe Sarah M. Loos Kshitij Bansal 78 34 0 26 Sep 2019
WATTNet: Learning to Trade FX via Hierarchical Spatio-Temporal Representation of Highly Multivariate Time Series Jinho Lee Seokho Yi Jaewoo Kang AI4TS 41 15 0 24 Sep 2019
Policy Prediction Network: Model-Free Behavior Policy with Model-Based Learning in Continuous Action Space Zac Wellmer James T. Kwok 26 0 0 15 Sep 2019
Gradient-Aware Model-based Policy Search P. DÓro Alberto Maria Metelli Andrea Tirinzoni Matteo Papini Marcello Restelli 93 36 0 09 Sep 2019
Deterministic Value-Policy Gradients Qingpeng Cai L. Pan Pingzhong Tang 54 1 0 09 Sep 2019
Sample-efficient Deep Reinforcement Learning with Imaginary Rollouts for Human-Robot Interaction M. Thabet Massimiliano Patacchiola Angelo Cangelosi OffRL 44 12 0 15 Aug 2019
Towards Model-based Reinforcement Learning for Industry-near Environments Per-Arne Andersen M. G. Olsen Ole-Christoffer Granmo OffRL DRL 48 4 0 27 Jul 2019
Composing Diverse Policies for Temporally Extended Tasks Daniel Angelov Yordan V. Hristov Michael G. Burke S. Ramamoorthy 73 18 0 18 Jul 2019
Convolutional Reservoir Computing for World Models Hanten Chang K. Futagami 50 4 0 18 Jul 2019
Task Selection Policies for Multitask Learning John Glover Chris Hokamp OffRL 84 7 0 14 Jul 2019
Deep Active Inference as Variational Policy Gradients Beren Millidge BDL 97 103 0 08 Jul 2019
Dynamics-Aware Unsupervised Discovery of Skills Archit Sharma S. Gu Sergey Levine Vikash Kumar Karol Hausman 130 414 0 02 Jul 2019
Learning Belief Representations for Imitation Learning in POMDPs Tanmay Gangwani Joel Lehman Qiang Liu Jian Peng 59 37 0 22 Jun 2019
Exploring Model-based Planning with Policy Networks Tingwu Wang Jimmy Ba 117 150 0 20 Jun 2019
Unsupervised State Representation Learning in Atari Ankesh Anand Evan Racah Sherjil Ozair Yoshua Bengio Marc-Alexandre Côté R. Devon Hjelm SSL 162 255 0 19 Jun 2019
Weight Agnostic Neural Networks Adam Gaier David R Ha OOD 67 242 0 11 Jun 2019
DeepMDP: Learning Continuous Latent Space Models for Representation Learning Carles Gelada Saurabh Kumar Jacob Buckman Ofir Nachum Marc G. Bellemare BDL 93 290 0 06 Jun 2019
Hamiltonian Neural Networks S. Greydanus Misko Dzamba J. Yosinski PINN AI4CE 145 900 0 04 Jun 2019
A Perspective on Objects and Systematic Generalization in Model-Based RL Sjoerd van Steenkiste Klaus Greff Jürgen Schmidhuber OCL OffRL 102 31 0 03 Jun 2019