Rank the Episodes: A Simple Approach for Exploration in Procedurally-Generated Environments

20 January 2021

Daochen Zha

Papers citing "Rank the Episodes: A Simple Approach for Exploration in Procedurally-Generated Environments"

48 / 48 papers shown

Title
FinRL: A Deep Reinforcement Learning Library for Automated Stock Trading in Quantitative Finance Xiao-Yang Liu Hongyang Yang Qian Chen Runjia Zhang Liuqing Yang Bowen Xiao Chris Wang AIFin OffRL 54 122 0 19 Nov 2020
Revisiting Fundamentals of Experience Replay W. Fedus Prajit Ramachandran Rishabh Agarwal Yoshua Bengio Hugo Larochelle Mark Rowland Will Dabney KELM OffRL 61 241 0 13 Jul 2020
The NetHack Learning Environment Heinrich Küttler Nantas Nardelli Alexander H. Miller Roberta Raileanu Marco Selvatici Edward Grefenstette Tim Rocktaschel 61 181 0 24 Jun 2020
Learning with AMIGo: Adversarially Motivated Intrinsic Goals Andres Campero Roberta Raileanu Heinrich Küttler J. Tenenbaum Tim Rocktaschel Edward Grefenstette 76 127 0 22 Jun 2020
RIDE: Rewarding Impact-Driven Exploration for Procedurally-Generated Environments Roberta Raileanu Tim Rocktaschel 62 173 0 27 Feb 2020
Never Give Up: Learning Directed Exploration Strategies Adria Puigdomenech Badia Pablo Sprechmann Alex Vitvitskyi Daniel Guo Bilal Piot ... O. Tieleman Martín Arjovsky Alexander Pritzel Andew Bolt Charles Blundell 70 298 0 14 Feb 2020
Training Agents using Upside-Down Reinforcement Learning R. Srivastava Pranav Shyam Filipe Wall Mutz Wojciech Ja'skowski Jürgen Schmidhuber OffRL 59 126 0 05 Dec 2019
Leveraging Procedural Generation to Benchmark Reinforcement Learning K. Cobbe Christopher Hesse Jacob Hilton John Schulman 72 555 0 03 Dec 2019
RLCard: A Toolkit for Reinforcement Learning in Card Games Daochen Zha Kwei-Herng Lai Yuanpu Cao Songyi Huang Ruzhe Wei Junyu Guo Xia Hu OffRL 48 58 0 10 Oct 2019
Memory Based Trajectory-conditioned Policies for Learning from Sparse Rewards Yijie Guo Jongwook Choi Marcin Moczulski Shengyu Feng Samy Bengio Mohammad Norouzi Honglak Lee 44 10 0 24 Jul 2019
Experience Replay Optimization Daochen Zha Kwei-Herng Lai Kaixiong Zhou Xia Hu OffRL 44 103 0 19 Jun 2019
Generative Adversarial Self-Imitation Learning Yijie Guo Junhyuk Oh Satinder Singh Honglak Lee GAN 62 58 0 03 Dec 2018
Contingency-Aware Exploration in Reinforcement Learning Jongwook Choi Yijie Guo Marcin Moczulski Junhyuk Oh Neal Wu Mohammad Norouzi Honglak Lee 54 73 0 05 Nov 2018
Exploration by Random Network Distillation Yuri Burda Harrison Edwards Amos Storkey Oleg Klimov 153 1,329 0 30 Oct 2018
Episodic Curiosity through Reachability Nikolay Savinov Anton Raichuk Raphaël Marinier Damien Vincent Marc Pollefeys Timothy Lillicrap Sylvain Gelly 54 269 0 04 Oct 2018
Large-Scale Study of Curiosity-Driven Learning Yuri Burda Harrison Edwards Deepak Pathak Amos Storkey Trevor Darrell Alexei A. Efros LRM 69 702 0 13 Aug 2018
Count-Based Exploration with the Successor Representation Marlos C. Machado Marc G. Bellemare Michael Bowling 46 186 0 31 Jul 2018
Remember and Forget for Experience Replay G. Novati Petros Koumoutsakos OffRL 61 90 0 16 Jul 2018
TextWorld: A Learning Environment for Text-based Games Marc-Alexandre Côté Ákos Kádár Xingdi Yuan Ben A. Kybartas Tavian Barnes ... Matthew J. Hausknecht Layla El Asri Mahmoud Adada Wendy Tay Adam Trischler LLMAG 42 369 0 29 Jun 2018
A Dissection of Overfitting and Generalization in Continuous Reinforcement Learning Amy Zhang Nicolas Ballas Joelle Pineau CLL OffRL 83 179 0 20 Jun 2018
Self-Imitation Learning Junhyuk Oh Yijie Guo Satinder Singh Honglak Lee SSL 54 249 0 14 Jun 2018
Learning Self-Imitating Diverse Policies Tanmay Gangwani Qiang Liu Jian Peng 56 67 0 25 May 2018
A Study on Overfitting in Deep Reinforcement Learning Chiyuan Zhang Oriol Vinyals Rémi Munos Samy Bengio OffRL OnRL 53 388 0 18 Apr 2018
On Learning Intrinsic Rewards for Policy Gradient Methods Zeyu Zheng Junhyuk Oh Satinder Singh 57 205 0 17 Apr 2018
Gotta Learn Fast: A New Benchmark for Generalization in RL Alex Nichol Vicki Pfau Christopher Hesse Oleg Klimov John Schulman VLM OffRL 55 177 0 10 Apr 2018
Learning to Explore with Meta-Policy Gradient Tianbing Xu Qiang Liu Liang Zhao Jian Peng 50 54 0 13 Mar 2018
Learning by Playing - Solving Sparse Reward Tasks from Scratch Martin Riedmiller Roland Hafner Thomas Lampe Michael Neunert Jonas Degrave T. Wiele Volodymyr Mnih N. Heess Jost Tobias Springenberg 85 448 0 28 Feb 2018
A Deeper Look at Experience Replay Shangtong Zhang R. Sutton OffRL VLM 66 275 0 04 Dec 2017
Rainbow: Combining Improvements in Deep Reinforcement Learning Matteo Hessel Joseph Modayil H. V. Hasselt Tom Schaul Georg Ostrovski Will Dabney Dan Horgan Bilal Piot M. G. Azar David Silver OffRL 107 2,263 0 06 Oct 2017
Deep Reinforcement Learning that Matters Peter Henderson Riashat Islam Philip Bachman Joelle Pineau Doina Precup David Meger OffRL 116 1,950 0 19 Sep 2017
Proximal Policy Optimization Algorithms John Schulman Filip Wolski Prafulla Dhariwal Alec Radford Oleg Klimov OffRL 463 19,006 0 20 Jul 2017
Hindsight Experience Replay Marcin Andrychowicz Dwight Crow Alex Ray Jonas Schneider Rachel Fong Peter Welinder Bob McGrew Joshua Tobin Pieter Abbeel Wojciech Zaremba OffRL 245 2,326 0 05 Jul 2017
Count-Based Exploration in Feature Space for Reinforcement Learning Jarryd Martin S. N. Sasikumar Tom Everitt Marcus Hutter 51 124 0 25 Jun 2017
Curiosity-driven Exploration by Self-supervised Prediction Deepak Pathak Pulkit Agrawal Alexei A. Efros Trevor Darrell LRM SSL 106 2,436 0 15 May 2017
Deep Exploration via Randomized Value Functions Ian Osband Benjamin Van Roy Daniel Russo Zheng Wen 89 306 0 22 Mar 2017
Intrinsic Motivation and Automatic Curricula via Asymmetric Self-Play Sainbayar Sukhbaatar Zeming Lin Ilya Kostrikov Gabriel Synnaeve Arthur Szlam Rob Fergus SSL 62 337 0 15 Mar 2017
Towards Generalization and Simplicity in Continuous Control Aravind Rajeswaran Kendall Lowrey E. Todorov Sham Kakade OffRL 86 276 0 08 Mar 2017
Neural Episodic Control Alexander Pritzel Benigno Uria Sriram Srinivasan A. Badia Oriol Vinyals Demis Hassabis Daan Wierstra Charles Blundell OffRL BDL 99 346 0 06 Mar 2017
Count-Based Exploration with Neural Density Models Georg Ostrovski Marc G. Bellemare Aaron van den Oord Rémi Munos 84 620 0 03 Mar 2017
#Exploration: A Study of Count-Based Exploration for Deep Reinforcement Learning Haoran Tang Rein Houthooft Davis Foote Adam Stooke Xi Chen Yan Duan John Schulman F. Turck Pieter Abbeel OffRL 89 771 0 15 Nov 2016
Model-Free Episodic Control Charles Blundell Benigno Uria Alexander Pritzel Yazhe Li Avraham Ruderman Joel Z Leibo Jack W. Rae Daan Wierstra Demis Hassabis OffRL BDL 55 250 0 14 Jun 2016
Generative Adversarial Imitation Learning Jonathan Ho Stefano Ermon GAN 131 3,105 0 10 Jun 2016
Unifying Count-Based Exploration and Intrinsic Motivation Marc G. Bellemare S. Srinivasan Georg Ostrovski Tom Schaul D. Saxton Rémi Munos 167 1,477 0 06 Jun 2016
Deep Learning for Reward Design to Improve Monte Carlo Tree Search in ATARI Games Xiaoxiao Guo Satinder Singh Richard L. Lewis Honglak Lee 47 55 0 24 Apr 2016
Benchmarking Deep Reinforcement Learning for Continuous Control Yan Duan Xi Chen Rein Houthooft John Schulman Pieter Abbeel OffRL 79 1,693 0 22 Apr 2016
Asynchronous Methods for Deep Reinforcement Learning Volodymyr Mnih Adria Puigdomenech Badia M. Berk Mirza Alex Graves Timothy Lillicrap Tim Harley David Silver Koray Kavukcuoglu 191 8,850 0 04 Feb 2016
Continuous control with deep reinforcement learning Timothy Lillicrap Jonathan J. Hunt Alexander Pritzel N. Heess Tom Erez Yuval Tassa David Silver Daan Wierstra 318 13,234 0 09 Sep 2015
Incentivizing Exploration In Reinforcement Learning With Deep Predictive Models Bradly C. Stadie Sergey Levine Pieter Abbeel 89 505 0 03 Jul 2015