Reactive Exploration to Cope with Non-Stationarity in Lifelong
Reinforcement Learning

v1v2 (latest)

Reactive Exploration to Cope with Non-Stationarity in Lifelong Reinforcement Learning

12 July 2022

Fabian Paischer

Marius-Constantin Dinu

Angela Bitto-Nemling

Hamid Eghbalzadeh

Sepp Hochreiter

ArXiv (abs)PDF HTML Github (14★)

Papers citing "Reactive Exploration to Cope with Non-Stationarity in Lifelong Reinforcement Learning"

12 / 62 papers shown

Title
Overcoming catastrophic forgetting in neural networks J. Kirkpatrick Razvan Pascanu Neil C. Rabinowitz J. Veness Guillaume Desjardins ... A. Grabska-Barwinska Demis Hassabis Claudia Clopath D. Kumaran R. Hadsell CLL 374 7,572 0 02 Dec 2016
#Exploration: A Study of Count-Based Exploration for Deep Reinforcement Learning Haoran Tang Rein Houthooft Davis Foote Adam Stooke Xi Chen Yan Duan John Schulman F. Turck Pieter Abbeel OffRL 111 775 0 15 Nov 2016
Learning without Forgetting Zhizhong Li Derek Hoiem CLL OOD SSL 308 4,432 0 29 Jun 2016
Progressive Neural Networks Andrei A. Rusu Neil C. Rabinowitz Guillaume Desjardins Hubert Soyer J. Kirkpatrick Koray Kavukcuoglu Razvan Pascanu R. Hadsell CLL AI4CE 83 2,465 0 15 Jun 2016
Unifying Count-Based Exploration and Intrinsic Motivation Marc G. Bellemare S. Srinivasan Georg Ostrovski Tom Schaul D. Saxton Rémi Munos 179 1,484 0 06 Jun 2016
OpenAI Gym Greg Brockman Vicki Cheung Ludwig Pettersson Jonas Schneider John Schulman Jie Tang Wojciech Zaremba OffRL ODL 225 5,087 0 05 Jun 2016
Prioritized Experience Replay Tom Schaul John Quan Ioannis Antonoglou David Silver OffRL 231 3,796 0 18 Nov 2015
Incentivizing Exploration In Reinforcement Learning With Deep Predictive Models Bradly C. Stadie Sergey Levine Pieter Abbeel 95 505 0 03 Jul 2015
Optimal Exploration-Exploitation in a Multi-Armed-Bandit Problem with Non-stationary Rewards Omar Besbes Y. Gur A. Zeevi 68 127 0 13 May 2014
Playing Atari with Deep Reinforcement Learning Volodymyr Mnih Koray Kavukcuoglu David Silver Alex Graves Ioannis Antonoglou Daan Wierstra Martin Riedmiller 129 12,269 0 19 Dec 2013
On Upper-Confidence Bound Policies for Non-Stationary Bandit Problems Aurélien Garivier Eric Moulines 97 294 0 22 May 2008
Bayesian Online Changepoint Detection Ryan P. Adams D. MacKay 263 771 0 19 Oct 2007