Learning the Target Network in Function Space

Learning the Target Network in Function Space

3 June 2024

Papers citing "Learning the Target Network in Function Space"

18 / 18 papers shown

Title
TD Convergence: An Optimization Perspective Kavosh Asadi Shoham Sabach Yao Liu Omer Gottesman Rasool Fakoor MU 59 8 0 30 Jun 2023
Faster Deep Reinforcement Learning with Slower Online Network Kavosh Asadi Rasool Fakoor Omer Gottesman Taesup Kim Michael L. Littman Alexander J. Smola OnRL 29 7 0 10 Dec 2021
Towards Instance-Optimal Offline Reinforcement Learning with Pessimism Ming Yin Yu Wang OffRL 138 82 0 17 Oct 2021
On The Effect of Auxiliary Tasks on Representation Dynamics Clare Lyle Mark Rowland Georg Ostrovski Will Dabney 62 70 0 25 Feb 2021
Breaking the Deadly Triad with a Target Network Shangtong Zhang Hengshuai Yao Shimon Whiteson AAML 52 45 0 21 Jan 2021
Regularized Off-Policy TD-Learning Bo Liu Sridhar Mahadevan Ji Liu OffRL 42 65 0 06 Jun 2020
P3O: Policy-on Policy-off Policy Optimization Rasool Fakoor Pratik Chaudhari Alex Smola OffRL 66 54 0 05 May 2019
Target-Based Temporal Difference Learning Donghwan Lee Niao He OOD 63 31 0 24 Apr 2019
A Finite Time Analysis of Temporal Difference Learning With Linear Function Approximation Jalaj Bhandari Daniel Russo Raghav Singal 106 339 0 06 Jun 2018
Natural Gradient Deep Q-learning Ethan Knight Osher Lerner 38 10 0 20 Mar 2018
Addressing Function Approximation Error in Actor-Critic Methods Scott Fujimoto H. V. Hoof David Meger OffRL 175 5,187 0 26 Feb 2018
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor Tuomas Haarnoja Aurick Zhou Pieter Abbeel Sergey Levine 311 8,352 0 04 Jan 2018
Proximal Policy Optimization Algorithms John Schulman Filip Wolski Prafulla Dhariwal Alec Radford Oleg Klimov OffRL 499 19,065 0 20 Jul 2017
Dueling Network Architectures for Deep Reinforcement Learning Ziyun Wang Tom Schaul Matteo Hessel H. V. Hasselt Marc Lanctot Nando de Freitas OffRL 91 3,755 0 20 Nov 2015
Policy Distillation Andrei A. Rusu Sergio Gomez Colmenarejo Çağlar Gülçehre Guillaume Desjardins J. Kirkpatrick Razvan Pascanu Volodymyr Mnih Koray Kavukcuoglu R. Hadsell 86 692 0 19 Nov 2015
Deep Reinforcement Learning with Double Q-learning H. V. Hasselt A. Guez David Silver OffRL 170 7,641 0 22 Sep 2015
Continuous control with deep reinforcement learning Timothy Lillicrap Jonathan J. Hunt Alexander Pritzel N. Heess Tom Erez Yuval Tassa David Silver Daan Wierstra 320 13,248 0 09 Sep 2015
The Arcade Learning Environment: An Evaluation Platform for General Agents Marc G. Bellemare Yavar Naddaf J. Veness Michael Bowling 117 3,006 0 19 Jul 2012