Off-Policy Correction for Deep Deterministic Policy Gradient Algorithms via Batch Prioritized Experience Replay

2 November 2021

Baturay Saglam

Papers citing "Off-Policy Correction for Deep Deterministic Policy Gradient Algorithms via Batch Prioritized Experience Replay"

2 / 2 papers shown

Title
Augmenting Offline RL with Unlabeled Data Zhao Wang Briti Gangopadhyay Jia-Fong Yeh Shingo Takamatsu OffRL 33 0 0 11 Jun 2024
Mitigating Off-Policy Bias in Actor-Critic Methods with One-Step Q-learning: A Novel Correction Approach Baturay Saglam Dogan C. Cicek Furkan B. Mutlu Suleyman Serdar Kozat OffRL OnRL 26 1 0 01 Aug 2022