v1v2 (latest)

Optimism and Delays in Episodic Reinforcement Learning

15 November 2021

Papers citing "Optimism and Delays in Episodic Reinforcement Learning"

3 / 3 papers shown

Title
Near-Optimal Regret in Linear MDPs with Aggregate Bandit Feedback Asaf B. Cassel Haipeng Luo Aviv A. Rosenberg Dmitry Sotnikov OffRL 64 4 0 13 May 2024
Posterior Sampling with Delayed Feedback for Reinforcement Learning with Linear Function Approximation Nikki Lijing Kuang Ming Yin Mengdi Wang Yu Wang Yian Ma 88 6 0 29 Oct 2023
Reinforcement Learning with Delayed, Composite, and Partially Anonymous Reward Washim Uddin Mondal Vaneet Aggarwal 79 2 0 04 May 2023