Problem Dependent Reinforcement Learning Bounds Which Can Identify Bandit Structure in MDPs

3 November 2019

Papers citing "Problem Dependent Reinforcement Learning Bounds Which Can Identify Bandit Structure in MDPs"

1 / 1 papers shown

Title
Unifying PAC and Regret: Uniform PAC Bounds for Episodic Reinforcement Learning Christoph Dann Tor Lattimore Emma Brunskill 60 307 0 22 Mar 2017