Regret Analysis of Average-Reward Unichain MDPs via an Actor-Critic Approach

26 May 2025

Papers citing "Regret Analysis of Average-Reward Unichain MDPs via an Actor-Critic Approach"

1 / 1 papers shown

Title
Optimistic Q-learning for average reward and episodic reinforcement learning Priyank Agrawal Shipra Agrawal 121 6 0 18 Jul 2024