On The Convergence Of Policy Iteration-Based Reinforcement Learning With Monte Carlo Policy Evaluation

23 January 2023

Papers citing "On The Convergence Of Policy Iteration-Based Reinforcement Learning With Monte Carlo Policy Evaluation"

4 / 4 papers shown

Title
Policy Mirror Descent with Lookahead Kimon Protopapas Anas Barakat 29 1 0 21 Mar 2024
A New Policy Iteration Algorithm For Reinforcement Learning in Zero-Sum Markov Games Anna Winnicki R. Srikant 34 1 0 17 Mar 2023
Slowly Changing Adversarial Bandit Algorithms are Efficient for Discounted MDPs Ian A. Kash L. Reyzin Zishun Yu 31 0 0 18 May 2022
Beyond the One Step Greedy Approach in Reinforcement Learning Yonathan Efroni Gal Dalal B. Scherrer Shie Mannor OffRL 56 48 0 10 Feb 2018