Efficient Rate Optimal Regret for Adversarial Contextual MDPs Using Online Function Approximation

2 March 2023

Papers citing "Efficient Rate Optimal Regret for Adversarial Contextual MDPs Using Online Function Approximation"

1 / 1 papers shown

Title
Multi-Step Alignment as Markov Games: An Optimistic Online Gradient Descent Approach with Convergence Guarantees Yongtao Wu Luca Viano Yihang Chen Zhenyu Zhu Kimon Antonakopoulos Quanquan Gu V. Cevher 54 0 0 18 Feb 2025