Complete Policy Regret Bounds for Tallying Bandits

24 April 2022

Aarti Singh

Papers citing "Complete Policy Regret Bounds for Tallying Bandits"

2 / 2 papers shown

Title
Learning in Markov Games with Adaptive Adversaries: Policy Regret, Fundamental Barriers, and Efficient Algorithms Thanh Nguyen-Tang Raman Arora 74 1 0 01 Nov 2024
Weighted Tallying Bandits: Overcoming Intractability via Repeated Exposure Optimality Dhruv Malik Conor Igoe Yuanzhi Li Aarti Singh OffRL 16 1 0 04 May 2023