Breaking the Sample Complexity Barrier to Regret-Optimal Model-Free Reinforcement Learning

9 October 2021

Papers citing "Breaking the Sample Complexity Barrier to Regret-Optimal Model-Free Reinforcement Learning"

41 / 41 papers shown

Title
Minimax Optimal Reinforcement Learning with Quasi-Optimism Harin Lee Min-hwan Oh OffRL 61 0 0 02 Mar 2025
Data-Efficient Multi-Agent Spatial Planning with LLMs Huangyuan Su Aaron Walsman Daniel Garces Sham Kakade Stephanie Gil LLMAG Presented at ResearchTrend Connect \| LLMAG on 28 Mar 2025 141 0 0 26 Feb 2025
Increasing Information for Model Predictive Control with Semi-Markov Decision Processes Rémy Hosseinkhan Boucher Onofrio Semeraro L. Mathelin 48 0 0 28 Jan 2025
Federated UCBVI: Communication-Efficient Federated Regret Minimization with Heterogeneous Agents Safwan Labbi D. Tiapkin Lorenzo Mancini Paul Mangold Eric Moulines FedML 73 0 0 30 Oct 2024
Learning State Conditioned Linear Mappings for Low-Dimensional Control of Robotic Manipulators Michael Przystupa Kerrick Johnstonbaugh Zichen Zhang Laura Petrich Masood Dehghan Faezeh Haghverd Martin Jägersand 26 2 0 28 Oct 2024
Gap-Dependent Bounds for Q-Learning using Reference-Advantage Decomposition Zhong Zheng Haochen Zhang Lingzhou Xue OffRL 70 2 0 10 Oct 2024
State-free Reinforcement Learning Mingyu Chen Aldo Pacchiano Xuezhou Zhang 61 0 0 27 Sep 2024
Optimistic Q-learning for average reward and episodic reinforcement learning Priyank Agrawal Shipra Agrawal 48 3 0 18 Jul 2024
Combinatorial Multivariant Multi-Armed Bandits with Applications to Episodic Reinforcement Learning and Beyond Xutong Liu Siwei Wang Jinhang Zuo Han Zhong Xuchuang Wang Zhiyong Wang Shuai Li Mohammad Hajiesmaili J. C. Lui Wei Chen 85 1 0 03 Jun 2024
Finding good policies in average-reward Markov Decision Processes without prior knowledge Adrienne Tuynman Rémy Degenne Emilie Kaufmann 31 2 0 27 May 2024
Horizon-Free Regret for Linear Markov Decision Processes Zihan Zhang Jason D. Lee Yuxin Chen Simon S. Du 33 3 0 15 Mar 2024
Sample Efficient Reinforcement Learning with Partial Dynamics Knowledge Meshal Alharbi Mardavij Roozbehani M. Dahleh 24 0 0 19 Dec 2023
Probabilistic Inference in Reinforcement Learning Done Right Jean Tarbouriech Tor Lattimore Brendan O'Donoghue BDL OffRL 28 4 0 22 Nov 2023
Minimax Optimal Q Learning with Nearest Neighbors Puning Zhao Lifeng Lai OffRL 49 10 0 03 Aug 2023
Settling the Sample Complexity of Online Reinforcement Learning Zihan Zhang Yuxin Chen Jason D. Lee S. Du OffRL 95 21 0 25 Jul 2023
Provably Efficient UCB-type Algorithms For Learning Predictive State Representations Ruiquan Huang Yitao Liang J. Yang OffRL 24 5 0 01 Jul 2023
Sharper Model-free Reinforcement Learning for Average-reward Markov Decision Processes Zihan Zhang Qiaomin Xie OffRL 26 16 0 28 Jun 2023
The Curious Price of Distributional Robustness in Reinforcement Learning with a Generative Model Laixi Shi Gen Li Yuting Wei Yuxin Chen M. Geist Yuejie Chi OOD 30 30 0 26 May 2023
Regret-Optimal Model-Free Reinforcement Learning for Discounted MDPs with Short Burn-In Time Xiang Ji Gen Li OffRL 32 7 0 24 May 2023
The Blessing of Heterogeneity in Federated Q-Learning: Linear Speedup and Beyond Jiin Woo Gauri Joshi Yuejie Chi FedML 27 19 0 18 May 2023
Reward-agnostic Fine-tuning: Provable Statistical Benefits of Hybrid Reinforcement Learning Gen Li Wenhao Zhan Jason D. Lee Yuejie Chi Yuxin Chen OffRL OnRL 73 12 0 17 May 2023
Minimax-Optimal Reward-Agnostic Exploration in Reinforcement Learning Gen Li Yuling Yan Yuxin Chen Jianqing Fan OffRL 73 12 0 14 Apr 2023
Sharp Variance-Dependent Bounds in Reinforcement Learning: Best of Both Worlds in Stochastic and Deterministic Environments Runlong Zhou Zihan Zhang S. Du 44 10 0 31 Jan 2023
Off-Policy Deep Reinforcement Learning Algorithms for Handling Various Robotic Manipulator Tasks Altun Rzayev Vahid Tavakol Aghaei OffRL 19 0 0 11 Dec 2022
Curriculum Reinforcement Learning using Optimal Transport via Gradual Domain Adaptation Peide Huang Mengdi Xu Jiacheng Zhu Laixi Shi Fei Fang Ding Zhao CLL 41 24 0 18 Oct 2022
Unpacking Reward Shaping: Understanding the Benefits of Reward Engineering on Sample Complexity Abhishek Gupta Aldo Pacchiano Yuexiang Zhai Sham Kakade Sergey Levine OffRL 33 66 0 18 Oct 2022
Multi-armed Bandit Learning on a Graph Tianpeng Zhang Kasper Johansson Na Li 17 6 0 20 Sep 2022
Minimax-Optimal Multi-Agent RL in Markov Games With a Generative Model Gen Li Yuejie Chi Yuting Wei Yuxin Chen 32 18 0 22 Aug 2022
Slowly Changing Adversarial Bandit Algorithms are Efficient for Discounted MDPs Ian A. Kash L. Reyzin Zishun Yu 31 0 0 18 May 2022
Horizon-Free Reinforcement Learning in Polynomial Time: the Power of Stationary Policies Zihan Zhang Xiangyang Ji S. Du 28 21 0 24 Mar 2022
The Efficacy of Pessimism in Asynchronous Q-Learning Yuling Yan Gen Li Yuxin Chen Jianqing Fan OffRL 75 40 0 14 Mar 2022
Target Network and Truncation Overcome The Deadly Triad in $Q$ -Learning Zaiwei Chen John-Paul Clarke S. T. Maguluri 18 19 0 05 Mar 2022
Pessimistic Q-Learning for Offline Reinforcement Learning: Towards Optimal Sample Complexity Laixi Shi Gen Li Yuting Wei Yuxin Chen Yuejie Chi OffRL 26 90 0 28 Feb 2022
When is Offline Two-Player Zero-Sum Markov Game Solvable? Qiwen Cui S. Du OffRL 30 29 0 10 Jan 2022
Online Sub-Sampling for Reinforcement Learning with General Function Approximation Dingwen Kong Ruslan Salakhutdinov Ruosong Wang Lin F. Yang OffRL 38 1 0 14 Jun 2021
Sample-Efficient Reinforcement Learning Is Feasible for Linearly Realizable MDPs with Limited Revisiting Gen Li Yuxin Chen Yuejie Chi Yuantao Gu Yuting Wei OffRL 24 28 0 17 May 2021
UCB Momentum Q-learning: Correcting the bias without forgetting Pierre Menard O. D. Domingues Xuedong Shang Michal Valko 79 40 0 01 Mar 2021
Near-Optimal Randomized Exploration for Tabular Markov Decision Processes Zhihan Xiong Ruoqi Shen Qiwen Cui Maryam Fazel S. Du 19 7 0 19 Feb 2021
Is Q-Learning Minimax Optimal? A Tight Sample Complexity Analysis Gen Li Changxiao Cai Ee Yuting Wei Yuejie Chi OffRL 37 75 0 12 Feb 2021
Provably Efficient Reinforcement Learning with Linear Function Approximation Under Adaptivity Constraints Chi Jin Zhuoran Yang Zhaoran Wang OffRL 122 166 0 06 Jan 2021
Breaking the Sample Size Barrier in Model-Based Reinforcement Learning with a Generative Model Gen Li Yuting Wei Yuejie Chi Yuxin Chen 28 124 0 26 May 2020