Reward-Free Exploration for Reinforcement Learning

7 February 2020

Max Simchowitz

Papers citing "Reward-Free Exploration for Reinforcement Learning"

47 / 47 papers shown

Title
DIAL: Distribution-Informed Adaptive Learning of Multi-Task Constraints for Safety-Critical Systems Se-Wook Yoo Seung-Woo Seo 48 0 0 30 Jan 2025
Gap-Dependent Bounds for Q-Learning using Reference-Advantage Decomposition Zhong Zheng Haochen Zhang Lingzhou Xue OffRL 70 2 0 10 Oct 2024
Problem Solving Through Human-AI Preference-Based Cooperation Subhabrata Dutta Timo Kaufmann Goran Glavas Ivan Habernal Kristian Kersting Frauke Kreuter Mira Mezini Iryna Gurevych Eyke Hüllermeier Hinrich Schuetze 92 1 0 14 Aug 2024
What Are the Odds? Improving the foundations of Statistical Model Checking Tobias Meggendorfer Maximilian Weininger Patrick Wienhoft 32 4 0 08 Apr 2024
Multiple-policy Evaluation via Density Estimation Yilei Chen Aldo Pacchiano I. Paschalidis OffRL 24 0 0 29 Mar 2024
Offline Retraining for Online RL: Decoupled Policy Learning to Mitigate Exploration Bias Max Sobol Mark Archit Sharma Fahim Tajwar Rafael Rafailov Sergey Levine Chelsea Finn OffRL OnRL 26 1 0 12 Oct 2023
When is Agnostic Reinforcement Learning Statistically Tractable? Zeyu Jia Gene Li Alexander Rakhlin Ayush Sekhari Nathan Srebro OffRL 27 5 0 09 Oct 2023
Zero-Shot Reinforcement Learning from Low Quality Data Scott Jeen Tom Bewley Jonathan M. Cullen OffRL OnRL 34 0 0 26 Sep 2023
FoX: Formation-aware exploration in multi-agent reinforcement learning Yonghyeon Jo Sunwoo Lee Junghyuk Yum Seungyul Han 27 5 0 22 Aug 2023
Settling the Sample Complexity of Online Reinforcement Learning Zihan Zhang Yuxin Chen Jason D. Lee S. Du OffRL 92 21 0 25 Jul 2023
Policy Finetuning in Reinforcement Learning via Design of Experiments using Offline Data Ruiqi Zhang Andrea Zanette OffRL OnRL 40 5 0 10 Jul 2023
Towards Theoretical Understanding of Inverse Reinforcement Learning Alberto Maria Metelli Filippo Lazzati Marcello Restelli 21 13 0 25 Apr 2023
Aiding reinforcement learning for set point control Ruoqing Zhang Per Mattsson T. Wigren 11 3 0 20 Apr 2023
Improved Sample Complexity for Reward-free Reinforcement Learning under Low-rank MDPs Yuan-Chia Cheng Ruiquan Huang J. Yang Yitao Liang OffRL 37 8 0 20 Mar 2023
A New Policy Iteration Algorithm For Reinforcement Learning in Zero-Sum Markov Games Anna Winnicki R. Srikant 29 1 0 17 Mar 2023
Fast Rates for Maximum Entropy Exploration D. Tiapkin Denis Belomestny Daniele Calandriello Eric Moulines Rémi Munos A. Naumov Pierre Perrault Yunhao Tang Michal Valko Pierre Menard 36 17 0 14 Mar 2023
Layered State Discovery for Incremental Autonomous Exploration Liyu Chen Andrea Tirinzoni A. Lazaric Matteo Pirotta 26 0 0 07 Feb 2023
A general Markov decision process formalism for action-state entropy-regularized reward maximization D. Grytskyy Jorge Ramírez-Ruiz R. Moreno-Bote 22 3 0 02 Feb 2023
Sharp Variance-Dependent Bounds in Reinforcement Learning: Best of Both Worlds in Stochastic and Deterministic Environments Runlong Zhou Zihan Zhang S. Du 39 10 0 31 Jan 2023
SoftTreeMax: Exponential Variance Reduction in Policy Gradient via Tree Search Gal Dalal Assaf Hallak Gugan Thoppe Shie Mannor Gal Chechik 24 3 0 30 Jan 2023
Learning General World Models in a Handful of Reward-Free Deployments Yingchen Xu Jack Parker-Holder Aldo Pacchiano Philip J. Ball Oleh Rybkin Stephen J. Roberts Tim Rocktaschel Edward Grefenstette OffRL 53 8 0 23 Oct 2022
Task-Agnostic Learning to Accomplish New Tasks Xianqi Zhang Xingtao Wang Xu Liu Wenrui Wang Xiaopeng Fan Debin Zhao OffRL 85 0 0 09 Sep 2022
On the Statistical Efficiency of Reward-Free Exploration in Non-Linear RL Jinglin Chen Aditya Modi A. Krishnamurthy Nan Jiang Alekh Agarwal 30 25 0 21 Jun 2022
BYOL-Explore: Exploration by Bootstrapped Prediction Z. Guo S. Thakoor Miruna Pislar Bernardo Avila-Pires Florent Altché ... Yunhao Tang Michal Valko Rémi Munos M. G. Azar Bilal Piot 22 67 0 16 Jun 2022
Offline Reinforcement Learning with Differential Privacy Dan Qiao Yu-Xiang Wang OffRL 36 23 0 02 Jun 2022
Provable Benefits of Representational Transfer in Reinforcement Learning Alekh Agarwal Yuda Song Wen Sun Kaiwen Wang Mengdi Wang Xuezhou Zhang OffRL 21 33 0 29 May 2022
The Complexity of Markov Equilibrium in Stochastic Games C. Daskalakis Noah Golowich K. Zhang 36 57 0 08 Apr 2022
Branching Reinforcement Learning Yihan Du Wei Chen 19 0 0 16 Feb 2022
Sample-Efficient Reinforcement Learning with loglog(T) Switching Cost Dan Qiao Ming Yin Ming Min Yu-Xiang Wang 29 28 0 13 Feb 2022
Can Reinforcement Learning Find Stackelberg-Nash Equilibria in General-Sum Markov Games with Myopic Followers? Han Zhong Zhuoran Yang Zhaoran Wang Michael I. Jordan 24 30 0 27 Dec 2021
Reward-Free Attacks in Multi-Agent Reinforcement Learning Ted Fujimoto T. Doster A. Attarian Jill M. Brandenberger Nathan Oken Hodas AAML 19 4 0 02 Dec 2021
Provable Hierarchy-Based Meta-Reinforcement Learning Kurtland Chua Qi Lei Jason D. Lee 16 5 0 18 Oct 2021
Reinforcement Learning in Reward-Mixing MDPs Jeongyeol Kwon Yonathan Efroni C. Caramanis Shie Mannor 25 15 0 07 Oct 2021
Gap-Dependent Unsupervised Exploration for Reinforcement Learning Jingfeng Wu Vladimir Braverman Lin F. Yang 22 12 0 11 Aug 2021
Optimal Uniform OPE and Model-based Offline Reinforcement Learning in Time-Homogeneous, Reward-Free and Task-Agnostic Settings Ming Yin Yu-Xiang Wang OffRL 24 19 0 13 May 2021
Learning One Representation to Optimize All Rewards Ahmed Touati Yann Ollivier OffRL 21 60 0 14 Mar 2021
Sample-Efficient Learning of Stackelberg Equilibria in General-Sum Games Yu Bai Chi Jin Haiquan Wang Caiming Xiong 36 67 0 23 Feb 2021
Reward Poisoning in Reinforcement Learning: Attacks Against Unknown Learners in Unknown Environments Amin Rakhsha Xuezhou Zhang Xiaojin Zhu Adish Singla AAML OffRL 36 37 0 16 Feb 2021
Geometric Entropic Exploration Z. Guo M. G. Azar Alaa Saade S. Thakoor Bilal Piot Bernardo Avila-Pires Michal Valko Thomas Mesnard Tor Lattimore Rémi Munos 22 30 0 06 Jan 2021
Randomized Value Functions via Posterior State-Abstraction Sampling Dilip Arumugam Benjamin Van Roy OffRL 28 7 0 05 Oct 2020
A Sharp Analysis of Model-based Reinforcement Learning with Self-Play Qinghua Liu Tiancheng Yu Yu Bai Chi Jin 24 121 0 04 Oct 2020
Model-Based Multi-Agent RL in Zero-Sum Markov Games with Near-Optimal Sample Complexity K. Zhang Sham Kakade Tamer Bacsar Lin F. Yang 39 119 0 15 Jul 2020
FLAMBE: Structural Complexity and Representation Learning of Low Rank MDPs Alekh Agarwal Sham Kakade A. Krishnamurthy Wen Sun OffRL 30 221 0 18 Jun 2020
Active Learning for Nonlinear System Identification with Guarantees Horia Mania Michael I. Jordan Benjamin Recht 33 101 0 18 Jun 2020
Adaptive Reward-Free Exploration E. Kaufmann Pierre Ménard O. D. Domingues Anders Jonsson Edouard Leurent Michal Valko 14 79 0 11 Jun 2020
Active Model Estimation in Markov Decision Processes Jean Tarbouriech S. Shekhar Matteo Pirotta Mohammad Ghavamzadeh A. Lazaric 6 24 0 06 Mar 2020
Provable Self-Play Algorithms for Competitive Reinforcement Learning Yu Bai Chi Jin SSL 6 148 0 10 Feb 2020