Flipping Coins to Estimate Pseudocounts for Exploration in Reinforcement Learning

5 June 2023

Papers citing "Flipping Coins to Estimate Pseudocounts for Exploration in Reinforcement Learning"

14 / 14 papers shown

Title
Exploration by Random Distribution Distillation Zhirui Fang Kai Yang Jian Tao Jiafei Lyu Lusong Li Li Shen Xiu Li 12 0 0 16 May 2025
Episodic Novelty Through Temporal Distance Y. Jiang Qihan Liu Yiqin Yang Xiaoteng Ma Dianyu Zhong ... Jun Yang Bin Liang Bo Xu Chongjie Zhang Qianchuan Zhao OffRL 45 0 0 28 Jan 2025
$\beta$ -DQN: Improving Deep Q-Learning By Evolving the Behavior Hongming Zhang Fengshuo Bai Chenjun Xiao Chao Gao Bo Xu Martin Müller OffRL 43 2 0 03 Jan 2025
Leveraging Skills from Unlabeled Prior Data for Efficient Online Exploration Max Wilcoxson Qiyang Li Kevin Frans Sergey Levine SSL OffRL OnRL 59 0 0 23 Oct 2024
ETGL-DDPG: A Deep Deterministic Policy Gradient Algorithm for Sparse Reward Continuous Control Ehsan Futuhi Shayan Karimi Chao Gao Martin Müller 43 1 0 07 Oct 2024
Highly Efficient Self-Adaptive Reward Shaping for Reinforcement Learning Haozhe Ma Zhengding Luo Thanh Vinh Vo Kuankuan Sima Tze-Yun Leong 46 6 0 06 Aug 2024
An Optimal Tightness Bound for the Simulation Lemma Sam Lobel Ronald E. Parr 30 2 0 24 Jun 2024
Beyond Optimism: Exploration With Partially Observable Rewards Simone Parisi Alireza Kazemipour Michael Bowling OffRL 32 1 0 20 Jun 2024
RLeXplore: Accelerating Research in Intrinsically-Motivated Reinforcement Learning Mingqi Yuan Roger Creus Castanyer Bo Li Xin Jin Glen Berseth Wenjun Zeng 40 0 0 29 May 2024
Surprise-Adaptive Intrinsic Motivation for Unsupervised Reinforcement Learning Adriana Hugessen Roger Creus Castanyer Faisal Mohamed Glen Berseth 44 0 0 27 May 2024
Exploration and Anti-Exploration with Distributional Random Network Distillation Kai Yang Jian Tao Jiafei Lyu Xiu Li 40 15 0 18 Jan 2024
Improving Intrinsic Exploration by Creating Stationary Objectives Roger Creus Castanyer Javier Civera Taihú Pire OffRL 37 3 0 27 Oct 2023
Hierarchical Empowerment: Towards Tractable Empowerment-Based Skill Learning Andrew Levy Sreehari Rammohan A. Allievi S. Niekum George Konidaris 36 5 0 06 Jul 2023
Human-level Atari 200x faster Steven Kapturowski Victor Campos Ray Jiang Nemanja Rakićević Hado van Hasselt Charles Blundell Adria Puigdomenech Badia OffRL 52 28 0 15 Sep 2022