Unifying Count-Based Exploration and Intrinsic Motivation

6 June 2016

Papers citing "Unifying Count-Based Exploration and Intrinsic Motivation"

50 / 333 papers shown

Title
Language Agents Mirror Human Causal Reasoning Biases. How Can We Help Them Think Like Scientists? Anthony GX-Chen Dongyan Lin Mandana Samiei Doina Precup Blake A. Richards Rob Fergus Kenneth Marino CML LRM 34 0 0 14 May 2025
Towards Efficient Online Tuning of VLM Agents via Counterfactual Soft Reinforcement Learning Lang Feng Weihao Tan Zhiyi Lyu Longtao Zheng Haiyang Xu Ming Yan Fei Huang Jingyi Wang 29 0 0 01 May 2025
Bridging Deep Reinforcement Learning and Motion Planning for Model-Free Navigation in Cluttered Environments Licheng Luo Mingyu Cai 38 0 0 09 Apr 2025
Look Before Leap: Look-Ahead Planning with Uncertainty in Reinforcement Learning Yongshuai Liu Xin Liu 93 1 0 26 Mar 2025
Adventurer: Exploration with BiGAN for Deep Reinforcement Learning Yongshuai Liu Xin Liu GAN 103 2 0 24 Mar 2025
Causally Aligned Curriculum Learning Mingxuan Li Junzhe Zhang Elias Bareinboim CML 67 3 0 21 Mar 2025
Contextual Similarity Distillation: Ensemble Uncertainties with a Single Model Moritz A. Zanger Pascal R. van der Vaart Wendelin Bohmer M. Spaan UQCV BDL 203 0 0 14 Mar 2025
Bayesian Optimization by Kernel Regression and Density-based Exploration Tansheng Zhu Hongyu Zhou Ke Jin Xusheng Xu Qiufan Yuan Lijie Ji 194 0 0 10 Feb 2025
Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search Maohao Shen Guangtao Zeng Zhenting Qi Zhang-Wei Hong Zhenfang Chen Wei Lu G. Wornell Subhro Das David D. Cox Chuang Gan LLMAG LRM 222 7 0 04 Feb 2025
Boosting MCTS with Free Energy Minimization Mawaba Pascal Dao Adrian Peter 81 0 0 22 Jan 2025
NBDI: A Simple and Effective Termination Condition for Skill Extraction from Task-Agnostic Demonstrations Myunsoo Kim Hayeong Lee Seong-Woong Shim JunHo Seo Byung-Jun Lee LLMAG 39 0 0 22 Jan 2025
EVaDE : Event-Based Variational Thompson Sampling for Model-Based Reinforcement Learning Siddharth Aravindan Dixant Mittal Wee Sun Lee BDL 79 0 0 17 Jan 2025
Autonomous Algorithm for Training Autonomous Vehicles with Minimal Human Intervention Sang-Hyun Lee Daehyeok Kwon Seung-Woo Seo 78 1 0 17 Jan 2025
Dense Dynamics-Aware Reward Synthesis: Integrating Prior Experience with Demonstrations Cevahir Köprülü Po-han Li Tianyu Qiu Ruihan Zhao T. Westenbroek David Fridovich-Keil Sandeep Chinchali Ufuk Topcu OffRL 97 0 0 02 Dec 2024
Grounding Video Models to Actions through Goal Conditioned Exploration Yunhao Luo Yilun Du LM&Ro VGen 90 1 0 11 Nov 2024
Leveraging Skills from Unlabeled Prior Data for Efficient Online Exploration Max Wilcoxson Qiyang Li Kevin Frans Sergey Levine SSL OffRL OnRL 59 0 0 23 Oct 2024
Prioritized Generative Replay Renhao Wang Kevin Frans Pieter Abbeel Sergey Levine Alexei A. Efros OnRL DiffM 116 2 0 23 Oct 2024
Diversity-Aware Reinforcement Learning for de novo Drug Design Hampus Gummesson Svensson C. Tyrchan O. Engkvist M. Chehreghani 29 1 0 14 Oct 2024
DataEnvGym: Data Generation Agents in Teacher Environments with Student Feedback Zaid Khan Elias Stengel-Eskin Jaemin Cho Joey Tianyi Zhou VGen 46 1 0 08 Oct 2024
Provably Efficient Exploration in Inverse Constrained Reinforcement Learning Bo Yue Jian Li Guiliang Liu 31 2 0 24 Sep 2024
Synthesizing Evolving Symbolic Representations for Autonomous Systems Gabriele Sartor A. Oddi R. Rasconi V. Santucci Rosa Meo 23 0 0 18 Sep 2024
Optimizing TD3 for 7-DOF Robotic Arm Grasping: Overcoming Suboptimality with Exploration-Enhanced Contrastive Learning Wen-Han Hsieh Jen-Yuan Chang 23 0 0 26 Aug 2024
Highly Efficient Self-Adaptive Reward Shaping for Reinforcement Learning Haozhe Ma Zhengding Luo Thanh Vinh Vo Kuankuan Sima Tze-Yun Leong 44 6 0 06 Aug 2024
Random Latent Exploration for Deep Reinforcement Learning Srinath Mahankali Zhang-Wei Hong Ayush Sekhari Alexander Rakhlin Pulkit Agrawal 33 3 0 18 Jul 2024
Safety through feedback in Constrained RL Shashank Reddy Chirra Pradeep Varakantham P. Paruchuri OffRL 51 1 0 28 Jun 2024
Exploration by Learning Diverse Skills through Successor State Measures Paul-Antoine Le Tolguenec Yann Besse Florent Teichteil-Königsbuch Dennis G. Wilson Emmanuel Rachelson 40 0 0 14 Jun 2024
Open-Endedness is Essential for Artificial Superhuman Intelligence Edward Hughes Michael Dennis Jack Parker-Holder Feryal M. P. Behbahani Aditi Mavalankar Yuge Shi Tom Schaul Tim Rocktaschel LRM 45 22 0 06 Jun 2024
LAGMA: LAtent Goal-guided Multi-Agent Reinforcement Learning Hyungho Na IL-Chul Moon 43 1 0 30 May 2024
RLeXplore: Accelerating Research in Intrinsically-Motivated Reinforcement Learning Mingqi Yuan Roger Creus Castanyer Bo Li Xin Jin Glen Berseth Wenjun Zeng 40 0 0 29 May 2024
Visual Episodic Memory-based Exploration J. Vice Natalie Ruiz-Sanchez P. Douglas G. Sukthankar 31 0 0 18 May 2024
Enhancing Q-Learning with Large Language Model Heuristics Xiefeng Wu LRM 32 0 0 06 May 2024
Goal Exploration via Adaptive Skill Distribution for Goal-Conditioned Reinforcement Learning Lisheng Wu Ke Chen 29 0 0 19 Apr 2024
Active Exploration in Bayesian Model-based Reinforcement Learning for Robot Manipulation Carlos Plou Ana C. Murillo Ruben Martinez-Cantin OffRL 40 0 0 02 Apr 2024
ACE : Off-Policy Actor-Critic with Causality-Aware Entropy Regularization Tianying Ji Yongyuan Liang Yan Zeng Yu-Juan Luo Guowei Xu Jiawei Guo Ruijie Zheng Furong Huang Gang Hua Huazhe Xu CML 50 11 0 22 Feb 2024
Enhancing Reinforcement Learning Agents with Local Guides Paul Daoudi Bogdan Robu Christophe Prieur Ludovic Dos Santos M. Barlier OnRL 31 3 0 21 Feb 2024
Joint Intrinsic Motivation for Coordinated Exploration in Multi-Agent Deep Reinforcement Learning Maxime Toquebiau Nicolas Bredeche F. Benamar Jae-Yun Jun 36 1 0 06 Feb 2024
Q-Star Meets Scalable Posterior Sampling: Bridging Theory and Practice via HyperAgent Yingru Li Jiawei Xu Lei Han Zhi-Quan Luo BDL OffRL 26 5 0 05 Feb 2024
Settling Decentralized Multi-Agent Coordinated Exploration by Novelty Sharing Haobin Jiang Ziluo Ding Zongqing Lu 24 2 0 03 Feb 2024
Behind the Myth of Exploration in Policy Gradients Adrien Bolland Gaspard Lambrechts Damien Ernst 56 0 0 31 Jan 2024
Enhancing End-to-End Multi-Task Dialogue Systems: A Study on Intrinsic Motivation Reinforcement Learning Algorithms for Improved Training and Adaptability Navin Kamuni Hardik Shah Sathishkumar Chintala Naveen Kunchakuri Sujatha Alla Old Dominion 37 19 0 31 Jan 2024
UOEP: User-Oriented Exploration Policy for Enhancing Long-Term User Experiences in Recommender Systems Changshuo Zhang Sirui Chen Xiao Zhang Sunhao Dai Weijie Yu Jun Xu OffRL 35 1 0 17 Jan 2024
Using Curiosity for an Even Representation of Tasks in Continual Offline Reinforcement Learning Pathmanathan Pankayaraj Natalia Díaz Rodríguez Javier Del Ser CLL OffRL 38 0 0 05 Dec 2023
AdaptiveFL: Adaptive Heterogeneous Federated Learning for Resource-Constrained AIoT Systems Chentao Jia Ming Hu Zekai Chen Yanxin Yang Xiaofei Xie Yang Liu Mingsong Chen 37 7 0 22 Nov 2023
From "Thumbs Up" to "10 out of 10": Reconsidering Scalar Feedback in Interactive Reinforcement Learning Hang Yu Reuben M. Aronson Katherine H. Allen E. Short 42 3 0 17 Nov 2023
Augmenting Unsupervised Reinforcement Learning with Self-Reference Andrew Zhao Erle Zhu Rui Lu Matthieu Lin Yong-Jin Liu Gao Huang SSL 34 1 0 16 Nov 2023
Variational Curriculum Reinforcement Learning for Unsupervised Discovery of Skills Seongun Kim Kyowoon Lee Jaesik Choi SSL DRL 41 7 0 30 Oct 2023
Neuro-Inspired Fragmentation and Recall to Overcome Catastrophic Forgetting in Curiosity Jaedong Hwang Zhang-Wei Hong Eric Chen Akhilan Boopathy Pulkit Agrawal Ila Fiete CLL 46 5 0 26 Oct 2023
Iteratively Learn Diverse Strategies with State Distance Information Wei Fu Weihua Du Jingwei Li Sunli Chen Jingzhao Zhang Yi Wu 51 3 0 23 Oct 2023
METRA: Scalable Unsupervised RL with Metric-Aware Abstraction Seohong Park Oleh Rybkin Sergey Levine OffRL 33 34 0 13 Oct 2023
Offline Retraining for Online RL: Decoupled Policy Learning to Mitigate Exploration Bias Max Sobol Mark Archit Sharma Fahim Tajwar Rafael Rafailov Sergey Levine Chelsea Finn OffRL OnRL 34 1 0 12 Oct 2023