First return, then explore

27 April 2020

Jeff Clune

Papers citing "First return, then explore"

50 / 71 papers shown

Title
Bridging Deep Reinforcement Learning and Motion Planning for Model-Free Navigation in Cluttered Environments Licheng Luo Mingyu Cai 38 0 0 09 Apr 2025
Adventurer: Exploration with BiGAN for Deep Reinforcement Learning Yongshuai Liu Xin Liu GAN 100 2 0 24 Mar 2025
Swift Hydra: Self-Reinforcing Generative Framework for Anomaly Detection with Multiple Mamba Models Nguyen H K. Do Truc Nguyen Malik Hassanaly Raed Alharbi Jung Taek Seo My T. Thai 54 0 0 09 Mar 2025
Random Latent Exploration for Deep Reinforcement Learning Srinath Mahankali Zhang-Wei Hong Ayush Sekhari Alexander Rakhlin Pulkit Agrawal 33 3 0 18 Jul 2024
Intelligent Go-Explore: Standing on the Shoulders of Giant Foundation Models Cong Lu Shengran Hu Jeff Clune LLMAG 44 10 0 24 May 2024
Dr. Strategy: Model-Based Generalist Agents with Strategic Dreaming Hany Hamed Subin Kim Dongyeong Kim Jaesik Yoon Sungjin Ahn 47 4 0 29 Feb 2024
An Invitation to Deep Reinforcement Learning Bernhard Jaeger Andreas Geiger OffRL OOD 78 5 0 13 Dec 2023
Building Open-Ended Embodied Agent via Language-Policy Bidirectional Adaptation Shaopeng Zhai Jie Wang Tianyi Zhang Fuxian Huang Qi Zhang Ming Zhou Jing Hou Yu Qiao Yu Liu LLMAG LM&Ro 34 1 0 12 Dec 2023
Backward Learning for Goal-Conditioned Policies Marc Höftmann Jan Robine Stefan Harmeling 29 1 0 08 Dec 2023
EduGym: An Environment and Notebook Suite for Reinforcement Learning Education Thomas M. Moerland Matthias Muller-Brockhausen Zhao Yang Andrius Bernatavicius Koen Ponse Tom Kouwenhoven Andreas Sauter Michiel van der Meer Bram M. Renting Aske Plaat OffRL 26 0 0 17 Nov 2023
Neuro-Inspired Fragmentation and Recall to Overcome Catastrophic Forgetting in Curiosity Jaedong Hwang Zhang-Wei Hong Eric Chen Akhilan Boopathy Pulkit Agrawal Ila Fiete CLL 33 5 0 26 Oct 2023
METRA: Scalable Unsupervised RL with Metric-Aware Abstraction Seohong Park Oleh Rybkin Sergey Levine OffRL 33 34 0 13 Oct 2023
Contrastive Initial State Buffer for Reinforcement Learning Nico Messikommer Yunlong Song Davide Scaramuzza OffRL 36 9 0 18 Sep 2023
Towards AGI in Computer Vision: Lessons Learned from GPT and Large Language Models Lingxi Xie Longhui Wei Xiaopeng Zhang Kaifeng Bi Xiaotao Gu Jianlong Chang Qi Tian 33 7 0 14 Jun 2023
Off-Policy RL Algorithms Can be Sample-Efficient for Continuous Control via Sample Multiple Reuse Jiafei Lyu Le Wan Zongqing Lu Xiu Li OffRL 26 9 0 29 May 2023
Augmenting Autotelic Agents with Large Language Models Cédric Colas Laetitia Teodorescu Pierre-Yves Oudeyer Xingdi Yuan Marc-Alexandre Côté LLMAG LM&Ro 28 22 0 21 May 2023
Semantically Aligned Task Decomposition in Multi-Agent Reinforcement Learning Wenhao Li Dan Qiao Baoxiang Wang Xiangfeng Wang Bo Jin H. Zha 35 5 0 18 May 2023
MIMEx: Intrinsic Rewards from Masked Input Modeling Toru Lin Allan Jabri OffRL 23 6 0 15 May 2023
Learning Achievement Structure for Structured Exploration in Domains with Sparse Reward Zihan Zhou Animesh Garg OffRL 14 3 0 30 Apr 2023
Efficient Quality-Diversity Optimization through Diverse Quality Species Ryan Wickman Bibek Poudel Taylor Michael Villarreal Xiaofei Zhang Weizi Li 23 6 0 14 Apr 2023
SVDE: Scalable Value-Decomposition Exploration for Cooperative Multi-Agent Reinforcement Learning Shuhan Qi Shuhao Zhang Qiang-qiang Wang Jia-jia Zhang Jing Xiao X. Wang 26 0 0 16 Mar 2023
Meta-Explore: Exploratory Hierarchical Vision-and-Language Navigation Using Scene Object Spectrum Grounding Minyoung Hwang Jaeyeon Jeong Minsoo Kim Yoonseon Oh Songhwai Oh 19 19 0 07 Mar 2023
Targeted Search Control in AlphaZero for Effective Policy Improvement Alexandre Trudeau Michael H. Bowling 16 1 0 23 Feb 2023
Curiosity-driven Exploration in Sparse-reward Multi-agent Reinforcement Learning Jiong Li Pratik Gajane 37 4 0 21 Feb 2023
TiZero: Mastering Multi-Agent Football with Curriculum Learning and Self-Play Fanqing Lin Shiyu Huang Tim Pearce Wenze Chen Weijuan Tu 26 17 0 15 Feb 2023
Sample Efficient Deep Reinforcement Learning via Local Planning Dong Yin S. Thiagarajan N. Lazić Nived Rajaraman Botao Hao Csaba Szepesvári 20 4 0 29 Jan 2023
Deep Laplacian-based Options for Temporally-Extended Exploration Martin Klissarov Marlos C. Machado OffRL 16 18 0 26 Jan 2023
Near-optimal Policy Identification in Active Reinforcement Learning Xiang Li Viraj Mehta Johannes Kirschner I. Char W. Neiswanger J. Schneider Andreas Krause Ilija Bogunovic OffRL 40 6 0 19 Dec 2022
Five Properties of Specific Curiosity You Didn't Know Curious Machines Should Have Nadia M. Ady R. Shariff J. Günther P. Pilarski 14 0 0 01 Dec 2022
CIM: Constrained Intrinsic Motivation for Sparse-Reward Continuous Control Xiang Zheng Xingjun Ma Cong Wang 28 1 0 28 Nov 2022
Continuous Episodic Control Zhao Yang Thomas M. Moerland Mike Preuss Aske Plaat OffRL 19 3 0 28 Nov 2022
ActMAD: Activation Matching to Align Distributions for Test-Time-Training M. Jehanzeb Mirza Pol Jané Soneira W. Lin Mateusz Koziñski Horst Possegger Horst Bischof VLM TTA 34 24 0 23 Nov 2022
Efficient Exploration using Model-Based Quality-Diversity with Gradients Bryan Lim Manon Flageat Antoine Cully 18 4 0 22 Nov 2022
Redeeming Intrinsic Rewards via Constrained Optimization Eric Chen Zhang-Wei Hong J. Pajarinen Pulkit Agrawal OnRL 28 23 0 14 Nov 2022
Quality-diversity in dissimilarity spaces Steve Huntsman 22 1 0 14 Nov 2022
Leveraging Sequentiality in Reinforcement Learning from a Single Demonstration Alexandre Chenu Olivier Serris Olivier Sigaud Nicolas Perrin-Gilbert 12 4 0 09 Nov 2022
D-Shape: Demonstration-Shaped Reinforcement Learning via Goal Conditioning Caroline Wang Garrett A. Warnell Peter Stone 32 3 0 26 Oct 2022
Learning General World Models in a Handful of Reward-Free Deployments Yingchen Xu Jack Parker-Holder Aldo Pacchiano Philip J. Ball Oleh Rybkin Stephen J. Roberts Tim Rocktaschel Edward Grefenstette OffRL 55 8 0 23 Oct 2022
Training Diverse High-Dimensional Controllers by Scaling Covariance Matrix Adaptation MAP-Annealing Bryon Tjanaka Matthew C. Fontaine David H. Lee Aniruddha Kalkar S. Nikolaidis 60 8 0 06 Oct 2022
Delayed Geometric Discounts: An Alternative Criterion for Reinforcement Learning Firas Jarboui Ahmed Akakzia 16 0 0 26 Sep 2022
An information-theoretic perspective on intrinsic motivation in reinforcement learning: a survey A. Aubret L. Matignon S. Hassas 31 35 0 19 Sep 2022
Go-Explore Complex 3D Game Environments for Automated Reachability Testing Cong Lu Raluca Georgescu J. Verwey 19 7 0 01 Sep 2022
Play with Emotion: Affect-Driven Reinforcement Learning M. Barthet Ahmed Khalifa Antonios Liapis Georgios N. Yannakakis CVBM 22 7 0 26 Aug 2022
Generative Personas That Behave and Experience Like Humans M. Barthet Ahmed Khalifa Antonios Liapis Georgios N. Yannakakis 11 20 0 26 Aug 2022
Parametrically Retargetable Decision-Makers Tend To Seek Power Alexander Matt Turner Prasad Tadepalli 12 18 0 27 Jun 2022
Phasic Self-Imitative Reduction for Sparse-Reward Goal-Conditioned Reinforcement Learning Yunfei Li Tian Gao Jiaqi Yang Huazhe Xu Yi Wu OffRL 19 22 0 24 Jun 2022
BYOL-Explore: Exploration by Bootstrapped Prediction Z. Guo S. Thakoor Miruna Pislar Bernardo Avila-Pires Florent Altché ... Yunhao Tang Michal Valko Rémi Munos M. G. Azar Bilal Piot 22 68 0 16 Jun 2022
Social Network Structure Shapes Innovation: Experience-sharing in RL with SAPIENS Eleni Nisioti Matéo Mahaut Pierre-Yves Oudeyer Ida Momennejad Clément Moulin-Frier 19 9 0 10 Jun 2022
DEP-RL: Embodied Exploration for Reinforcement Learning in Overactuated and Musculoskeletal Systems Pierre Schumacher D. Haeufle Dieter Buchler S. Schmitt Georg Martius 15 31 0 30 May 2022
Reinforcement Learning for Branch-and-Bound Optimisation using Retrospective Trajectories Christopher W. F. Parsonson Alexandre Laterre Thomas D. Barrett 17 19 0 28 May 2022