v1v2v3v4v5v6 (latest)

Diversity is All You Need: Learning Skills without a Reward Function

16 February 2018

Abhishek Gupta

Papers citing "Diversity is All You Need: Learning Skills without a Reward Function"

50 / 414 papers shown

Title
Cousins Of The Vendi Score: A Family Of Similarity-Based Diversity Metrics For Science And Machine Learning Amey P. Pasarkar Adji Bousso Dieng 106 13 0 19 Oct 2023
Keep Various Trajectories: Promoting Exploration of Ensemble Policies in Continuous Control Chao Li Chen Gong Qiang He Xinwen Hou 71 1 0 17 Oct 2023
METRA: Scalable Unsupervised RL with Metric-Aware Abstraction Seohong Park Oleh Rybkin Sergey Levine OffRL 89 44 0 13 Oct 2023
Offline Retraining for Online RL: Decoupled Policy Learning to Mitigate Exploration Bias Max Sobol Mark Archit Sharma Fahim Tajwar Rafael Rafailov Sergey Levine Chelsea Finn OffRL OnRL 111 2 0 12 Oct 2023
Diversity from Human Feedback Ren-Jian Wang Ke Xue Yutong Wang Peng Yang Haobo Fu Qiang Fu Chao Qian 79 3 0 10 Oct 2023
Pre-Training and Fine-Tuning Generative Flow Networks Ling Pan Moksh Jain Kanika Madan Yoshua Bengio 111 13 0 05 Oct 2023
Generalized Animal Imitator: Agile Locomotion with Versatile Motion Prior Ruihan Yang Zhuoqun Chen Jianhan Ma Chongyi Zheng Yiyu Chen Quan Nguyen Xinze Wang 92 18 0 02 Oct 2023
Zero-Shot Reinforcement Learning from Low Quality Data Scott Jeen Tom Bewley Jonathan M. Cullen OffRL OnRL 90 4 0 26 Sep 2023
Diverse Policies Converge in Reward-free Markov Decision Processe Fanqing Lin Shiyu Huang Weiwei Tu 68 0 0 23 Aug 2023
QDax: A Library for Quality-Diversity and Population-based Algorithms with Hardware Acceleration Félix Chalumeau Bryan Lim Raphael Boige Maxime Allard Luca Grillotti Manon Flageat Valentin Macé Arthur Flajolet Thomas Pierrot Antoine Cully 74 23 0 07 Aug 2023
Foundational Models Defining a New Era in Vision: A Survey and Outlook Muhammad Awais Muzammal Naseer Salman Khan Rao Muhammad Anwer Hisham Cholakkal M. Shah Ming-Hsuan Yang Fahad Shahbaz Khan VLM 146 128 0 25 Jul 2023
Curious Replay for Model-based Adaptation Isaac Kauvar Christopher Doyle Linqi Zhou Nick Haber 62 12 0 28 Jun 2023
Comparing the Efficacy of Fine-Tuning and Meta-Learning for Few-Shot Policy Imitation Massimiliano Patacchiola Mingfei Sun Katja Hofmann Richard Turner OffRL 86 1 0 23 Jun 2023
Optimistic Active Exploration of Dynamical Systems Bhavya Sukhija Lenart Treven Cansu Sancaktar Sebastian Blaes Stelian Coros Andreas Krause 119 18 0 21 Jun 2023
SPRINT: Scalable Policy Pre-Training via Language Instruction Relabeling Jesse Zhang Karl Pertsch Jiahui Zhang Joseph J. Lim LM&Ro 121 17 0 20 Jun 2023
Skill Disentanglement for Imitation Learning from Suboptimal Demonstrations Tianxiang Zhao Wenchao Yu Suhang Wang Lucy Wang Xiang Zhang Yuncong Chen Yanchi Liu Wei Cheng Haifeng Chen 70 8 0 13 Jun 2023
Representation-Driven Reinforcement Learning Ofir Nabati Guy Tennenholtz Shie Mannor 108 1 0 31 May 2023
Future-conditioned Unsupervised Pretraining for Decision Transformer Zhihui Xie Zichuan Lin Deheng Ye Qiang Fu Wei Yang Shuai Li OffRL OnRL 92 23 0 26 May 2023
Augmenting Autotelic Agents with Large Language Models Cédric Colas Laetitia Teodorescu Pierre-Yves Oudeyer Xingdi Yuan Marc-Alexandre Côté LLMAG LM&Ro 87 27 0 21 May 2023
Unsupervised Discovery of Continuous Skills on a Sphere Takahisa Imagawa Takuya Hiraoka Yoshimasa Tsuruoka 87 0 0 21 May 2023
Learning Diverse Risk Preferences in Population-based Self-play Y. Jiang Qihan Liu Xiaoteng Ma Chenghao Li Yiqin Yang Jun Yang Bin Liang Qianchuan Zhao 134 6 0 19 May 2023
An Autonomous Non-monolithic Agent with Multi-mode Exploration based on Options Framework JaeYoon Kim Junyu Xuan Christy Jie Liang F. Hussain 144 1 0 02 May 2023
Think Before You Act: Unified Policy for Interleaving Language Reasoning with Actions Lina Mezghani Piotr Bojanowski Alahari Karteek Sainbayar Sukhbaatar LM&Ro OffRL LRM 78 10 0 18 Apr 2023
Efficient Quality-Diversity Optimization through Diverse Quality Species Ryan Wickman Bibek Poudel Taylor Michael Villarreal Xiaofei Zhang Weizi Li 102 6 0 14 Apr 2023
Habits and goals in synergy: a variational Bayesian framework for behavior Dongqi Han Kenji Doya Dongsheng Li Jun Tani BDL 78 215 0 11 Apr 2023
Chain-of-Thought Predictive Control Zhiwei Jia Vineet Thumuluri Fangchen Liu Ling-Hao Chen Zhiao Huang H. Su LM&Ro 145 20 0 03 Apr 2023
Learning to Explore Informative Trajectories and Samples for Embodied Perception Ya Jing Tao Kong 96 5 0 20 Mar 2023
RePreM: Representation Pre-training with Masked Model for Reinforcement Learning Yuanying Cai Wei Shen Wei Shen Xuyun Zhang Wenjie Ruan Longbo Huang OffRL 99 5 0 03 Mar 2023
Handling Long and Richly Constrained Tasks through Constrained Hierarchical Reinforcement Learning Yu Lu Arunesh Sinha Pradeep Varakantham 68 0 0 21 Feb 2023
Cross-domain Random Pre-training with Prototypes for Reinforcement Learning Xin Liu Yaran Chen Haoran Li Boyu Li Dong Zhao SSL 129 10 0 11 Feb 2023
Layered State Discovery for Incremental Autonomous Exploration Liyu Chen Andrea Tirinzoni A. Lazaric Matteo Pirotta 85 0 0 07 Feb 2023
Robust Subtask Learning for Compositional Generalization Kishor Jothimurugan Steve Hsu Osbert Bastani Rajeev Alur OffRL 74 5 0 06 Feb 2023
Diversity Through Exclusion (DTE): Niche Identification for Reinforcement Learning through Value-Decomposition P. Sunehag A. Vezhnevets Edgar A. Duénez-Guzmán Igor Mordach Joel Z Leibo 59 2 0 02 Feb 2023
A general Markov decision process formalism for action-state entropy-regularized reward maximization D. Grytskyy Jorge Ramírez-Ruiz R. Moreno-Bote 88 3 0 02 Feb 2023
Skill Decision Transformer Shyam Sudhakaran S. Risi OffRL 65 6 0 31 Jan 2023
Deep Laplacian-based Options for Temporally-Extended Exploration Martin Klissarov Marlos C. Machado OffRL 94 20 0 26 Jan 2023
DIRECT: Learning from Sparse and Shifting Rewards using Discriminative Reward Co-Training Philipp Altmann Thomy Phan Fabian Ritz Thomas Gabor Claudia Linnhoff-Popien OffRL 63 1 0 18 Jan 2023
Centralized Cooperative Exploration Policy for Continuous Control Tasks Chong Li Chen Gong Qiang He Xinwen Hou Yu Liu 80 1 0 06 Jan 2023
Learning Goal-Conditioned Policies Offline with Self-Supervised Reward Shaping Lina Mezghani Sainbayar Sukhbaatar Piotr Bojanowski A. Lazaric Alahari Karteek OffRL 132 19 0 05 Jan 2023
Self-Motivated Multi-Agent Exploration Shaowei Zhang Jiahan Cao Lei Yuan Yang Yu De-Chuan Zhan 96 5 0 05 Jan 2023
Intrinsic Motivation in Dynamical Control Systems Stas Tiomkin I. Nemenman Daniel Polani Naftali Tishby 59 5 0 29 Dec 2022
Reusable Options through Gradient-based Meta Learning David Kuric H. V. Hoof 93 0 0 22 Dec 2022
Pre-Trained Image Encoder for Generalizable Visual Reinforcement Learning Zhecheng Yuan Zhengrong Xue Bo Yuan Xueqian Wang Yi Wu Yang Gao Huazhe Xu SSL OffRL 110 74 0 17 Dec 2022
Hierarchical Strategies for Cooperative Multi-Agent Reinforcement Learning M. Ibrahim Ammar Fayad 64 1 0 14 Dec 2022
Hierarchical Deep Reinforcement Learning for VWAP Strategy Optimization Xiaodong Li Pangjing Wu Chenxin Zou Qing Li 54 3 0 11 Dec 2022
Learning Options via Compression Yiding Jiang Emmy Liu Benjamin Eysenbach Zico Kolter Chelsea Finn OffRL 95 14 0 08 Dec 2022
Curiosity creates Diversity in Policy Search Paul-Antoine Le Tolguenec Emmanuel Rachelson Yann Besse Dennis G. Wilson 67 2 0 07 Dec 2022
Walk These Ways: Tuning Robot Control for Generalization with Multiplicity of Behavior G. Margolis Pulkit Agrawal 89 168 0 06 Dec 2022
Flow to Control: Offline Reinforcement Learning with Lossless Primitive Discovery Yiqin Yang Haotian Hu Wenzhe Li Siyuan Li Jun Yang Qianchuan Zhao Chongjie Zhang OffRL 86 10 0 02 Dec 2022
Assistive Teaching of Motor Control Tasks to Humans Megha Srivastava Erdem Biyik Suvir Mirchandani Noah D. Goodman Dorsa Sadigh 78 6 0 25 Nov 2022