Diversity-Driven Exploration Strategy for Deep Reinforcement Learning

13 February 2018

Chun-Yi Lee

Papers citing "Diversity-Driven Exploration Strategy for Deep Reinforcement Learning"

29 / 29 papers shown

Title
Improving Human-AI Coordination through Adversarial Training and Generative Models Paresh Chaudhary Yancheng Liang Daphne Chen S. Du Natasha Jaques 73 0 0 21 Apr 2025
From Exploration to Mastery: Enabling LLMs to Master Tools via Self-Driven Interactions Changle Qu Sunhao Dai Xiaochi Wei Hengyi Cai Shuaiqiang Wang Dawei Yin Jun Xu Ji-Rong Wen 60 9 0 10 Oct 2024
Adaptive Mixture Importance Sampling for Automated Ads Auction Tuning Yimeng Jia Kaushal Paneri Rong Huang Kailash Singh Maurya Pavan Mallapragada Yifan Shi 38 0 0 20 Sep 2024
Highly Efficient Self-Adaptive Reward Shaping for Reinforcement Learning Haozhe Ma Zhengding Luo Thanh Vinh Vo Kuankuan Sima Tze-Yun Leong 50 6 0 06 Aug 2024
Random Latent Exploration for Deep Reinforcement Learning Srinath Mahankali Zhang-Wei Hong Ayush Sekhari Alexander Rakhlin Pulkit Agrawal 38 3 0 18 Jul 2024
Exclusively Penalized Q-learning for Offline Reinforcement Learning Junghyuk Yeom Yonghyeon Jo Jungmo Kim Sanghyeon Lee Seungyul Han OffRL 54 2 0 23 May 2024
Adaptive trajectory-constrained exploration strategy for deep reinforcement learning Guojian Wang Faguo Wu Xiao Zhang Ning Guo Zhiming Zheng 41 3 0 27 Dec 2023
Increasing Entropy to Boost Policy Gradient Performance on Personalization Tasks Andrew Starnes Anton Dereventsov Clayton Webster 24 0 0 09 Oct 2023
Robust Driving Policy Learning with Guided Meta Reinforcement Learning Kanghoon Lee Jiachen Li David Isele Jinkyoo Park K. Fujimura Mykel J. Kochenderfer 31 5 0 19 Jul 2023
A Cover Time Study of a non-Markovian Algorithm Guanhua Fang G. Samorodnitsky Zhiqiang Xu 28 0 0 08 Jun 2023
Diversity Through Exclusion (DTE): Niche Identification for Reinforcement Learning through Value-Decomposition P. Sunehag A. Vezhnevets Edgar A. Duénez-Guzmán Igor Mordach Joel Z. Leibo 26 2 0 02 Feb 2023
PushWorld: A benchmark for manipulation planning with tools and movable obstacles Ken Kansky Skanda Vaidyanath Scott Swingle Xinghua Lou Miguel Lazaro-Gredilla Dileep George 31 4 0 24 Jan 2023
Generalization through Diversity: Improving Unsupervised Environment Design Wenjun Li Pradeep Varakantham Dexun Li 33 7 0 19 Jan 2023
CIM: Constrained Intrinsic Motivation for Sparse-Reward Continuous Control Xiang Zheng Xingjun Ma Cong Wang 36 1 0 28 Nov 2022
Open-Ended Diverse Solution Discovery with Regulated Behavior Patterns for Cross-Domain Adaptation Kang Xu Yan Ma Bingsheng Wei Wei Li 40 3 0 24 Sep 2022
Generalized Policy Improvement Algorithms with Theoretically Supported Sample Reuse James Queeney I. Paschalidis Christos G. Cassandras OffRL 32 2 0 28 Jun 2022
Exploration in Deep Reinforcement Learning: A Survey Pawel Ladosz Lilian Weng Minwoo Kim H. Oh OffRL 31 324 0 02 May 2022
Continuously Discovering Novel Strategies via Reward-Switching Policy Optimization Zihan Zhou Wei Fu Bingliang Zhang Yi Wu 27 28 0 04 Apr 2022
Learning Robust Real-Time Cultural Transmission without Human Data Cultural General Intelligence Team Avishkar Bhoopchand Bethanie Brownfield Adrian Collister Agustin Dal Lago ... Alex Platonov Evan Senter Sukhdeep Singh Alexander Zacherl Lei M. Zhang VLM 46 11 0 01 Mar 2022
Soft Actor-Critic with Inhibitory Networks for Faster Retraining J. Ide Daria Mićović Michael J. Guarino K. Alcedo D. Rosenbluth Adrian P. Pope 18 3 0 07 Feb 2022
A Survey of Exploration Methods in Reinforcement Learning Susan Amin Maziar Gomrokchi Harsh Satija H. V. Hoof Doina Precup OffRL 37 80 0 01 Sep 2021
Cooperative Exploration for Multi-Agent Deep Reinforcement Learning Iou-Jen Liu Unnat Jain Raymond A. Yeh Alex Schwing 44 104 0 23 Jul 2021
Hierarchical Reinforcement Learning for Air-to-Air Combat Adrian P. Pope J. Ide Daria Mićović Henry Diaz D. Rosenbluth Lee Ritholtz Jason C. Twedt Thayne T. Walker K. Alcedo D. Javorsek 25 72 0 03 May 2021
Behaviorally Diverse Traffic Simulation via Reinforcement Learning Shinya Shiroshita Shirou Maruyama D. Nishiyama M. Castro Karim Hamzaoui Guy Rosman Jonathan A. DeCastro Kuan-Hui Lee Adrien Gaidon 34 19 0 11 Nov 2020
Harnessing Distribution Ratio Estimators for Learning Agents with Quality and Diversity Tanmay Gangwani Jian Peng Yuanshuo Zhou 29 10 0 05 Nov 2020
Non-local Policy Optimization via Diversity-regularized Collaborative Exploration Zhenghao Peng Hao Sun Bolei Zhou 18 18 0 14 Jun 2020
Effective Diversity in Population Based Reinforcement Learning Jack Parker-Holder Aldo Pacchiano K. Choromanski Stephen J. Roberts 22 158 0 03 Feb 2020
Multi-Path Policy Optimization L. Pan Qingpeng Cai Longbo Huang 18 2 0 11 Nov 2019
Learning-Driven Exploration for Reinforcement Learning Muhammad Usama D. Chang 29 10 0 17 Jun 2019