Parameter Space Noise for Exploration

6 June 2017

Pieter Abbeel

Papers citing "Parameter Space Noise for Exploration"

50 / 102 papers shown

Title
Param $Δ$ for Direct Weight Mixing: Post-Train Large Language Model at Zero Cost Sheng Cao Mingrui Wu Karthik Prasad Yuandong Tian Zechun Liu MoMe 85 0 0 23 Apr 2025
EVaDE : Event-Based Variational Thompson Sampling for Model-Based Reinforcement Learning Siddharth Aravindan Dixant Mittal Wee Sun Lee BDL 79 0 0 17 Jan 2025
Acceleration for Deep Reinforcement Learning using Parallel and Distributed Computing: A Survey Zhihong Liu Xin Xu Peng Qiao Dongsheng Li OffRL 27 2 0 08 Nov 2024
Learning Agents With Prioritization and Parameter Noise in Continuous State and Action Space Rajesh Mangannavar Gopalakrishnan Srinivasaraghavan 25 2 0 15 Oct 2024
ETGL-DDPG: A Deep Deterministic Policy Gradient Algorithm for Sparse Reward Continuous Control Ehsan Futuhi Shayan Karimi Chao Gao Martin Müller 40 1 0 07 Oct 2024
Random Latent Exploration for Deep Reinforcement Learning Srinath Mahankali Zhang-Wei Hong Ayush Sekhari Alexander Rakhlin Pulkit Agrawal 33 3 0 18 Jul 2024
Can Learned Optimization Make Reinforcement Learning Less Difficult? Alexander David Goldie Chris Xiaoxuan Lu Matthew Jackson Shimon Whiteson Jakob N. Foerster 44 3 0 09 Jul 2024
Smoothing of Headland Path Edges and Headland-to-Mainfield Lane Transitions Based on a Spatial Domain Transformation and Linear Programming Mogens Plessen 24 0 0 08 Jul 2024
Model-free reinforcement learning with noisy actions for automated experimental control in optics Lea Richtmann Viktoria-S. Schmiesing Dennis Wilken Jan Heine Aaron Tranter Avishek Anand Tobias J. Osborne M. Heurs 33 2 0 24 May 2024
Q-Star Meets Scalable Posterior Sampling: Bridging Theory and Practice via HyperAgent Yingru Li Jiawei Xu Lei Han Zhi-Quan Luo BDL OffRL 26 5 0 05 Feb 2024
UOEP: User-Oriented Exploration Policy for Enhancing Long-Term User Experiences in Recommender Systems Changshuo Zhang Sirui Chen Xiao Zhang Sunhao Dai Weijie Yu Jun Xu OffRL 35 1 0 17 Jan 2024
Adaptive trajectory-constrained exploration strategy for deep reinforcement learning Guojian Wang Faguo Wu Xiao Zhang Ning Guo Zhiming Zheng 36 3 0 27 Dec 2023
Colored Noise in PPO: Improved Exploration and Performance through Correlated Action Sampling Jakob J. Hollenstein Georg Martius J. Piater 22 3 0 18 Dec 2023
Machine Learning Meets Advanced Robotic Manipulation Saeid Nahavandi R. Alizadehsani D. Nahavandi Chee Peng Lim Kevin Kelly Fernando Bello 24 17 0 22 Sep 2023
MARL for Decentralized Electric Vehicle Charging Coordination with V2V Energy Exchange Jiarong Fan Hao Wang Ariel Liebman 19 1 0 27 Aug 2023
Provable and Practical: Efficient Exploration in Reinforcement Learning via Langevin Monte Carlo Haque Ishfaq Qingfeng Lan Pan Xu A. R. Mahmood Doina Precup Anima Anandkumar Kamyar Azizzadenesheli BDL OffRL 28 20 0 29 May 2023
Off-Policy RL Algorithms Can be Sample-Efficient for Continuous Control via Sample Multiple Reuse Jiafei Lyu Le Wan Zongqing Lu Xiu Li OffRL 34 9 0 29 May 2023
Facilitating Sim-to-real by Intrinsic Stochasticity of Real-Time Simulation in Reinforcement Learning for Robot Manipulation Ram Dershan Amir M. Soufi Enayati Zengjie Zhang D. Richert H. Najjaran 30 3 0 12 Apr 2023
Safe and Sample-efficient Reinforcement Learning for Clustered Dynamic Environments Hongyi Chen Changliu Liu OffRL 19 14 0 24 Mar 2023
Self-Motivated Multi-Agent Exploration Shaowei Zhang Jiahan Cao Lei Yuan Yang Yu De-Chuan Zhan 47 5 0 05 Jan 2023
Learning One Abstract Bit at a Time Through Self-Invented Experiments Encoded as Neural Networks Vincent Herrmann Louis Kirsch Jürgen Schmidhuber AI4CE 46 5 0 29 Dec 2022
CIM: Constrained Intrinsic Motivation for Sparse-Reward Continuous Control Xiang Zheng Xingjun Ma Cong Wang 28 1 0 28 Nov 2022
Climate Change Policy Exploration using Reinforcement Learning Theodore Wolf 23 0 0 23 Oct 2022
PaCo: Parameter-Compositional Multi-Task Reinforcement Learning Lingfeng Sun Haichao Zhang Wei-ping Xu Masayoshi Tomizuka MoE 30 37 0 21 Oct 2022
Deep Intrinsically Motivated Exploration in Continuous Control Baturay Saglam Suleyman Serdar Kozat 18 4 0 01 Oct 2022
Ensemble Reinforcement Learning in Continuous Spaces -- A Hierarchical Multi-Step Approach for Policy Training Gang Chen Victoria Huang OffRL 40 0 0 29 Sep 2022
An information-theoretic perspective on intrinsic motivation in reinforcement learning: a survey A. Aubret L. Matignon S. Hassas 37 35 0 19 Sep 2022
Proactive slip control by learned slip model and trajectory adaptation Kiyanoush Nazari Willow Mandil E. AmirGhalamzan 31 15 0 13 Sep 2022
Action Noise in Off-Policy Deep Reinforcement Learning: Impact on Exploration and Performance Jakob J. Hollenstein Sayantan Auddy Matteo Saveriano Erwan Renaudo J. Piater 41 17 0 08 Jun 2022
The Sufficiency of Off-Policyness and Soft Clipping: PPO is still Insufficient according to an Off-Policy Measure Xing Chen Dongcui Diao Hechang Chen Hengshuai Yao Haiyin Piao Zhixiao Sun Zhiwei Yang Randy Goebel Bei Jiang Yi-Ju Chang OffRL 38 8 0 20 May 2022
Distributed Multi-Agent Deep Reinforcement Learning for Robust Coordination against Noise Yoshinari Motokawa T. Sugawara 27 2 0 19 May 2022
Qualitative Differences Between Evolutionary Strategies and Reinforcement Learning Methods for Control of Autonomous Agents Nicola Milano S. Nolfi 20 0 0 16 May 2022
Exploration in Deep Reinforcement Learning: A Survey Pawel Ladosz Lilian Weng Minwoo Kim H. Oh OffRL 26 324 0 02 May 2022
MicroRacer: a didactic environment for Deep Reinforcement Learning Andrea Asperti Marco Del Brutto 27 0 0 20 Mar 2022
Learning Robust Real-Time Cultural Transmission without Human Data Cultural General Intelligence Team Avishkar Bhoopchand Bethanie Brownfield Adrian Collister Agustin Dal Lago ... Alex Platonov Evan Senter Sukhdeep Singh Alexander Zacherl Lei M. Zhang VLM 46 11 0 01 Mar 2022
A Comparative Study of Deep Reinforcement Learning-based Transferable Energy Management Strategies for Hybrid Electric Vehicles Jingyi Xu Zirui Li Li Gao Junyi Ma Qi Liu Yanan Zhao 25 13 0 22 Feb 2022
Tackling benign nonconvexity with smoothing and stochastic gradients Harsh Vardhan Sebastian U. Stich 28 8 0 18 Feb 2022
Generative Planning for Temporally Coordinated Exploration in Reinforcement Learning Haichao Zhang Wei-ping Xu Haonan Yu 38 10 0 24 Jan 2022
Renewable energy integration and microgrid energy trading using multi-agent deep reinforcement learning Daniel J. B. Harrold Jun Cao Zhongbo Fan 31 61 0 21 Nov 2021
Bayesian Sequential Optimal Experimental Design for Nonlinear Models Using Policy Gradient Reinforcement Learning Wanggang Shen Xun Huan 11 40 0 28 Oct 2021
Can Q-learning solve Multi Armed Bantids? R. Vivanti OffRL 13 0 0 21 Oct 2021
Offline Reinforcement Learning for Autonomous Driving with Safety and Exploration Enhancement Tianyu Shi Dong Chen Kaian Chen Zhaojian Li OffRL 34 31 0 13 Oct 2021
Exploration in Deep Reinforcement Learning: From Single-Agent to Multiagent Domain Jianye Hao Tianpei Yang Hongyao Tang Chenjia Bai Jinyi Liu Zhaopeng Meng Peng Liu Zhen Wang OffRL 36 93 0 14 Sep 2021
A Survey of Exploration Methods in Reinforcement Learning Susan Amin Maziar Gomrokchi Harsh Satija H. V. Hoof Doina Precup OffRL 26 80 0 01 Sep 2021
A Survey on Deep Reinforcement Learning for Data Processing and Analytics Qingpeng Cai Can Cui Yiyuan Xiong Wei Wang Zhongle Xie Meihui Zhang OffRL 21 29 0 10 Aug 2021
Learning Deep Energy Shaping Policies for Stability-Guaranteed Manipulation S. A. Khader Hang Yin Pietro Falco Danica Kragic 16 12 0 30 Mar 2021
Decoupled Exploration and Exploitation Policies for Sample-Efficient Reinforcement Learning William F. Whitney Michael Bloesch Jost Tobias Springenberg A. Abdolmaleki Kyunghyun Cho Martin Riedmiller OffRL 29 13 0 23 Jan 2021
Policy Manifold Search for Improving Diversity-based Neuroevolution Nemanja Rakićević Antoine Cully Petar Kormushev 27 0 0 15 Dec 2020
BeBold: Exploration Beyond the Boundary of Explored Regions Tianjun Zhang Huazhe Xu Xiaolong Wang Yi Wu Kurt Keutzer Joseph E. Gonzalez Yuandong Tian 36 40 0 15 Dec 2020
Revisiting Design Choices in Proximal Policy Optimization Chloe Ching-Yun Hsu Celestine Mendler-Dünner Moritz Hardt 22 53 0 23 Sep 2020