Hyperspherical Normalization for Scalable Deep Reinforcement Learning

21 February 2025

Papers citing "Hyperspherical Normalization for Scalable Deep Reinforcement Learning"

50 / 76 papers shown

Title
Bigger, Regularized, Categorical: High-Capacity Value Functions are Efficient Multi-Task Learners Michal Nauman Marek Cygan Carmelo Sferrazza Aviral Kumar Pieter Abbeel OffRL 13 0 0 29 May 2025
Plasticine: Accelerating Research in Plasticity-Motivated Deep Reinforcement Learning Mingqi Yuan Qi Wang Guozheng Ma Yue Liu Xin Jin Yunbo Wang Xiaokang Yang Wenjun Zeng D. Tao OffRL AI4CE 68 0 0 24 Apr 2025
Towards General-Purpose Model-Free Reinforcement Learning Scott Fujimoto P. DÓro Amy Zhang Yuandong Tian Michael Rabbat OffRL 53 5 0 28 Jan 2025
Streaming Deep Reinforcement Learning Finally Works Mohamed Elsayed Gautham Vasan A. R. Mahmood OffRL 67 4 0 18 Oct 2024
MAD-TD: Model-Augmented Data stabilizes High Update Ratio RL C. Voelcker Marcel Hussing Eric Eaton Amir-massoud Farahmand Igor Gilitschenski 65 4 0 11 Oct 2024
Gymnasium: A Standard Interface for Reinforcement Learning Environments Mark Towers Ariel Kwiatkowski Jordan Terry John U. Balis Gianluca De Cola ... Andrea Pierré Sander Schulhoff Jun Jet Tai Hannah Tan Omar G. Younis AuLLM OffRL 40 183 0 24 Jul 2024
Simplifying Deep Temporal Difference Learning Matteo Gallici Mattie Fellows Benjamin Ellis B. Pou Ivan Masmitja Jakob Foerster Mario Martin OffRL 74 21 0 05 Jul 2024
Normalization and effective learning rates in reinforcement learning Clare Lyle Zeyu Zheng Khimya Khetarpal James Martens H. V. Hasselt Razvan Pascanu Will Dabney 49 9 0 01 Jul 2024
iQRL -- Implicitly Quantized Representations for Sample-efficient Reinforcement Learning Aidan Scannell Kalle Kujanpää Yi Zhao Mohammadreza Nakhaei Dieter Büchler Joni Pajarinen SSL 94 5 0 04 Jun 2024
Bigger, Regularized, Optimistic: scaling for compute and sample-efficient continuous control Michal Nauman M. Ostaszewski Krzysztof Jankowski Piotr Milo's Marek Cygan OffRL 60 24 0 25 May 2024
Reward Centering Abhishek Naik Yi Wan Manan Tomar Richard S. Sutton 29 6 0 16 May 2024
HumanoidBench: Simulated Humanoid Benchmark for Whole-Body Locomotion and Manipulation Carmelo Sferrazza Dun-Ming Huang Xingyu Lin Youngwoon Lee Pieter Abbeel 83 42 0 15 Mar 2024
Overestimation, Overfitting, and Plasticity in Actor-Critic: the Bitter Lesson of Reinforcement Learning Michal Nauman Michal Bortkiewicz Piotr Milo's Tomasz Trzciñski M. Ostaszewski Marek Cygan OffRL 40 19 0 01 Mar 2024
Analyzing and Improving the Training Dynamics of Diffusion Models Tero Karras M. Aittala J. Lehtinen Janne Hellsten Timo Aila S. Laine 71 173 0 05 Dec 2023
Sample-Efficient and Safe Deep Reinforcement Learning via Reset Deep Ensemble Agents Woojun Kim Yongjae Shin Jongeui Park Young-Jin Sung OnRL 36 7 0 31 Oct 2023
DrM: Mastering Visual Reinforcement Learning through Dormant Ratio Minimization Guowei Xu Ruijie Zheng Yongyuan Liang Xiyao Wang Zhecheng Yuan ... Shuzhen Li Yanjie Ze Hal Daumé Furong Huang Huazhe Xu 66 28 0 30 Oct 2023
TD-MPC2: Scalable, Robust World Models for Continuous Control Nicklas Hansen Hao Su Xiaolong Wang MU 82 141 0 25 Oct 2023
Maintaining Plasticity in Deep Continual Learning Shibhansh Dohare J. F. Hernandez-Garcia Parash Rahman A. Rupam Mahmood Richard S. Sutton KELM CLL 43 27 0 23 Jun 2023
PLASTIC: Improving Input and Label Plasticity for Sample Efficient Reinforcement Learning Hojoon Lee Hanseul Cho Hyunseung Kim Daehoon Gwak Joonkee Kim Jaegul Choo Se-Young Yun Chulhee Yun OffRL 93 29 0 19 Jun 2023
For SALE: State-Action Representation Learning for Deep Reinforcement Learning Scott Fujimoto Wei-Di Chang Edward James Smith S. Gu Doina Precup David Meger OffRL 40 49 0 04 Jun 2023
Hyperparameters in Reinforcement Learning and How To Tune Them Theresa Eimer Marius Lindauer Roberta Raileanu OffRL 110 38 0 02 Jun 2023
Bigger, Better, Faster: Human-level Atari with human-level efficiency Max Schwarzer J. Obando-Ceron Rameswar Panda Marc G. Bellemare Rishabh Agarwal Pablo Samuel Castro OffRL 65 92 0 30 May 2023
IDQL: Implicit Q-Learning as an Actor-Critic Method with Diffusion Policies Philippe Hansen-Estruch Ilya Kostrikov Michael Janner J. Kuba Sergey Levine OffRL 48 140 0 20 Apr 2023
Efficient Deep Reinforcement Learning Requires Regulating Overfitting Qiyang Li Aviral Kumar Ilya Kostrikov Sergey Levine OffRL 62 33 0 20 Apr 2023
GPT-4 Technical Report OpenAI OpenAI OpenAI Josh Achiam Steven Adler Sandhini Agarwal Lama Ahmad ... Shengjia Zhao Tianhao Zheng Juntang Zhuang William Zhuk Barret Zoph LLMAG MLLM 337 13,788 0 15 Mar 2023
Understanding plasticity in neural networks Clare Lyle Zeyu Zheng Evgenii Nikishin Bernardo Avila-Pires Razvan Pascanu Will Dabney AI4CE 55 99 0 02 Mar 2023
The Dormant Neuron Phenomenon in Deep Reinforcement Learning Ghada Sokar Rishabh Agarwal Pablo Samuel Castro Utku Evci CLL 75 92 0 24 Feb 2023
Scaling Vision Transformers to 22 Billion Parameters Mostafa Dehghani Josip Djolonga Basil Mustafa Piotr Padlewski Jonathan Heek ... Mario Luvcić Xiaohua Zhai Daniel Keysers Jeremiah Harmsen N. Houlsby MLLM 121 585 0 10 Feb 2023
Efficient Online Reinforcement Learning with Offline Data Philip J. Ball Laura M. Smith Ilya Kostrikov Sergey Levine OffRL OnRL 68 173 0 06 Feb 2023
Mastering Diverse Domains through World Models Danijar Hafner J. Pašukonis Jimmy Ba Timothy Lillicrap 47 575 0 10 Jan 2023
Extreme Q-Learning: MaxEnt RL without Entropy Divyansh Garg Joey Hejna Matthieu Geist Stefano Ermon OffRL 47 72 0 05 Jan 2023
Training Scale-Invariant Neural Networks on the Sphere Can Happen in Three Regimes M. Kodryan E. Lobacheva M. Nakhodnov Dmitry Vetrov 62 17 0 08 Sep 2022
Diffusion Policies as an Expressive Policy Class for Offline Reinforcement Learning Zhendong Wang Jonathan J. Hunt Mingyuan Zhou OffRL 35 356 0 12 Aug 2022
MyoSuite -- A contact-rich simulation suite for musculoskeletal motor control Vittorio Caggiano Huawei Wang G. Durandau Massimo Sartori Vikash Kumar 37 92 0 26 May 2022
The Primacy Bias in Deep Reinforcement Learning Evgenii Nikishin Max Schwarzer P. DÓro Pierre-Luc Bacon Rameswar Panda OnRL 114 187 0 16 May 2022
Understanding and Preventing Capacity Loss in Reinforcement Learning Clare Lyle Mark Rowland Will Dabney CLL 53 111 0 20 Apr 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 627 12,525 0 04 Mar 2022
High-Resolution Image Synthesis with Latent Diffusion Models Robin Rombach A. Blattmann Dominik Lorenz Patrick Esser Bjorn Ommer 3DV 197 15,081 0 20 Dec 2021
Offline Reinforcement Learning with Implicit Q-Learning Ilya Kostrikov Ashvin Nair Sergey Levine OffRL 246 874 0 12 Oct 2021
Dropout Q-Functions for Doubly Efficient Reinforcement Learning Takuya Hiraoka Takahisa Imagawa Taisei Hashimoto Takashi Onishi Yoshimasa Tsuruoka 32 107 0 05 Oct 2021
A Minimalist Approach to Offline Reinforcement Learning Scott Fujimoto S. Gu OffRL 75 804 0 12 Jun 2021
Decision Transformer: Reinforcement Learning via Sequence Modeling Lili Chen Kevin Lu Aravind Rajeswaran Kimin Lee Aditya Grover Michael Laskin Pieter Abbeel A. Srinivas Igor Mordatch OffRL 71 1,608 0 02 Jun 2021
Return-based Scaling: Yet Another Normalisation Trick for Deep RL Tom Schaul Georg Ostrovski Iurii Kemaev Diana Borsa 18 19 0 11 May 2021
Spectral Normalisation for Deep Reinforcement Learning: an Optimisation Perspective Florin Gogianu Tudor Berariu Mihaela Rosca Claudia Clopath L. Buşoniu Razvan Pascanu 44 54 0 11 May 2021
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 286 4,873 0 24 Feb 2021
Conservative Q-Learning for Offline Reinforcement Learning Aviral Kumar Aurick Zhou George Tucker Sergey Levine OffRL OnRL 80 1,780 0 08 Jun 2020
Understanding Contrastive Representation Learning through Alignment and Uniformity on the Hypersphere Tongzhou Wang Phillip Isola SSL 74 1,808 0 20 May 2020
Controlling Overestimation Bias with Truncated Mixture of Continuous Distributional Quantile Critics Arsenii Kuznetsov Pavel Shvechikov Alexander Grishin Dmitry Vetrov 187 191 0 08 May 2020
Image Augmentation Is All You Need: Regularizing Deep Reinforcement Learning from Pixels Ilya Kostrikov Denis Yarats Rob Fergus OffRL 61 779 0 28 Apr 2020
D4RL: Datasets for Deep Data-Driven Reinforcement Learning Justin Fu Aviral Kumar Ofir Nachum George Tucker Sergey Levine GP OffRL 164 1,338 0 15 Apr 2020