Phasic Policy Gradient

9 September 2020

Papers citing "Phasic Policy Gradient"

32 / 32 papers shown

Title
BQSched: A Non-intrusive Scheduler for Batch Concurrent Queries via Reinforcement Learning Chenhao Xu Chunyu Chen Jinglin Peng Jiannan Wang Jun Gao OffRL AI4TS 53 0 0 27 Apr 2025
A Reinforcement Learning Method for Environments with Stochastic Variables: Post-Decision Proximal Policy Optimization with Dual Critic Networks L. Felizardo Edoardo Fadda Paolo Brandimarte E. Del-Moral-Hernandez Mariá Cristina Vasconcelos Nascimento OffRL 35 0 0 07 Apr 2025
Studying the Interplay Between the Actor and Critic Representations in Reinforcement Learning Samuel Garcin Trevor A. McInroe Pablo Samuel Castro Prakash Panangaden Christopher G. Lucas David Abel Stefano V. Albrecht 58 0 0 08 Mar 2025
Adaptive Data Exploitation in Deep Reinforcement Learning Mingqi Yuan Bo Li Xin Jin Wenjun Zeng OffRL 285 0 0 22 Jan 2025
Beyond The Rainbow: High Performance Deep Reinforcement Learning on a Desktop PC Tyler Clark Mark Towers Christine Evers Jonathon Hare OffRL 43 0 0 06 Nov 2024
The Definitive Guide to Policy Gradients in Deep Reinforcement Learning: Theory, Algorithms and Implementations Matthias Lehmann 46 0 0 24 Jan 2024
Multi-agent Reinforcement Learning: A Comprehensive Survey Dom Huh Prasant Mohapatra AI4CE 36 8 0 15 Dec 2023
An Invitation to Deep Reinforcement Learning Bernhard Jaeger Andreas Geiger OffRL OOD 80 5 0 13 Dec 2023
Machine Learning Meets Advanced Robotic Manipulation Saeid Nahavandi R. Alizadehsani D. Nahavandi Chee Peng Lim Kevin Kelly Fernando Bello 29 17 0 22 Sep 2023
Truncating Trajectories in Monte Carlo Reinforcement Learning Riccardo Poiani Alberto Maria Metelli Marcello Restelli 29 2 0 07 May 2023
Scaling laws for single-agent reinforcement learning Jacob Hilton Jie Tang John Schulman 22 20 0 31 Jan 2023
PIRLNav: Pretraining with Imitation and RL Finetuning for ObjectNav Ram Ramrakhya Dhruv Batra Erik Wijmans Abhishek Das OffRL 33 53 0 18 Jan 2023
Contrastive Value Learning: Implicit Models for Simple Offline RL Bogdan Mazoure Benjamin Eysenbach Ofir Nachum Jonathan Tompson SSL OffRL 48 8 0 03 Nov 2022
Broken Neural Scaling Laws Ethan Caballero Kshitij Gupta Irina Rish David M. Krueger 30 74 0 26 Oct 2022
ERL-Re $^2$ : Efficient Evolutionary Reinforcement Learning with Shared State Representation and Individual Policy Representation Jianye Hao Pengyi Li Hongyao Tang Yan Zheng Xian Fu Zhaopeng Meng 29 24 0 26 Oct 2022
Hyperbolic Deep Reinforcement Learning Edoardo Cetin B. Chamberlain Michael M. Bronstein Jonathan J. Hunt 50 21 0 04 Oct 2022
Reinforcement Learning Algorithms: An Overview and Classification Fadi AlMahamid Katarina Grolinger 21 40 0 29 Sep 2022
Ensemble Reinforcement Learning in Continuous Spaces -- A Hierarchical Multi-Step Approach for Policy Training Gang Chen Victoria Huang OffRL 45 0 0 29 Sep 2022
Learning swimming via deep reinforcement learning Jin Zhang Lei Zhou Bochao Cao 28 1 0 22 Sep 2022
Improving Assistive Robotics with Deep Reinforcement Learning Yash Jakhotiya Iman Haque 18 4 0 05 Sep 2022
GriddlyJS: A Web IDE for Reinforcement Learning C. Bamford Minqi Jiang Mikayel Samvelyan Tim Rocktaschel OnRL 45 4 0 13 Jul 2022
Stabilizing Off-Policy Deep Reinforcement Learning from Pixels Edoardo Cetin Philip J. Ball Steve Roberts Oya Celiktutan 43 36 0 03 Jul 2022
Improving Policy Optimization with Generalist-Specialist Learning Zhiwei Jia Xuanlin Li Z. Ling Shuang Liu Yiran Wu H. Su OffRL 32 24 0 26 Jun 2022
Phasic Self-Imitative Reduction for Sparse-Reward Goal-Conditioned Reinforcement Learning Yunfei Li Tian Gao Jiaqi Yang Huazhe Xu Yi Wu OffRL 38 22 0 24 Jun 2022
Learning Dynamics and Generalization in Reinforcement Learning Clare Lyle Mark Rowland Will Dabney Marta Z. Kwiatkowska Y. Gal OOD OffRL 32 12 0 05 Jun 2022
Learning Design and Construction with Varying-Sized Materials via Prioritized Memory Resets Yunfei Li Tao Kong Lei Li Yi Wu 58 4 0 12 Apr 2022
Batch size-invariance for policy optimization Jacob Hilton K. Cobbe John Schulman 27 11 0 01 Oct 2021
Deep Reinforcement Learning at the Edge of the Statistical Precipice Rishabh Agarwal Max Schwarzer Pablo Samuel Castro Aaron Courville Marc G. Bellemare OffRL 61 639 0 30 Aug 2021
Learning to drive from a world on rails Di Chen V. Koltun Philipp Krahenbuhl 98 116 0 03 May 2021
Efficient Transformers in Reinforcement Learning using Actor-Learner Distillation Emilio Parisotto Ruslan Salakhutdinov 42 44 0 04 Apr 2021
Rethinking the Implementation Tricks and Monotonicity Constraint in Cooperative Multi-Agent Reinforcement Learning Jian Hu Siyang Jiang Seth Austin Harding Haibin Wu Shihua Liao 24 86 0 06 Feb 2021
What About Inputing Policy in Value Function: Policy Representation and Policy-extended Value Function Approximator Hongyao Tang Zhaopeng Meng Jianye Hao Chong Chen D. Graves ... Hangyu Mao Wulong Liu Yaodong Yang Wenyuan Tao Li Wang OffRL 24 7 0 19 Oct 2020