Trajectory-wise Control Variates for Variance Reduction in Policy Gradient Methods

8 August 2019

Papers citing "Trajectory-wise Control Variates for Variance Reduction in Policy Gradient Methods"

17 / 17 papers shown

Title
Multi-Fidelity Policy Gradient Algorithms Xinjie Liu Cyrus Neary Kushagra Gupta Christian Ellis Ufuk Topcu David Fridovich-Keil OffRL 176 0 0 07 Mar 2025
Rapidly Adapting Policies to the Real World via Simulation-Guided Fine-Tuning Patrick Yin Tyler Westenbroek Simran Bagaria Kevin Huang Ching-an Cheng Andrey Kobolov Abhishek Gupta 80 2 0 04 Feb 2025
Neural Set Function Extensions: Learning with Discrete Functions in High Dimensions Nikolaos Karalias Joshua Robinson Andreas Loukas Stefanie Jegelka 37 8 0 08 Aug 2022
Offline Policy Optimization with Eligible Actions Yao Liu Yannis Flet-Berliac Emma Brunskill OffRL 25 5 0 01 Jul 2022
Variance Reduction for Policy-Gradient Methods via Empirical Variance Minimization Maxim Kaledin Alexander Golubev Denis Belomestny OffRL 23 3 0 14 Jun 2022
Dealing with the Unknown: Pessimistic Offline Reinforcement Learning Jinning Li Chen Tang Masayoshi Tomizuka Wei Zhan OffRL 13 21 0 09 Nov 2021
AW-Opt: Learning Robotic Skills with Imitation and Reinforcement at Scale Yao Lu Karol Hausman Yevgen Chebotar Mengyuan Yan Eric Jang ... Ted Xiao A. Irpan Mohi Khansari Dmitry Kalashnikov Sergey Levine OffRL 92 59 0 09 Nov 2021
Constrained Policy Gradient Method for Safe and Fast Reinforcement Learning: a Neural Tangent Kernel Based Approach B. Varga Balázs Kulcsár M. Chehreghani 29 1 0 19 Jul 2021
Coordinate-wise Control Variates for Deep Policy Gradients Yuanyi Zhong Yuanshuo Zhou Jian-wei Peng BDL 16 1 0 11 Jul 2021
On Proximal Policy Optimization's Heavy-tailed Gradients Saurabh Garg Joshua Zhanson Emilio Parisotto Adarsh Prasad J. Zico Kolter Zachary Chase Lipton Sivaraman Balakrishnan Ruslan Salakhutdinov Pradeep Ravikumar 17 11 0 20 Feb 2021
Beyond variance reduction: Understanding the true impact of baselines on policy optimization Wesley Chung Valentin Thomas Marlos C. Machado Nicolas Le Roux OffRL 14 22 0 31 Aug 2020
Momentum-Based Policy Gradient Methods Feihu Huang Shangqian Gao J. Pei Heng-Chiao Huang 22 38 0 13 Jul 2020
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 340 1,960 0 04 May 2020
Statistically Efficient Off-Policy Policy Gradients Nathan Kallus Masatoshi Uehara OffRL 6 37 0 10 Feb 2020
From Importance Sampling to Doubly Robust Policy Gradient Jiawei Huang Nan Jiang OffRL 14 24 0 20 Oct 2019
Policy Optimization with Stochastic Mirror Descent Long Yang Yu Zhang Gang Zheng Qian Zheng Pengfei Li Jianhang Huang Jun Wen Gang Pan 23 34 0 25 Jun 2019
Beyond the One Step Greedy Approach in Reinforcement Learning Yonathan Efroni Gal Dalal B. Scherrer Shie Mannor OffRL 53 48 0 10 Feb 2018