Offline Policy Optimization in RL with Variance Regularizaton

Offline Policy Optimization in RL with Variance Regularizaton

29 December 2022

Homanga Bharadhwaj

Samin Yeasar Arnob

Papers citing "Offline Policy Optimization in RL with Variance Regularizaton"

9 / 9 papers shown

Title
Conservative Q-Learning for Offline Reinforcement Learning Aviral Kumar Aurick Zhou George Tucker Sergey Levine OffRL OnRL 78 1,780 0 08 Jun 2020
D4RL: Datasets for Deep Data-Driven Reinforcement Learning Justin Fu Aviral Kumar Ofir Nachum George Tucker Sergey Levine GP OffRL 161 1,338 0 15 Apr 2020
Provably Efficient Safe Exploration via Primal-Dual Policy Optimization Dongsheng Ding Xiaohan Wei Zhuoran Yang Zhaoran Wang M. Jovanović 56 162 0 01 Mar 2020
AlgaeDICE: Policy Gradient from Arbitrary Experience Ofir Nachum Bo Dai Ilya Kostrikov Yinlam Chow Lihong Li Dale Schuurmans OffRL 35 240 0 04 Dec 2019
DualDICE: Behavior-Agnostic Estimation of Discounted Stationary Distribution Corrections Ofir Nachum Yinlam Chow Bo Dai Lihong Li OffRL 54 332 0 10 Jun 2019
Stabilizing Off-Policy Q-Learning via Bootstrapping Error Reduction Aviral Kumar Justin Fu George Tucker Sergey Levine OffRL OnRL 61 1,044 0 03 Jun 2019
Deep Reinforcement Learning that Matters Peter Henderson Riashat Islam Philip Bachman Joelle Pineau Doina Precup David Meger OffRL 87 1,940 0 19 Sep 2017
Constrained Policy Optimization Joshua Achiam David Held Aviv Tamar Pieter Abbeel 72 1,313 0 30 May 2017
Continuous control with deep reinforcement learning Timothy Lillicrap Jonathan J. Hunt Alexander Pritzel N. Heess Tom Erez Yuval Tassa David Silver Daan Wierstra 125 13,174 0 09 Sep 2015