Safe Policy Improvement with Baseline Bootstrapping

19 December 2017

Papers citing "Safe Policy Improvement with Baseline Bootstrapping"

5 / 55 papers shown

Title
BRPO: Batch Residual Policy Optimization Kentaro Kanamori Yinlam Chow Takuya Takagi Hiroki Arimura Honglak Lee Ken Kobayashi Craig Boutilier OffRL 141 46 0 08 Feb 2020
Benchmarking Batch Deep Reinforcement Learning Algorithms Shih-Han Chou Wen-Yen Chang W. Hsu Jianlong Fu OffRL 15 181 0 03 Oct 2019
Beyond Confidence Regions: Tight Bayesian Ambiguity Sets for Robust MDPs Marek Petrik R. Russel 19 61 0 20 Feb 2019
Constrained Policy Improvement for Safe and Efficient Reinforcement Learning Elad Sarafian Aviv Tamar Sarit Kraus OffRL 32 11 0 20 May 2018
Pixel Recurrent Neural Networks Aaron van den Oord Nal Kalchbrenner Koray Kavukcuoglu SSeg GAN 272 2,552 0 25 Jan 2016