Off-Policy Deep Reinforcement Learning without Exploration

Off-Policy Deep Reinforcement Learning without Exploration

7 December 2018

Papers citing "Off-Policy Deep Reinforcement Learning without Exploration"

15 / 415 papers shown

Title
Off-Policy Deep Reinforcement Learning with Analogous Disentangled Exploration Hoang Trung-Dung Yitao Liang Guy Van den Broeck OffRL 42 3 0 25 Feb 2020
Keep Doing What Worked: Behavioral Modelling Priors for Offline Reinforcement Learning Noah Y. Siegel Jost Tobias Springenberg Felix Berkenkamp A. Abdolmaleki Michael Neunert Thomas Lampe Roland Hafner Nicolas Heess Martin Riedmiller OffRL 22 282 0 19 Feb 2020
BRPO: Batch Residual Policy Optimization Kentaro Kanamori Yinlam Chow Takuya Takagi Hiroki Arimura Honglak Lee Ken Kobayashi Craig Boutilier OffRL 146 46 0 08 Feb 2020
Minimax Value Interval for Off-Policy Evaluation and Policy Optimization Nan Jiang Jiawei Huang OffRL 46 17 0 06 Feb 2020
Learning to Reach Goals via Iterated Supervised Learning Dibya Ghosh Abhishek Gupta Ashwin Reddy Justin Fu Coline Devin Benjamin Eysenbach Sergey Levine 37 34 0 12 Dec 2019
Optimism in Reinforcement Learning with Generalized Linear Function Approximation Yining Wang Ruosong Wang S. Du A. Krishnamurthy 139 135 0 09 Dec 2019
Adaptive Online Planning for Continual Lifelong Learning Kevin Lu Igor Mordatch Pieter Abbeel OffRL OnRL CLL 16 15 0 03 Dec 2019
Empirical Study of Off-Policy Policy Evaluation for Reinforcement Learning Cameron Voloshin Hoang Minh Le Nan Jiang Yisong Yue OffRL 35 153 0 15 Nov 2019
IRIS: Implicit Reinforcement without Interaction at Scale for Learning Control from Offline Robot Manipulation Data Ajay Mandlekar Fabio Ramos Byron Boots Silvio Savarese Li Fei-Fei Animesh Garg Dieter Fox OffRL 34 117 0 13 Nov 2019
BAIL: Best-Action Imitation Learning for Batch Deep Reinforcement Learning Xinyue Chen Zijian Zhou Ziyi Wang Che Wang Yanqiu Wu Keith Ross OffRL 39 121 0 27 Oct 2019
Benchmarking Batch Deep Reinforcement Learning Algorithms Shih-Han Chou Wen-Yen Chang W. Hsu Jianlong Fu OffRL 27 182 0 03 Oct 2019
Advantage-Weighted Regression: Simple and Scalable Off-Policy Reinforcement Learning Xue Bin Peng Aviral Kumar Grace Zhang Sergey Levine OffRL 91 546 0 01 Oct 2019
Meta-Q-Learning Rasool Fakoor Pratik Chaudhari Stefano Soatto Alex Smola OffRL 40 145 0 30 Sep 2019
Scaling data-driven robotics with reward sketching and batch reinforcement learning Serkan Cabi Sergio Gomez Colmenarejo Alexander Novikov Ksenia Konyushkova Scott E. Reed ... David Barker Jonathan Scholz Misha Denil Nando de Freitas Ziyun Wang OffRL 33 29 0 26 Sep 2019
Way Off-Policy Batch Deep Reinforcement Learning of Implicit Human Preferences in Dialog Natasha Jaques Asma Ghandeharioun J. Shen Craig Ferguson Àgata Lapedriza Noah J. Jones S. Gu Rosalind W. Picard OffRL 50 338 0 30 Jun 2019