Offline Policy Selection under Uncertainty

Offline Policy Selection under Uncertainty

12 December 2020

Dale Schuurmans

Papers citing "Offline Policy Selection under Uncertainty"

12 / 12 papers shown

Title
Hyperparameter Optimization Can Even be Harmful in Off-Policy Learning and How to Deal with It Yuta Saito Masahiro Nomura OffRL 50 2 0 23 Apr 2024
Active Policy Improvement from Multiple Black-box Oracles Xuefeng Liu Takuma Yoneda Chaoqi Wang Matthew R. Walter Yuxin Chen 39 9 0 17 Jun 2023
HOPE: Human-Centric Off-Policy Evaluation for E-Learning and Healthcare Ge Gao Song Ju Markel Sanz Ausin Min Chi OffRL 29 8 0 18 Feb 2023
Variational Latent Branching Model for Off-Policy Evaluation Qitong Gao Ge Gao Min Chi Miroslav Pajic OffRL 36 6 0 28 Jan 2023
Discriminator-Weighted Offline Imitation Learning from Suboptimal Demonstrations Haoran Xu Xianyuan Zhan Honglei Yin Huiling Qin OffRL 26 66 0 20 Jul 2022
LobsDICE: Offline Learning from Observation via Stationary Distribution Correction Estimation Geon-hyeong Kim Jongmin Lee Youngsoo Jang Hongseok Yang Kyungmin Kim OffRL 33 15 0 28 Feb 2022
Pessimistic Model Selection for Offline Deep Reinforcement Learning Chao-Han Huck Yang Zhengling Qi Yifan Cui Pin-Yu Chen OffRL 39 4 0 29 Nov 2021
Provably Efficient Representation Selection in Low-rank Markov Decision Processes: From Online to Offline RL Weitong Zhang Jiafan He Dongruo Zhou Amy Zhang Quanquan Gu OffRL 22 11 0 22 Jun 2021
A Minimalist Approach to Offline Reinforcement Learning Scott Fujimoto S. Gu OffRL 58 788 0 12 Jun 2021
Universal Off-Policy Evaluation Yash Chandak S. Niekum Bruno C. da Silva Erik Learned-Miller Emma Brunskill Philip S. Thomas OffRL ELM 36 52 0 26 Apr 2021
Double Reinforcement Learning for Efficient Off-Policy Evaluation in Markov Decision Processes Nathan Kallus Masatoshi Uehara OffRL 41 183 0 22 Aug 2019
Bayesian Inference with Posterior Regularization and applications to Infinite Latent SVMs Jun Zhu Ning Chen Eric Xing BDL 67 157 0 05 Oct 2012