Confidence Interval for Off-Policy Evaluation from Dependent Samples via Bandit Algorithm: Approach from Standardized Martingales

12 June 2020

Papers citing "Confidence Interval for Off-Policy Evaluation from Dependent Samples via Bandit Algorithm: Approach from Standardized Martingales"

1 / 1 papers shown

Title
More Efficient Off-Policy Evaluation through Regularized Targeted Learning Aurélien F. Bibaut Ivana Malenica N. Vlassis Mark van der Laan OOD OffRL 27 40 0 13 Dec 2019