Off-Policy Estimation of Long-Term Average Outcomes with Applications to
Mobile Health

Off-Policy Estimation of Long-Term Average Outcomes with Applications to Mobile Health

30 December 2019

Papers citing "Off-Policy Estimation of Long-Term Average Outcomes with Applications to Mobile Health"

17 / 17 papers shown

Title
DOLCE: Decomposing Off-Policy Evaluation/Learning into Lagged and Current Effects Shu Tamano Masanori Nojima OffRL 37 0 0 02 May 2025
Reinforcement Learning with Continuous Actions Under Unmeasured Confounding Yuhan Li Eugene Han Yifan Hu Wenzhuo Zhou Zhengling Qi Yifan Cui Ruoqing Zhu OffRL 180 0 0 01 May 2025
Statistical Inference in Reinforcement Learning: A Selective Survey Chengchun Shi OffRL 69 0 0 22 Feb 2025
Spatially Randomized Designs Can Enhance Policy Evaluation Ying Yang Chengchun Shi Fang Yao Shouyang Wang Hongtu Zhu OffRL 43 0 0 18 Mar 2024
Randomization Inference When N Equals One Tengyuan Liang Benjamin Recht CML 35 5 0 25 Oct 2023
A Reinforcement Learning Framework for Dynamic Mediation Analysis Linjuan Ge Jitao Wang C. Shi Zhanghua Wu Rui Song 29 5 0 31 Jan 2023
Quantile Off-Policy Evaluation via Deep Conditional Generative Learning Yang Xu C. Shi Shuang Luo Lan Wang R. Song OffRL 29 4 0 29 Dec 2022
Testing Stationarity and Change Point Detection in Reinforcement Learning Mengbing Li C. Shi Zhanghua Wu Piotr Fryzlewicz OffRL 42 9 0 03 Mar 2022
Off-Policy Confidence Interval Estimation with Confounded Markov Decision Process C. Shi Jin Zhu Ye Shen Shuang Luo Hong Zhu R. Song OffRL 28 30 0 22 Feb 2022
Statistical Learning for Individualized Asset Allocation Yi Ding Yingying Li Rui Song 25 0 0 20 Jan 2022
SOPE: Spectrum of Off-Policy Estimators C. J. Yuan Yash Chandak S. Giguere Philip S. Thomas S. Niekum OffRL 50 5 0 06 Nov 2021
Off-Policy Evaluation in Partially Observed Markov Decision Processes under Sequential Ignorability Yupeng Tang Seung-seob Lee OffRL 52 22 0 24 Oct 2021
Estimating Optimal Infinite Horizon Dynamic Treatment Regimes via pT-Learning Wenzhuo Zhou Ruoqing Zhu Annie Qu 40 22 0 20 Oct 2021
Universal Off-Policy Evaluation Yash Chandak S. Niekum Bruno C. da Silva Erik Learned-Miller Emma Brunskill Philip S. Thomas OffRL ELM 34 52 0 26 Apr 2021
Batch Policy Learning in Average Reward Markov Decision Processes Peng Liao Zhengling Qi Runzhe Wan P. Klasnja S. Murphy OffRL 34 81 0 23 Jul 2020
Minimax Value Interval for Off-Policy Evaluation and Policy Optimization Nan Jiang Jiawei Huang OffRL 41 17 0 06 Feb 2020
A Batch, Off-Policy, Actor-Critic Algorithm for Optimizing the Average Reward S. Murphy Yanzhen Deng Eric B. Laber H. Maei R. Sutton K. Witkiewitz OffRL 33 22 0 18 Jul 2016