Data-Efficient Off-Policy Policy Evaluation for Reinforcement Learning

4 April 2016

Papers citing "Data-Efficient Off-Policy Policy Evaluation for Reinforcement Learning"

50 / 342 papers shown

Title
DOLCE: Decomposing Off-Policy Evaluation/Learning into Lagged and Current Effects Shu Tamano Masanori Nojima OffRL 42 0 0 02 May 2025
Reinforcement Learning with Continuous Actions Under Unmeasured Confounding Yuhan Li Eugene Han Yifan Hu Wenzhuo Zhou Zhengling Qi Yifan Cui Ruoqing Zhu OffRL 245 0 0 01 May 2025
Towards Optimal Offline Reinforcement Learning Mengmeng Li Daniel Kuhn Tobias Sutter OffRL 70 0 0 15 Mar 2025
Seldonian Reinforcement Learning for Ad Hoc Teamwork Edoardo Zorzi A. Castellini Leonidas Bakopoulos Georgios Chalkiadakis Alessandro Farinelli OffRL 60 0 0 05 Mar 2025
Statistical Tractability of Off-policy Evaluation of History-dependent Policies in POMDPs Yuheng Zhang Nan Jiang OffRL 63 0 0 03 Mar 2025
Clustering Context in Off-Policy Evaluation Daniel Guzman-Olivares Philipp Schmidt Jacek Golebiowski Artur Bekasov CML OffRL 54 0 0 28 Feb 2025
WOFOSTGym: A Crop Simulator for Learning Annual and Perennial Crop Management Strategies William Solow Sandhya Saisubramanian Alan Fern OffRL 76 0 0 26 Feb 2025
Statistical Inference in Reinforcement Learning: A Selective Survey Chengchun Shi OffRL 74 1 0 22 Feb 2025
Two-way Deconfounder for Off-policy Evaluation in Causal Reinforcement Learning Shuguang Yu Shuxing Fang Ruixin Peng Zhengling Qi Fan Zhou C. Shi CML OffRL 85 1 0 08 Dec 2024
Concept-driven Off Policy Evaluation Ritam Majumdar Jack Teversham Sonali Parbhoo OffRL 81 0 0 28 Nov 2024
Off-policy estimation with adaptively collected data: the power of online learning Jeonghwan Lee Cong Ma OffRL 81 0 0 19 Nov 2024
Hybrid Transfer Reinforcement Learning: Provable Sample Efficiency from Shifted-Dynamics Data Chengrui Qu Laixi Shi Kishan Panaganti Pengcheng You Adam Wierman OffRL OnRL 40 0 0 06 Nov 2024
Off-Policy Selection for Initiating Human-Centric Experimental Design Ge Gao Xi Yang Qitong Gao Song Ju Miroslav Pajic Min Chi OffRL 46 0 0 26 Oct 2024
Primal-Dual Spectral Representation for Off-policy Evaluation Yang Hu Tianyi Chen Na Li Kai Wang Bo Dai OffRL 43 0 0 23 Oct 2024
Abstract Reward Processes: Leveraging State Abstraction for Consistent Off-Policy Evaluation Shreyas Chaudhari Ameet Deshpande Bruno Castro da Silva Philip S. Thomas OffRL 39 1 0 03 Oct 2024
Doubly Optimal Policy Evaluation for Reinforcement Learning Shuze Liu Claire Chen Shangtong Zhang OffRL 48 2 0 03 Oct 2024
Exploratory Optimal Stopping: A Singular Control Formulation Jodi Dianetti Giorgio Ferrari Renyuan Xu 35 3 0 18 Aug 2024
Empowering Clinicians with Medical Decision Transformers: A Framework for Sepsis Treatment A. Rahman Pranav Agarwal R. Noumeir P. Jouvet Vincent Michalski Samira Ebrahimi Kahou OffRL 37 0 0 28 Jul 2024
Causal Deepsets for Off-policy Evaluation under Spatial or Spatio-temporal Interferences Runpeng Dai Jianing Wang Fan Zhou Shuang Luo Zhiwei Qin Chengchun Shi Hongtu Zhu CML OffRL 40 0 0 25 Jul 2024
Pessimism Meets Risk: Risk-Sensitive Offline Reinforcement Learning Dake Zhang Boxiang Lyu Shuang Qiu Mladen Kolar Tong Zhang OffRL 43 0 0 10 Jul 2024
Short-Long Policy Evaluation with Novel Actions Hyunji Alex Nam Yash Chandak Emma Brunskill OffRL 29 0 0 04 Jul 2024
AutoOPE: Automated Off-Policy Estimator Selection Nicolò Felicioni Michael Benigni Maurizio Ferrari Dacrema OffRL 26 1 0 26 Jun 2024
Combining Experimental and Historical Data for Policy Evaluation Ting Li Chengchun Shi Qianglin Wen Yang Sui Yongli Qin Chunbo Lai Hongtu Zhu OffRL 50 0 0 01 Jun 2024
OMPO: A Unified Framework for RL under Policy and Dynamics Shifts Yu-Juan Luo Tianying Ji Gang Hua Jianwei Zhang Huazhe Xu Xianyuan Zhan OffRL 66 3 0 29 May 2024
DTR-Bench: An in silico Environment and Benchmark Platform for Reinforcement Learning Based Dynamic Treatment Regime Zhiyao Luo Mingcheng Zhu Fenglin Liu Jiali Li Yangchen Pan Jiandong Zhou Tingting Zhu OffRL 48 3 0 28 May 2024
OPERA: Automatic Offline Policy Evaluation with Re-weighted Aggregates of Multiple Estimators Allen Nie Yash Chandak Christina J. Yuan Anirudhan Badrinath Yannis Flet-Berliac Emma Brunskil OffRL 55 0 0 27 May 2024
A/B testing under Interference with Partial Network Information Shiv Shankar Ritwik Sinha Yash Chandak Saayan Mitra M. Fiterau 33 2 0 16 Apr 2024
Doubly-Robust Off-Policy Evaluation with Estimated Logging Policy Kyungbok Lee M. Paik OffRL 25 0 0 02 Apr 2024
Spatially Randomized Designs Can Enhance Policy Evaluation Ying Yang Chengchun Shi Fang Yao Shouyang Wang Hongtu Zhu OffRL 50 0 0 18 Mar 2024
Monitoring Fidelity of Online Reinforcement Learning Algorithms in Clinical Trials Anna L. Trella Kelly W. Zhang Inbal Nahum-Shani Vivek Shetty Iris Yan Finale Doshi-Velez Susan A. Murphy OffRL OnRL 42 3 0 26 Feb 2024
On the Curses of Future and History in Future-dependent Value Functions for Off-policy Evaluation Yuheng Zhang Nan Jiang OffRL 38 4 0 22 Feb 2024
Offline Multi-task Transfer RL with Representational Penalization Avinandan Bose S. S. Du Maryam Fazel OffRL 62 12 0 19 Feb 2024
Off-Policy Evaluation in Markov Decision Processes under Weak Distributional Overlap Mohammad Mehrabi Stefan Wager OffRL 36 14 0 13 Feb 2024
POTEC: Off-Policy Learning for Large Action Spaces via Two-Stage Policy Decomposition Yuta Saito Jihan Yao Thorsten Joachims OffRL 34 6 0 09 Feb 2024
Distributionally Robust Policy Evaluation under General Covariate Shift in Contextual Bandits Yi Guo Hao Liu Yisong Yue Anqi Liu OffRL 31 1 0 21 Jan 2024
Conservative Exploration for Policy Optimization via Off-Policy Policy Evaluation Paul Daoudi Mathias Formoso Othman Gaizi Achraf Azize Evrard Garcelon OffRL 31 0 0 24 Dec 2023
Probabilistic Offline Policy Ranking with Approximate Bayesian Computation Longchao Da Porter Jenkins Trevor Schwantes Jeffrey Dotson Hua Wei OffRL 32 2 0 17 Dec 2023
When is Offline Policy Selection Sample Efficient for Reinforcement Learning? Vincent Liu P. Nagarajan Andrew Patterson Martha White OffRL 39 2 0 04 Dec 2023
Marginal Density Ratio for Off-Policy Evaluation in Contextual Bandits Muhammad Faaiz Taufiq Arnaud Doucet Rob Cornish Jean-François Ton OffRL 36 7 0 03 Dec 2023
Evaluation of Active Feature Acquisition Methods for Time-varying Feature Settings Henrik von Kleist Alireza Zamanian I. Shpitser Narges Ahmidi OffRL 39 2 0 03 Dec 2023
Towards Assessing and Benchmarking Risk-Return Tradeoff of Off-Policy Evaluation Haruka Kiyohara Ren Kishimoto K. Kawakami Ken Kobayashi Kazuhide Nakata Yuta Saito OffRL 34 9 0 30 Nov 2023
SCOPE-RL: A Python Library for Offline Reinforcement Learning and Off-Policy Evaluation Haruka Kiyohara Ren Kishimoto K. Kawakami Ken Kobayashi Kazuhide Nakata Yuta Saito OffRL ELM 42 4 0 30 Nov 2023
Robust Offline Reinforcement learning with Heavy-Tailed Rewards Jin Zhu Runzhe Wan Zhengling Qi Shuang Luo C. Shi OffRL 47 0 0 28 Oct 2023
State-Action Similarity-Based Representations for Off-Policy Evaluation Brahma S. Pavse Josiah P. Hanna OffRL 45 4 0 27 Oct 2023
Counterfactual-Augmented Importance Sampling for Semi-Offline Policy Evaluation Shengpu Tang Jenna Wiens OffRL CML 21 4 0 26 Oct 2023
Off-Policy Evaluation for Large Action Spaces via Policy Convolution Noveen Sachdeva Lequn Wang Dawen Liang Nathan Kallus Julian McAuley OffRL 43 12 0 24 Oct 2023
Fractal Landscapes in Policy Optimization Tao Wang Sylvia Herbert Sicun Gao 34 5 0 24 Oct 2023
Sample Complexity of Preference-Based Nonparametric Off-Policy Evaluation with Deep Networks Zihao Li Xiang Ji Minshuo Chen Mengdi Wang OffRL 49 0 0 16 Oct 2023
Off-Policy Evaluation for Human Feedback Qitong Gao Ge Gao Juncheng Dong Vahid Tarokh Min Chi Miroslav Pajic OffRL 29 5 0 11 Oct 2023
When is Agnostic Reinforcement Learning Statistically Tractable? Zeyu Jia Gene Li Alexander Rakhlin Ayush Sekhari Nathan Srebro OffRL 42 5 0 09 Oct 2023