v1v2v3 (latest)

Off-Policy Evaluation and Learning for External Validity under a Covariate Shift

Neural Information Processing Systems (NeurIPS), 2020

26 February 2020

Papers citing "Off-Policy Evaluation and Learning for External Validity under a Covariate Shift"

28 / 28 papers shown

Semi-Supervised Treatment Effect Estimation with Unlabeled Covariates via Generalized Riesz Regression

Masahiro Kato

CML

288

11 Nov 2025

Nearest Neighbor Matching as Least Squares Density Ratio Estimation and Riesz Regression

Masahiro Kato

125

28 Oct 2025

Direct Debiased Machine Learning via Bregman Divergence Minimization

Masahiro Kato

CML

419

27 Oct 2025

Two-sample comparison through additive tree models for density ratios

Naoki Awaya

Yuliang Xu

Li Ma

239

05 Aug 2025

Doubly Robust Alignment for Large Language Models

347

01 Jun 2025

Active Adaptive Experimental Design for Treatment Effect Estimation with Covariate Choices

375

06 Mar 2024

Distributionally Robust Policy Evaluation under General Covariate Shift in Contextual Bandits

296

21 Jan 2024

Sample Complexity of Preference-Based Nonparametric Off-Policy Evaluation with Deep Networks

Mengdi Wang

292

16 Oct 2023

Federated Learning under Covariate Shifts with Generalization Guarantees

367

08 Jun 2023

MAGDiff: Covariate Data Set Shift Detection via Activation Graphs of Deep Neural Networks

172

22 May 2023

Learning Complementary Policies for Human-AI Teams

Ruijiang Gao

M. Saar-Tsechansky

Maria De-Arteaga

349

06 Feb 2023

Offline Minimax Soft-Q-learning Under Realizability and Partial CoverageNeural Information Processing Systems (NeurIPS), 2023

372

05 Feb 2023

Counterfactual Learning with Multioutput Deep Kernels

226

20 Nov 2022

Bayesian Counterfactual Mean Embeddings and Off-Policy Evaluation

Diego Martinez-Taboada

Dino Sejdinovic

CML OffRL

166

02 Nov 2022

Unified Perspective on Probability Divergence via Maximum Likelihood Density Ratio Estimation: Bridging KL-Divergence and Integral Probability Metrics

Masahiro Kato

Masaaki Imaizumi

Kentaro Minami

222

31 Jan 2022

Generalizing Off-Policy Learning under Sample Selection Bias

198

02 Dec 2021

Rejoinder: Learning Optimal Distributionally Robust Individualized Treatment Rules

Weibin Mo

Zhengling Qi

Yufeng Liu

125

17 Oct 2021

Evaluating the Robustness of Off-Policy EvaluationACM Conference on Recommender Systems (RecSys), 2021

278

31 Aug 2021

Combining Online Learning and Offline Learning for Contextual Bandits with Deficient Support

Thanh Nguyen-Tang

174

24 Jul 2021

Optimal Uniform OPE and Model-based Offline Reinforcement Learning in Time-Homogeneous, Reward-Free and Task-Agnostic SettingsNeural Information Processing Systems (NeurIPS), 2021

Ming Yin

Yu Wang

OffRL

313

13 May 2021

Learning Under Adversarial and Interventional Shifts

Harvineet Singh

Shalmali Joshi

Finale Doshi-Velez

Himabindu Lakkaraju

OOD

193

29 Mar 2021

Reliable Off-policy Evaluation for Reinforcement Learning

445

08 Nov 2020

Off-Policy Evaluation of Bandit Algorithm from Dependent Samples under Batch Update Policy

Masahiro Kato

Yusuke Kaneko

OffRL

232

23 Oct 2020

A Practical Guide of Off-Policy Evaluation for Bandit Problems

212

23 Oct 2020

Open Bandit Dataset and Pipeline: Towards Realistic and Reproducible Off-Policy Evaluation

711

17 Aug 2020

Confidence Interval for Off-Policy Evaluation from Dependent Samples via Bandit Algorithm: Approach from Standardized Martingales

Masahiro Kato

OffRL

195

12 Jun 2020

Non-Negative Bregman Divergence Minimization for Deep Direct Density Ratio EstimationInternational Conference on Machine Learning (ICML), 2020

Masahiro Kato

Takeshi Teshima

432

12 Jun 2020

Counterfactual Mean Embeddings

346

22 May 2018