v1v2 (latest)

Adaptive Estimator Selection for Off-Policy Evaluation

International Conference on Machine Learning (ICML), 2020

18 February 2020

Papers citing "Adaptive Estimator Selection for Off-Policy Evaluation"

35 / 35 papers shown

A General Framework for Off-Policy Learning with Partially-Observed RewardInternational Conference on Learning Representations (ICLR), 2025

215

17 Jun 2025

Off-Policy Evaluation of Ranking Policies via Embedding-Space User Behavior Modeling

218

31 May 2025

Clustering Context in Off-Policy EvaluationInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2025

Daniel Guzman-Olivares

217

28 Feb 2025

Off-Policy Selection for Initiating Human-Centric Experimental DesignNeural Information Processing Systems (NeurIPS), 2024

342

26 Oct 2024

Abstract Reward Processes: Leveraging State Abstraction for Consistent Off-Policy EvaluationNeural Information Processing Systems (NeurIPS), 2024

Shreyas Chaudhari

Ameet Deshpande

Bruno Castro da Silva

Philip S. Thomas

OffRL

266

03 Oct 2024

Effective Off-Policy Evaluation and Learning in Contextual Combinatorial BanditsACM Conference on Recommender Systems (RecSys), 2024

Yuta Saito

365

20 Aug 2024

AutoOPE: Automated Off-Policy Estimator Selection

Nicolò Felicioni

Michael Benigni

Maurizio Ferrari Dacrema

OffRL

217

26 Jun 2024

Kernel Metric Learning for In-Sample Off-Policy Evaluation of Deterministic RL Policies

291

29 May 2024

OPERA: Automatic Offline Policy Evaluation with Re-weighted Aggregates of Multiple Estimators

293

27 May 2024

Cross-Validated Off-Policy Evaluation

363

24 May 2024

POTEC: Off-Policy Learning for Large Action Spaces via Two-Stage Policy Decomposition

341

09 Feb 2024

Off-Policy Evaluation of Slate Bandit Policies via Optimizing Abstraction

Haruka Kiyohara

Masahiro Nomura

Yuta Saito

703

03 Feb 2024

When is Offline Policy Selection Sample Efficient for Reinforcement Learning?

Martha White

433

04 Dec 2023

Towards Assessing and Benchmarking Risk-Return Tradeoff of Off-Policy EvaluationInternational Conference on Learning Representations (ICLR), 2023

520

30 Nov 2023

SCOPE-RL: A Python Library for Offline Reinforcement Learning and Off-Policy Evaluation

547

30 Nov 2023

Off-Policy Evaluation for Large Action Spaces via Policy ConvolutionThe Web Conference (WWW), 2023

Julian McAuley

337

24 Oct 2023

Double Clipping: Less-Biased Variance Reduction in Off-Policy Evaluation

Jan Malte Lichtenberg

Alexander K. Buchholz

Giuseppe Di Benedetto

M. Ruffini

Ben London

OffRL

201

03 Sep 2023

Doubly Robust Estimator for Off-Policy Evaluation with Large Action SpacesIEEE Symposium Series on Computational Intelligence (IEEE-SSCI), 2023

Tatsuhiro Shimizu

L. Forastiere

OffRL

262

07 Aug 2023

On (Normalised) Discounted Cumulative Gain as an Off-Policy Evaluation Metric for Top-

n

RecommendationKnowledge Discovery and Data Mining (KDD), 2023

466

27 Jul 2023

Off-Policy Evaluation for Large Action Spaces via Conjunct Effect ModelingInternational Conference on Machine Learning (ICML), 2023

355

14 May 2023

Policy-Adaptive Estimator Selection for Off-Policy EvaluationAAAI Conference on Artificial Intelligence (AAAI), 2022

299

25 Nov 2022

Oracle Inequalities for Model Selection in Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

391

03 Nov 2022

Local Metric Learning for Off-Policy Evaluation in Contextual Bandits with Continuous ActionsNeural Information Processing Systems (NeurIPS), 2022

330

24 Oct 2022

Data-Efficient Pipeline for Offline Reinforcement Learning with Limited DataNeural Information Processing Systems (NeurIPS), 2022

351

16 Oct 2022

Off-policy evaluation for learning-to-rank via interpolating the item-position model and the position-based model

Alexander K. Buchholz

Ben London

Giuseppe Di Benedetto

Thorsten Joachims

OffRL

206

15 Oct 2022

Off-Policy Evaluation for Large Action Spaces via EmbeddingsInternational Conference on Machine Learning (ICML), 2022

Yuta Saito

Thorsten Joachims

OffRL

292

13 Feb 2022

Model Selection in Batch Policy OptimizationInternational Conference on Machine Learning (ICML), 2021

252

23 Dec 2021

Pessimistic Model Selection for Offline Deep Reinforcement LearningConference on Uncertainty in Artificial Intelligence (UAI), 2021

320

29 Nov 2021

Off-Policy Evaluation in Partially Observed Markov Decision Processes under Sequential IgnorabilityAnnals of Statistics (Ann. Stat.), 2021

Yupeng Tang

Seung-seob Lee

OffRL

410

24 Oct 2021

Evaluating the Robustness of Off-Policy EvaluationACM Conference on Recommender Systems (RecSys), 2021

321

31 Aug 2021

Improving Long-Term Metrics in Recommendation Systems using Short-Horizon Reinforcement Learning

268

01 Jun 2021

Deeply-Debiased Off-Policy Interval EstimationInternational Conference on Machine Learning (ICML), 2021

270

10 May 2021

Optimal Mixture Weights for Off-Policy Evaluation with Multiple Behavior Policies

29 Nov 2020

Deep Jump Learning for Off-Policy Evaluation in Continuous Treatment SettingsNeural Information Processing Systems (NeurIPS), 2020

397

29 Oct 2020

Optimal Off-Policy Evaluation from Multiple Logging Policies

354

21 Oct 2020