v1v2 (latest)

Importance Resampling for Off-policy Prediction

Neural Information Processing Systems (NeurIPS), 2019

11 June 2019

Papers citing "Importance Resampling for Off-policy Prediction"

29 / 29 papers shown

PipelineRL: Faster On-policy Reinforcement Learning for Long Sequence Generation

164

23 Sep 2025

Two-way Deconfounder for Off-policy Evaluation in Causal Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2024

286

08 Dec 2024

Kernel Metric Learning for In-Sample Off-Policy Evaluation of Deterministic RL Policies

198

29 May 2024

Saturn: Sample-efficient Generative Molecular Design using Memory Manipulation

Jeff Guo

Philippe Schwaller

Mamba

249

27 May 2024

Bayesian Off-Policy Evaluation and Learning for Large Action Spaces

Imad Aouali

Victor-Emmanuel Brunel

David Rohde

Anna Korba

OffRL

340

22 Feb 2024

Rankitect: Ranking Architecture Search Battling World-class Engineers at Meta ScaleThe Web Conference (WWW), 2023

...

251

14 Nov 2023

AlberDICE: Addressing Out-Of-Distribution Joint Actions in Offline Multi-Agent RL via Alternating Stationary Distribution Correction EstimationNeural Information Processing Systems (NeurIPS), 2023

Pieter Abbeel

166

03 Nov 2023

K

-Nearest-Neighbor Resampling for Off-Policy Evaluation in Stochastic Control

208

07 Jun 2023

An Instrumental Variable Approach to Confounded Off-Policy EvaluationInternational Conference on Machine Learning (ICML), 2022

292

29 Dec 2022

Actor Prioritized Experience ReplayJournal of Artificial Intelligence Research (JAIR), 2022

Baturay Saglam

Furkan B. Mutlu

Dogan C. Cicek

Suleyman S. Kozat

199

01 Sep 2022

Conformal Off-policy PredictionInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2022

269

14 Jun 2022

Variance Reduction based Partial Trajectory Reuse to Accelerate Policy Gradient Optimization

Hua Zheng

Wei Xie

259

06 May 2022

SOPE: Spectrum of Off-Policy Estimators

225

06 Nov 2021

Variance Reduction based Experience Replay for Policy Optimization

444

17 Oct 2021

Variational Actor-Critic Algorithms

Yuhua Zhu

Lexing Ying

OffRL

139

03 Aug 2021

Scalable Safety-Critical Policy Evaluation with Accelerated Rare Event SamplingIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2021

Ding Zhao

213

19 Jun 2021

Statistical Testing under Distributional Shifts

Niklas Pfister

353

22 May 2021

Learning robust driving policies without online explorationIEEE International Conference on Robotics and Automation (ICRA), 2021

172

15 Mar 2021

Revisiting Prioritized Experience Replay: A Value Perspective

Ang Li

Zongqing Lu

Chenglin Miao

155

05 Feb 2021

Offline Learning of Counterfactual Predictions for Real-World Robotic Reinforcement LearningIEEE International Conference on Robotics and Automation (ICRA), 2020

242

11 Nov 2020

Affordance as general value function: A computational modelAdaptive Behavior (AB), 2020

305

27 Oct 2020

Why resampling outperforms reweighting for correcting sampling bias with stochastic gradients

Jing An

Lexing Ying

Yuhua Zhu

309

28 Sep 2020

Revisiting Fundamentals of Experience ReplayInternational Conference on Machine Learning (ICML), 2020

249

278

13 Jul 2020

An Equivalence between Loss Functions and Non-Uniform Sampling in Experience ReplayNeural Information Processing Systems (NeurIPS), 2020

Scott Fujimoto

David Meger

Doina Precup

239

12 Jul 2020

Learning predictive representations in autonomous driving to improve deep reinforcement learning

174

26 Jun 2020

Off-Policy Deep Reinforcement Learning with Analogous Disentangled ExplorationAdaptive Agents and Multi-Agent Systems (AAMAS), 2020

153

25 Feb 2020

Adaptive Experience Selection for Policy Gradient

S. Mohamad

Giovanni Montana

151

17 Feb 2020

Merging Deterministic Policy Gradient Estimations with Varied Bias-Variance Tradeoff for Effective Deep Reinforcement Learning

Gang Chen

180

24 Nov 2019

Context-Dependent Upper-Confidence Bounds for Directed ExplorationNeural Information Processing Systems (NeurIPS), 2018

220

15 Nov 2018