Data-Efficient Policy Evaluation Through Behavior Policy Search

International Conference on Machine Learning (ICML), 2017

12 June 2017

Papers citing "Data-Efficient Policy Evaluation Through Behavior Policy Search"

16 / 16 papers shown

Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive ApproachNeural Information Processing Systems (NeurIPS), 2024

Riccardo Poiani

Nicole Nobili

Alberto Maria Metelli

Marcello Restelli

190

17 Oct 2024

Efficient Policy Evaluation with Safety Constraint for Reinforcement Learning

917

08 Oct 2024

Doubly Optimal Policy Evaluation for Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2024

491

03 Oct 2024

Adaptive Exploration for Data-Efficient General Value Function EvaluationsNeural Information Processing Systems (NeurIPS), 2024

Arushi Jain

Josiah P. Hanna

Doina Precup

260

13 May 2024

Policy Gradient with Active Importance Sampling

Matteo Papini

Giorgio Manganini

Alberto Maria Metelli

Marcello Restelli

OffRL

204

09 May 2024

Efficient Open-world Reinforcement Learning via Knowledge Distillation and Autonomous Rule Discovery

260

24 Nov 2023

ReVar: Strengthening Policy Evaluation via Reduced Variance SamplingConference on Uncertainty in Artificial Intelligence (UAI), 2022

384

09 Mar 2022

Robust On-Policy Sampling for Data-Efficient Policy Evaluation in Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2021

298

29 Nov 2021

Deep Reinforcement Learning for the Control of Robotic Manipulation: A Focussed Mini-Review

224

190

08 Feb 2021

Beyond variance reduction: Understanding the true impact of baselines on policy optimizationInternational Conference on Machine Learning (ICML), 2020

Nicolas Le Roux

523

31 Aug 2020

Causality and Batch Reinforcement Learning: Complementary Approaches To Planning In Unknown Domains

196

03 Jun 2020

Reinforcement Learning Architectures: SAC, TAC, and ESAC

Ala’eddin Masadeh

Zhengdao Wang

A. Kamal

05 Apr 2020

Curriculum Learning for Reinforcement Learning Domains: A Framework and SurveyJournal of machine learning research (JMLR), 2020

579

666

10 Mar 2020

TuneNet: One-Shot Residual Tuning for System Identification and Sim-to-Real Robot Task TransferConference on Robot Learning (CoRL), 2019

Adam Allevato

Elaine Schaertl Short

Mitch Pryor

A. Thomaz

496

25 Jul 2019

Provably Efficient Q-Learning with Low Switching CostNeural Information Processing Systems (NeurIPS), 2019

321

102

30 May 2019

Importance Sampling Policy Evaluation with an Estimated Behavior Policy

371

04 Jun 2018