v1v2 (latest)

Conservative Exploration in Reinforcement Learning

International Conference on Artificial Intelligence and Statistics (AISTATS), 2020

8 February 2020

Papers citing "Conservative Exploration in Reinforcement Learning"

19 / 19 papers shown

Best of Both Worlds: Regret Minimization versus Minimax Play

260

17 Feb 2025

Conservative Exploration for Policy Optimization via Off-Policy Policy Evaluation

233

24 Dec 2023

Anytime-Competitive Reinforcement Learning with Policy PriorNeural Information Processing Systems (NeurIPS), 2023

Adam Wierman

342

02 Nov 2023

Near-optimal Conservative Exploration in Reinforcement Learning under Episode-wise ConstraintsInternational Conference on Machine Learning (ICML), 2023

305

09 Jun 2023

Learning for Edge-Weighted Online Bipartite Matching with Robustness GuaranteesInternational Conference on Machine Learning (ICML), 2023

Pengfei Li

Jianyi Yang

Shaolei Ren

OffRL

234

31 May 2023

Leveraging User-Triggered Supervision in Contextual Bandits

Alekh Agarwal

Claudio Gentile

T. V. Marinov

204

07 Feb 2023

Safe Exploration Incurs Nearly No Additional Sample Complexity for Reward-free RLInternational Conference on Learning Representations (ICLR), 2022

326

28 Jun 2022

Exploration in Deep Reinforcement Learning: A SurveyInformation Fusion (Inf. Fusion), 2022

391

541

02 May 2022

Recent Advances in Reinforcement Learning in Finance

606

262

08 Dec 2021

Explicit Explore, Exploit, or Escape (

E^4

): near-optimal safety-constrained reinforcement learning in polynomial timeMachine-mediated learning (ML), 2021

David M. Bossens

Nick Bishop

366

14 Nov 2021

Uniformly Conservative Exploration in Reinforcement LearningInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2021

164

25 Oct 2021

Bandit Algorithms for Precision Medicine

Yangyi Lu

Ziping Xu

Ambuj Tewari

286

10 Aug 2021

A Reduction-Based Framework for Conservative Bandits and Reinforcement Learning

242

22 Jun 2021

Safe Reinforcement Learning with Linear Function ApproximationInternational Conference on Machine Learning (ICML), 2021

Sanae Amani

Christos Thrampoulidis

Lin F. Yang

219

11 Jun 2021

Online certification of preference-based fairness for personalized recommender systemsAAAI Conference on Artificial Intelligence (AAAI), 2021

Jamal Atif

331

29 Apr 2021

Conservative Optimistic Policy Optimization via Multiple Importance Sampling

Achraf Azize

Othman Gaizi

OffRL

113

04 Mar 2021

A Provably Efficient Sample Collection Strategy for Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2020

316

13 Jul 2020

Exploration-Exploitation in Constrained MDPs

Yonathan Efroni

Shie Mannor

Matteo Pirotta

432

207

04 Mar 2020

Smoothing Policies and Safe Policy GradientsMachine-mediated learning (ML), 2019

Matteo Papini

Matteo Pirotta

Marcello Restelli

331

08 May 2019