v1v2 (latest)

Sample-Efficient Reinforcement Learning with loglog(T) Switching Cost

International Conference on Machine Learning (ICML), 2022

13 February 2022

Ming Yin

Papers citing "Sample-Efficient Reinforcement Learning with loglog(T) Switching Cost"

16 / 16 papers shown

The Adaptivity Barrier in Batched Nonparametric Bandits: Sharp Characterization of the Price of Unknown Margin

Rong Jiang

Cong Ma

209

05 Nov 2025

A Tutorial: An Intuitive Explanation of Offline Reinforcement Learning Theory

Fengdi Che

OffRL

184

11 Aug 2025

Gap-Dependent Bounds for Q-Learning using Reference-Advantage DecompositionInternational Conference on Learning Representations (ICLR), 2024

447

10 Oct 2024

To Switch or Not to Switch? Balanced Policy Switching in Offline Reinforcement Learning

415

01 Jul 2024

Batched Nonparametric Contextual Bandits

Rong Jiang

Cong Ma

OffRL

538

27 Feb 2024

Policy Finetuning in Reinforcement Learning via Design of Experiments using Offline DataNeural Information Processing Systems (NeurIPS), 2023

Ruiqi Zhang

Andrea Zanette

OffRL OnRL

341

10 Jul 2023

Regret-Optimal Model-Free Reinforcement Learning for Discounted MDPs with Short Burn-In TimeNeural Information Processing Systems (NeurIPS), 2023

Xiang Ji

Gen Li

OffRL

431

24 May 2023

Minimax-Optimal Reward-Agnostic Exploration in Reinforcement LearningAnnual Conference Computational Learning Theory (COLT), 2023

370

14 Apr 2023

A Reduction-based Framework for Sequential Decision Making with Delayed FeedbackNeural Information Processing Systems (NeurIPS), 2023

601

03 Feb 2023

Near-Optimal Differentially Private Reinforcement LearningInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2022

Dan Qiao

Yu Wang

368

09 Dec 2022

Near-Optimal Regret Bounds for Multi-batch Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

258

15 Oct 2022

Offline Reinforcement Learning with Differentiable Function Approximation is Provably Efficient

Ming Yin

Mengdi Wang

Yu Wang

OffRL

418

03 Oct 2022

Near-Optimal Deployment Efficiency in Reward-Free Reinforcement Learning with Linear Function ApproximationInternational Conference on Learning Representations (ICLR), 2022

Dan Qiao

Yu Wang

OffRL

338

03 Oct 2022

Doubly Fair Dynamic PricingInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2022

Jianyu Xu

Dan Qiao

Yu Wang

319

23 Sep 2022

Offline Reinforcement Learning with Differential PrivacyNeural Information Processing Systems (NeurIPS), 2022

Dan Qiao

Yu Wang

OffRL

438

02 Jun 2022

Online Sub-Sampling for Reinforcement Learning with General Function Approximation

277

14 Jun 2021