v1v2v3v4 (latest)

Exponential Lower Bounds for Batch Reinforcement Learning: Batch RL can be Exponentially Harder than Online RL

International Conference on Machine Learning (ICML), 2020

14 December 2020

Andrea Zanette

OffRL

ArXiv (abs)PDF HTML

Papers citing "Exponential Lower Bounds for Batch Reinforcement Learning: Batch RL can be Exponentially Harder than Online RL"

50 / 53 papers shown

Offline Reinforcement Learning in Large State Spaces: Algorithms and Guarantees

Nan Jiang

Tengyang Xie

OffRL

221

05 Oct 2025

A Tutorial: An Intuitive Explanation of Offline Reinforcement Learning Theory

Fengdi Che

OffRL

172

11 Aug 2025

Central Limit Theorems for Transition Probabilities of Controlled Markov Chains

218

02 Aug 2025

The Role of Inherent Bellman Error in Offline Reinforcement Learning with Linear Function Approximation

Noah Golowich

Ankur Moitra

OffRL

342

17 Jun 2024

Trajectory Data Suffices for Statistically Efficient Learning in Offline RL with Linear

q^π

-Realizability and Concentrability

221

27 May 2024

Experiment Planning with Function ApproximationNeural Information Processing Systems (NeurIPS), 2024

219

10 Jan 2024

Butterfly Effects of SGD Noise: Error Amplification in Behavior Cloning and AutoregressionInternational Conference on Learning Representations (ICLR), 2023

Max Simchowitz

302

17 Oct 2023

When is Agnostic Reinforcement Learning Statistically Tractable?Neural Information Processing Systems (NeurIPS), 2023

345

09 Oct 2023

Sample-Efficiency in Multi-Batch Reinforcement Learning: The Need for Dimension-Dependent AdaptivityInternational Conference on Learning Representations (ICLR), 2023

343

02 Oct 2023

What can online reinforcement learning with function approximation benefit from general coverage conditions?International Conference on Machine Learning (ICML), 2023

282

25 Apr 2023

A Unified Framework of Policy Learning for Contextual Bandit with Confounding Bias and Missing Observations

Siyu Chen

234

20 Mar 2023

VIPeR: Provably Efficient Algorithm for Offline RL with Neural Function ApproximationInternational Conference on Learning Representations (ICLR), 2023

Thanh Nguyen-Tang

R. Arora

OffRL

304

24 Feb 2023

Model-based Offline Reinforcement Learning with Local MisspecificationAAAI Conference on Artificial Intelligence (AAAI), 2023

240

26 Jan 2023

Data-Driven Offline Decision-Making via Invariant Representation LearningNeural Information Processing Systems (NeurIPS), 2022

322

21 Nov 2022

When is Realizability Sufficient for Off-Policy Reinforcement Learning?International Conference on Machine Learning (ICML), 2022

Andrea Zanette

OffRL

347

10 Nov 2022

Oracle Inequalities for Model Selection in Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

364

03 Nov 2022

Optimal Conservative Offline RL with General Function Approximation via Augmented LagrangianInternational Conference on Learning Representations (ICLR), 2022

455

01 Nov 2022

Reliable Conditioning of Behavioral Cloning for Offline Reinforcement Learning

340

11 Oct 2022

Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation

355

14 Sep 2022

Provably Efficient Offline Reinforcement Learning with Trajectory-Wise RewardIEEE Transactions on Information Theory (IEEE Trans. Inf. Theory), 2022

262

13 Jun 2022

Offline Reinforcement Learning with Differential PrivacyNeural Information Processing Systems (NeurIPS), 2022

Dan Qiao

Yu Wang

OffRL

417

02 Jun 2022

Stabilizing Q-learning with Linear Architectures for Provably Efficient LearningInternational Conference on Machine Learning (ICML), 2022

Andrea Zanette

Martin J. Wainwright

OOD

300

01 Jun 2022

Pessimism in the Face of Confounders: Provably Efficient Offline Reinforcement Learning in Partially Observable Markov Decision ProcessesInternational Conference on Learning Representations (ICLR), 2022

414

26 May 2022

$Pessimism for Offline Linear Contextual Bandits using $\ell_p$ Confidence Sets$

Pessimism for Offline Linear Contextual Bandits using

\ell_p

Confidence SetsNeural Information Processing Systems (NeurIPS), 2022

323

21 May 2022

When Should We Prefer Offline Reinforcement Learning Over Behavioral Cloning?

317

100

12 Apr 2022

Bellman Residual Orthogonalization for Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

Andrea Zanette

Martin J. Wainwright

OffRL

502

24 Mar 2022

Near-optimal Offline Reinforcement Learning with Linear Representation: Leveraging Variance Information with PessimismInternational Conference on Learning Representations (ICLR), 2022

Ming Yin

Yaqi Duan

Mengdi Wang

Yu Wang

OffRL

285

11 Mar 2022

A Complete Characterization of Linear Estimators for Offline Policy EvaluationJournal of machine learning research (JMLR), 2022

290

08 Mar 2022

Offline Reinforcement Learning with Realizability and Single-policy ConcentrabilityAnnual Conference Computational Learning Theory (COLT), 2022

654

122

09 Feb 2022

Why Should I Trust You, Bellman? The Bellman Error is a Poor Replacement for Value ErrorInternational Conference on Machine Learning (ICML), 2022

381

28 Jan 2022

Accelerated and instance-optimal policy evaluation with linear function approximationSIAM Journal on Mathematics of Data Science (SIMODS), 2021

236

24 Dec 2021

DR3: Value-Based Deep Reinforcement Learning Requires Explicit Regularization

Aaron Courville

231

09 Dec 2021

The Impact of Data Distribution on Q-learning with Function Approximation

265

23 Nov 2021

Offline Reinforcement Learning: Fundamental Barriers for Value Function ApproximationAnnual Conference Computational Learning Theory (COLT), 2021

334

21 Nov 2021

Exploiting Action Impact Regularity and Exogenous State Variables for Offline Reinforcement LearningJournal of Artificial Intelligence Research (JAIR), 2021

342

15 Nov 2021

Towards Instance-Optimal Offline Reinforcement Learning with Pessimism

Ming Yin

Yu Wang

OffRL

318

17 Oct 2021

Provable Benefits of Actor-Critic Methods for Offline Reinforcement Learning

340

132

19 Aug 2021

Provably Efficient Generative Adversarial Imitation Learning for Online and Offline Setting with Linear Function Approximation

Zuyue Fu

150

19 Aug 2021

Agnostic Reinforcement Learning with Low-Rank MDPs and Rich ObservationsNeural Information Processing Systems (NeurIPS), 2021

138

22 Jun 2021

The Curse of Passive Data Collection in Batch Reinforcement Learning

255

18 Jun 2021

Offline RL Without Off-Policy Evaluation

David Brandfonbrener

William F. Whitney

Rajesh Ranganath

Joan Bruna

OffRL

350

191

16 Jun 2021

Bellman-consistent Pessimism for Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2021

755

313

13 Jun 2021

Mitigating Covariate Shift in Imitation Learning via Offline Data Without Great Coverage

357

06 Jun 2021

Optimal Uniform OPE and Model-based Offline Reinforcement Learning in Time-Homogeneous, Reward-Free and Task-Agnostic SettingsNeural Information Processing Systems (NeurIPS), 2021

Ming Yin

Yu Wang

OffRL

300

13 May 2021

Cautiously Optimistic Policy Optimization and Exploration with Linear Function ApproximationAnnual Conference Computational Learning Theory (COLT), 2021

Andrea Zanette

Ching-An Cheng

Alekh Agarwal

343

24 Mar 2021

An Exponential Lower Bound for Linearly-Realizable MDPs with Constant Suboptimality GapNeural Information Processing Systems (NeurIPS), 2021

418

23 Mar 2021

Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of PessimismIEEE Transactions on Information Theory (IEEE Trans. Inf. Theory), 2021

866

324

22 Mar 2021

Infinite-Horizon Offline Reinforcement Learning with Linear Function Approximation: Curse of Dimensionality and Algorithm

353

17 Mar 2021

Instabilities of Offline RL with Pre-Trained Neural RepresentationInternational Conference on Machine Learning (ICML), 2021

369

08 Mar 2021

Uncertainty Estimation Using Riemannian Model Dynamics for Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2021

Guy Tennenholtz

Shie Mannor

OffRL

245

22 Feb 2021