v1v2v3 (latest)

Is Pessimism Provably Efficient for Offline RL?

International Conference on Machine Learning (ICML), 2020

30 December 2020

Papers citing "Is Pessimism Provably Efficient for Offline RL?"

50 / 290 papers shown

Offline congestion games: How feedback type affects data coverage requirementInternational Conference on Learning Representations (ICLR), 2022

Qiwen Cui

172

24 Oct 2022

A Reinforcement Learning Approach in Multi-Phase Second-Price Auction Design

253

19 Oct 2022

Hybrid RL: Using Both Offline and Online Data Can Make RL EfficientInternational Conference on Learning Representations (ICLR), 2022

413

132

13 Oct 2022

The Role of Coverage in Online Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2022

262

09 Oct 2022

Conservative Bayesian Model-Based Value Expansion for Offline Policy OptimizationInternational Conference on Learning Representations (ICLR), 2022

Baher Abdulhai

196

07 Oct 2022

Offline Reinforcement Learning with Differentiable Function Approximation is Provably Efficient

Ming Yin

Mengdi Wang

Yu Wang

OffRL

332

03 Oct 2022

Relational Reasoning via Set Transformers: Provable Efficiency and Applications to MARLNeural Information Processing Systems (NeurIPS), 2022

Vincent Y. F. Tan

251

20 Sep 2022

Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation

325

14 Sep 2022

Statistical Estimation of Confounded Linear MDPs: An Instrumental Variable Approach

Wenhao Yang

216

12 Sep 2022

Strategic Decision-Making in the Presence of Information Asymmetry: Provably Efficient RL with Algorithmic Instruments

321

23 Aug 2022

Sampling Through the Lens of Sequential Decision Making

383

17 Aug 2022

Distributionally Robust Model-Based Offline Reinforcement Learning with Near-Optimal Sample ComplexityJournal of machine learning research (JMLR), 2022

Laixi Shi

Yuejie Chi

OOD OffRL

408

11 Aug 2022

Online Learning with Off-Policy FeedbackInternational Conference on Algorithmic Learning Theory (ALT), 2022

170

18 Jul 2022

Offline RL Policies Should be Trained to be AdaptiveInternational Conference on Machine Learning (ICML), 2022

166

05 Jul 2022

An Empirical Study of Implicit Regularization in Deep Offline RL

307

05 Jul 2022

Provably Efficient Offline Reinforcement Learning with Trajectory-Wise RewardIEEE Transactions on Information Theory (IEEE Trans. Inf. Theory), 2022

239

13 Jun 2022

Federated Offline Reinforcement LearningJournal of the American Statistical Association (JASA), 2022

342

11 Jun 2022

Offline Stochastic Shortest Path: Learning, Evaluation and Towards OptimalityConference on Uncertainty in Artificial Intelligence (UAI), 2022

Ming Yin

165

10 Jun 2022

Mildly Conservative Q-Learning for Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

324

134

09 Jun 2022

On the Role of Discount Factor in Offline Reinforcement LearningInternational Conference on Machine Learning (ICML), 2022

259

07 Jun 2022

RORL: Robust Offline Reinforcement Learning via Conservative SmoothingNeural Information Processing Systems (NeurIPS), 2022

424

101

06 Jun 2022

Pessimistic Off-Policy Optimization for Learning to RankEuropean Conference on Artificial Intelligence (ECAI), 2022

336

06 Jun 2022

Reward Poisoning Attacks on Offline Multi-Agent Reinforcement LearningAAAI Conference on Artificial Intelligence (AAAI), 2022

455

04 Jun 2022

Incorporating Explicit Uncertainty Estimates into Deep Offline Reinforcement Learning

David Brandfonbrener

Rémi Tachet des Combes

Romain Laroche

OffRL

186

02 Jun 2022

Offline Reinforcement Learning with Differential PrivacyNeural Information Processing Systems (NeurIPS), 2022

Dan Qiao

Yu Wang

OffRL

313

02 Jun 2022

On Gap-dependent Bounds for Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

Xinqi Wang

Qiwen Cui

S. Du

OffRL

233

01 Jun 2022

Byzantine-Robust Online and Offline Distributed Reinforcement LearningInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2022

325

01 Jun 2022

Provably Efficient Offline Multi-agent Reinforcement Learning via Strategy-wise BonusNeural Information Processing Systems (NeurIPS), 2022

Qiwen Cui

S. Du

OffRL

196

01 Jun 2022

Robust Anytime Learning of Markov Decision ProcessesNeural Information Processing Systems (NeurIPS), 2022

236

31 May 2022

Why So Pessimistic? Estimating Uncertainties for Offline RL through Ensembles, and Why Their Independence MattersNeural Information Processing Systems (NeurIPS), 2022

Seyed Kamyar Seyed Ghasemipour

S. Gu

Ofir Nachum

OffRL

220

27 May 2022

Pessimism in the Face of Confounders: Provably Efficient Offline Reinforcement Learning in Partially Observable Markov Decision ProcessesInternational Conference on Learning Representations (ICLR), 2022

380

26 May 2022

Tiered Reinforcement Learning: Pessimism in the Face of Uncertainty and Constant RegretNeural Information Processing Systems (NeurIPS), 2022

474

25 May 2022

When Data Geometry Meets Deep Function: Generalizing Offline Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2022

319

23 May 2022

Offline Policy Comparison with Confidence: Benchmarks and Baselines

205

22 May 2022

$Pessimism for Offline Linear Contextual Bandits using $\ell_p$ Confidence Sets$

Pessimism for Offline Linear Contextual Bandits using

\ell_p

Confidence SetsNeural Information Processing Systems (NeurIPS), 2022

297

21 May 2022

Pessimism meets VCG: Learning Dynamic Mechanism Design via Offline Reinforcement LearningInternational Conference on Machine Learning (ICML), 2022

194

05 May 2022

When Should We Prefer Offline Reinforcement Learning Over Behavioral Cloning?

283

12 Apr 2022

Offline Reinforcement Learning Under Value and Density-Ratio Realizability: The Power of GapsConference on Uncertainty in Artificial Intelligence (UAI), 2022

Jinglin Chen

Nan Jiang

OffRL

339

25 Mar 2022

Bellman Residual Orthogonalization for Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

Andrea Zanette

Martin J. Wainwright

OffRL

341

24 Mar 2022

The Efficacy of Pessimism in Asynchronous Q-LearningIEEE Transactions on Information Theory (IEEE Trans. Inf. Theory), 2022

287

14 Mar 2022

Near-optimal Offline Reinforcement Learning with Linear Representation: Leveraging Variance Information with PessimismInternational Conference on Learning Representations (ICLR), 2022

Ming Yin

Yaqi Duan

Mengdi Wang

Yu Wang

OffRL

253

11 Mar 2022

Pessimistic Q-Learning for Offline Reinforcement Learning: Towards Optimal Sample ComplexityInternational Conference on Machine Learning (ICML), 2022

296

104

28 Feb 2022

LobsDICE: Offline Learning from Observation via Stationary Distribution Correction EstimationNeural Information Processing Systems (NeurIPS), 2022

297

28 Feb 2022

Statistically Efficient Advantage Learning for Offline Reinforcement Learning in Infinite HorizonsJournal of the American Statistical Association (JASA), 2022

238

26 Feb 2022

Learning Dynamic Mechanisms in Unknown Environments: A Reinforcement Learning Approach

243

25 Feb 2022

Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2022

281

156

23 Feb 2022

Pessimistic Minimax Value Iteration: Provably Efficient Equilibrium Learning from Offline DatasetsInternational Conference on Machine Learning (ICML), 2022

Wei Xiong

Tong Zhang

209

15 Feb 2022

Towards Deployment-Efficient Reinforcement Learning: Lower Bound and OptimalityInternational Conference on Learning Representations (ICLR), 2022

315

14 Feb 2022

Offline Reinforcement Learning with Realizability and Single-policy ConcentrabilityAnnual Conference Computational Learning Theory (COLT), 2022

620

120

09 Feb 2022

Adversarially Trained Actor Critic for Offline Reinforcement LearningInternational Conference on Machine Learning (ICML), 2022

296

148

05 Feb 2022