v1v2v3 (latest)

Is Pessimism Provably Efficient for Offline RL?

International Conference on Machine Learning (ICML), 2020

30 December 2020

Papers citing "Is Pessimism Provably Efficient for Offline RL?"

50 / 290 papers shown

Unsupervised Behavior Extraction via Random Intent PriorsNeural Information Processing Systems (NeurIPS), 2023

265

28 Oct 2023

Pessimistic Off-Policy Multi-Objective OptimizationInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

238

28 Oct 2023

Bridging Distributionally Robust Learning and Offline RL: An Approach to Mitigate Distribution Shift and Partial Data CoverageConference on Learning for Dynamics & Control (L4DC), 2023

322

27 Oct 2023

Corruption-Robust Offline Reinforcement Learning with General Function ApproximationNeural Information Processing Systems (NeurIPS), 2023

Chen Ye

Rui Yang

Quanquan Gu

Tong Zhang

OffRL

411

23 Oct 2023

Contrastive Preference Learning: Learning from Human Feedback without RL

Dorsa Sadigh

518

20 Oct 2023

Towards Robust Offline Reinforcement Learning under Diverse Data Corruption

Tong Zhang

413

19 Oct 2023

Action-Quantized Offline Reinforcement Learning for Robotic Skill LearningConference on Robot Learning (CoRL), 2023

257

18 Oct 2023

Bi-Level Offline Policy Optimization with Limited ExplorationNeural Information Processing Systems (NeurIPS), 2023

Wenzhuo Zhou

OffRL

289

10 Oct 2023

When is Agnostic Reinforcement Learning Statistically Tractable?Neural Information Processing Systems (NeurIPS), 2023

286

09 Oct 2023

Pessimistic Nonlinear Least-Squares Value Iteration for Offline Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2023

Qiwei Di

Heyang Zhao

Jiafan He

Quanquan Gu

OffRL

240

02 Oct 2023

Reason for Future, Act for Now: A Principled Framework for Autonomous LLM Agents with Provable Sample Efficiency

502

29 Sep 2023

Towards Robust Offline-to-Online Reinforcement Learning via Uncertainty and SmoothnessJournal of Artificial Intelligence Research (JAIR), 2023

Zhen Wang

177

29 Sep 2023

Stackelberg Batch Policy Learning

Wenzhuo Zhou

Annie Qu

OffRL

269

28 Sep 2023

Importance-Weighted Offline Learning Done RightInternational Conference on Algorithmic Learning Theory (ALT), 2023

187

27 Sep 2023

Zero-Shot Reinforcement Learning from Low Quality DataNeural Information Processing Systems (NeurIPS), 2023

290

26 Sep 2023

Distributional Shift-Aware Off-Policy Interval Estimation: A Unified Error Quantification Framework

Annie Qu

278

23 Sep 2023

Counterfactual Conservative Q Learning for Offline Multi-agent Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

194

22 Sep 2023

An Offline Learning Approach to Propagator ModelsSocial Science Research Network (SSRN), 2023

228

06 Sep 2023

Fast and Regret Optimal Best Arm Identification: Fundamental Limits and Low-Complexity AlgorithmsNeural Information Processing Systems (NeurIPS), 2023

Qining Zhang

Lei Ying

545

01 Sep 2023

Settling the Sample Complexity of Online Reinforcement LearningAnnual Conference Computational Learning Theory (COLT), 2023

716

25 Jul 2023

Bayesian Safe Policy Learning with Chance Constrained Optimization: Application to Military Security Assessment during the Vietnam War

Zeyang Jia

Eli Ben-Michael

Kosuke Imai

263

17 Jul 2023

Reward-Directed Conditional Diffusion: Provable Distribution Estimation and Reward ImprovementNeural Information Processing Systems (NeurIPS), 2023

Kaixuan Huang

Mengdi Wang

243

13 Jul 2023

Policy Finetuning in Reinforcement Learning via Design of Experiments using Offline DataNeural Information Processing Systems (NeurIPS), 2023

Ruiqi Zhang

Andrea Zanette

OffRL OnRL

272

10 Jul 2023

Provably Efficient UCB-type Algorithms For Learning Predictive State RepresentationsInternational Conference on Learning Representations (ICLR), 2023

373

01 Jul 2023

Supervised Pretraining Can Learn In-Context Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

319

120

26 Jun 2023

Design from Policies: Conservative Test-Time Adaptation for Offline Policy OptimizationNeural Information Processing Systems (NeurIPS), 2023

390

26 Jun 2023

Offline Policy Evaluation for Reinforcement Learning with Adaptively Collected Data

Ming Yin

263

24 Jun 2023

Active Coverage for PAC Reinforcement LearningAnnual Conference Computational Learning Theory (COLT), 2023

184

23 Jun 2023

Deep Generative Models for Decision-Making and Control

Michael Janner

292

15 Jun 2023

Provably Efficient Offline Reinforcement Learning with Perturbed Data SourcesInternational Conference on Machine Learning (ICML), 2023

Chengshuai Shi

Wei Xiong

Cong Shen

Jing Yang

OffRL

207

14 Jun 2023

Oracle-Efficient Pessimism: Offline Policy Optimization in Contextual BanditsInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

313

13 Jun 2023

Unified Off-Policy Learning to Rank: a Reinforcement Learning PerspectiveNeural Information Processing Systems (NeurIPS), 2023

Mengdi Wang

382

13 Jun 2023

Policy Regularization with Dataset Constraint for Offline Reinforcement LearningInternational Conference on Machine Learning (ICML), 2023

243

11 Jun 2023

Survival Instinct in Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

271

05 Jun 2023

On Optimal Caching and Model Multiplexing for Large Model Inference

306

03 Jun 2023

Delphic Offline Reinforcement Learning under Nonidentifiable Hidden ConfoundingInternational Conference on Learning Representations (ICLR), 2023

197

01 Jun 2023

Achieving Fairness in Multi-Agent Markov Decision Processes Using Reinforcement Learning

Peizhong Ju

A. Ghosh

Ness B. Shroff

266

01 Jun 2023

Improving Offline RL by Blending HeuristicsInternational Conference on Learning Representations (ICLR), 2023

234

01 Jun 2023

Offline Meta Reinforcement Learning with In-Distribution Online AdaptationInternational Conference on Machine Learning (ICML), 2023

262

31 May 2023

High-probability sample complexities for policy evaluation with linear function approximationIEEE Transactions on Information Theory (IEEE Trans. Inf. Theory), 2023

424

30 May 2023

What is Essential for Unseen Goal Generalization of Offline Goal-conditioned RL?International Conference on Machine Learning (ICML), 2023

Yong Lin

Tong Zhang

227

30 May 2023

Maximize to Explore: One Objective Function Fusing Estimation, Planning, and ExplorationNeural Information Processing Systems (NeurIPS), 2023

Wei Xiong

352

29 May 2023

Reinforcement Learning with Human Feedback: Learning Dynamic Choices via Pessimism

489

29 May 2023

The Curious Price of Distributional Robustness in Reinforcement Learning with a Generative ModelNeural Information Processing Systems (NeurIPS), 2023

407

26 May 2023

The Benefits of Being Distributional: Small-Loss Bounds for Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

462

25 May 2023

PROTO: Iterative Policy Regularized Offline-to-Online Reinforcement Learning

276

25 May 2023

Provable Offline Preference-Based Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2023

346

24 May 2023

Offline Primal-Dual Reinforcement Learning for Linear MDPsInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

245

22 May 2023

Offline Reinforcement Learning with Additional Covering Distributions

Chenjie Mao

OffRL

249

22 May 2023

Reward-agnostic Fine-tuning: Provable Statistical Benefits of Hybrid Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

254

17 May 2023