Constrained Upper Confidence Reinforcement Learning

Conference on Learning for Dynamics & Control (L4DC), 2020

26 January 2020

Liyuan Zheng

Lillian J. Ratliff

ArXiv (abs)PDF HTML

Papers citing "Constrained Upper Confidence Reinforcement Learning"

40 / 40 papers shown

Provably Efficient Sample Complexity for Robust CMDP

Sourav Ganguly

Arnob Ghosh

165

10 Nov 2025

Exchange Policy Optimization Algorithm for Semi-Infinite Safe Reinforcement Learning

175

06 Nov 2025

Beyond Slater's Condition in Online CMDPs with Stochastic and Adversarial Constraints

Francesco Emanuele Stradi

Eleonora Fidelia Chiefari

Matteo Castiglioni

A. Marchesi

Nicola Gatti

196

24 Sep 2025

Near-Optimal Sample Complexity Bounds for Constrained Average-Reward MDPs

Yukuan Wei

Xudong Li

Lin F. Yang

192

20 Sep 2025

Efficient Policy Optimization in Robust Constrained MDPs with Iteration Complexity Guarantees

235

25 May 2025

Ensuring Safety in an Uncertain Environment: Constrained MDPs via Stochastic Thresholds

Qian Zuo

Fengxiang He

377

07 Apr 2025

ActSafe: Active Exploration with Safety Constraints for Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2024

434

12 Oct 2024

Near-Optimal Policy Identification in Robust Constrained Markov Decision Processes via Epigraph FormInternational Conference on Learning Representations (ICLR), 2024

Yutaka Matsuo

747

29 Aug 2024

A Primal-Dual Online Learning Approach for Dynamic Pricing of Sequentially Displayed Complementary Items under Sale Constraints

Francesco Emanuele Stradi

206

08 Jul 2024

A safe exploration approach to constrained Markov decision processesInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

Tingting Ni

Maryam Kamgarpour

402

01 Dec 2023

Last-Iterate Convergent Policy Gradient Primal-Dual Methods for Constrained MDPsNeural Information Processing Systems (NeurIPS), 2023

Dongsheng Ding

Chen-Yu Wei

Jianchao Tan

Alejandro Ribeiro

412

20 Jun 2023

Near-optimal Conservative Exploration in Reinforcement Learning under Episode-wise ConstraintsInternational Conference on Machine Learning (ICML), 2023

315

09 Jun 2023

Semi-Infinitely Constrained Markov Decision Processes and Efficient Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

Liangyu Zhang

Yang Peng

Wenhao Yang

Zhihua Zhang

209

29 Apr 2023

Long-Term Fairness with Unknown DynamicsNeural Information Processing Systems (NeurIPS), 2023

Yang Liu

316

19 Apr 2023

Safe Posterior Sampling for Constrained MDPs with Bounded Constraint Violation

K. C. Kalagarla

Rahul Jain

Pierluigi Nuzzo

234

27 Jan 2023

Provable Reset-free Reinforcement Learning by No-Regret ReductionInternational Conference on Machine Learning (ICML), 2023

Hoai-An Nguyen

Ching-An Cheng

OffRL

381

06 Jan 2023

An Empirical Evaluation of Posterior Sampling for Constrained Reinforcement Learning

208

08 Sep 2022

Safe Exploration Incurs Nearly No Additional Sample Complexity for Reward-free RLInternational Conference on Learning Representations (ICLR), 2022

330

28 Jun 2022

Provably Efficient Model-Free Constrained RL with Linear Function ApproximationNeural Information Processing Systems (NeurIPS), 2022

A. Ghosh

Xingyu Zhou

Ness B. Shroff

434

23 Jun 2022

Near-Optimal Sample Complexity Bounds for Constrained MDPsNeural Information Processing Systems (NeurIPS), 2022

Sharan Vaswani

Lin F. Yang

Csaba Szepesvári

317

13 Jun 2022

Convergence and sample complexity of natural policy gradient primal-dual methods for constrained MDPs

400

06 Jun 2022

Safe Reinforcement Learning for Legged LocomotionIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2022

Tsung-Yen Yang

Tingnan Zhang

Linda Luu

Sehoon Ha

Jie Tan

Wenhao Yu

283

05 Mar 2022

Learning Infinite-Horizon Average-Reward Markov Decision Processes with ConstraintsInternational Conference on Machine Learning (ICML), 2022

Liyu Chen

R. Jain

Haipeng Luo

323

31 Jan 2022

Constraint Sampling Reinforcement Learning: Incorporating Expertise For Faster LearningAAAI Conference on Artificial Intelligence (AAAI), 2021

206

30 Dec 2021

Recent Advances in Reinforcement Learning in Finance

620

264

08 Dec 2021

DOPE: Doubly Optimistic and Pessimistic Exploration for Safe Reinforcement Learning

390

01 Dec 2021

Concave Utility Reinforcement Learning with Zero-Constraint Violations

Mridul Agarwal

Qinbo Bai

Vaneet Aggarwal

470

12 Sep 2021

Markov Decision Processes with Long-Term Average Constraints

Mridul Agarwal

Qinbo Bai

Vaneet Aggarwal

222

12 Jun 2021

Safe Reinforcement Learning with Linear Function ApproximationInternational Conference on Machine Learning (ICML), 2021

Sanae Amani

Christos Thrampoulidis

Lin F. Yang

225

11 Jun 2021

Learning Policies with Zero or Bounded Constraint Violation for Constrained MDPsNeural Information Processing Systems (NeurIPS), 2021

439

04 Jun 2021

Safe Value FunctionsIEEE Transactions on Automatic Control (IEEE TAC), 2021

385

25 May 2021

Online Selection of Diverse CommitteesInternational Joint Conference on Artificial Intelligence (IJCAI), 2021

Virginie Do

Jamal Atif

J. Lang

Nicolas Usunier

246

19 May 2021

A Sample-Efficient Algorithm for Episodic Finite-Horizon MDP with ConstraintsAAAI Conference on Artificial Intelligence (AAAI), 2020

K. C. Kalagarla

Rahul Jain

Pierluigi Nuzzo

230

23 Sep 2020

Learning with Safety Constraints: Sample Complexity of Reinforcement Learning for Constrained MDPsAAAI Conference on Artificial Intelligence (AAAI), 2020

558

01 Aug 2020

Risk-Sensitive Reinforcement Learning: Near-Optimal Risk-Sample Tradeoff in RegretNeural Information Processing Systems (NeurIPS), 2020

291

22 Jun 2020

Accelerating Safe Reinforcement Learning with Constraint-mismatched Policies

318

20 Jun 2020

Constrained episodic reinforcement learning in concave-convex and knapsack settings

Max Simchowitz

224

09 Jun 2020

Exploration-Exploitation in Constrained MDPs

Yonathan Efroni

Shie Mannor

Matteo Pirotta

450

207

04 Mar 2020

Upper Confidence Primal-Dual Reinforcement Learning for CMDP with Adversarial LossNeural Information Processing Systems (NeurIPS), 2020

480

02 Mar 2020

Provably Efficient Safe Exploration via Primal-Dual Policy OptimizationInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2020

419

185

01 Mar 2020