v1v2v3 (latest)

Achieving Zero Constraint Violation for Constrained Reinforcement Learning via Primal-Dual Approach

13 September 2021

ArXiv (abs)PDF HTML Github

Papers citing "Achieving Zero Constraint Violation for Constrained Reinforcement Learning via Primal-Dual Approach"

41 / 41 papers shown

Primal-Only Actor Critic Algorithm for Robust Constrained Average Cost MDPs

117

07 Nov 2025

AL-CoLe: Augmented Lagrangian for Constrained Learning

Ignacio Boero

Ignacio Hounie

Alejandro Ribeiro

154

23 Oct 2025

Near-Optimal Sample Complexity Bounds for Constrained Average-Reward MDPs

Yukuan Wei

Xudong Li

Lin F. Yang

194

20 Sep 2025

Rectified Robust Policy Optimization for Model-Uncertain Constrained Reinforcement Learning without Strong Duality

316

24 Aug 2025

Constrained Sliced Wasserstein Embedding

288

02 Jun 2025

An Optimistic Algorithm for online CMDPS with Anytime Adversarial Constraints

264

28 May 2025

Primal-Dual Sample Complexity Bounds for Constrained Markov Decision Processes with Multiple Constraints

Max Buckley

Konstantinos Papathanasiou

Andreas Spanopoulos

369

09 Mar 2025

Provably Efficient RL for Linear MDPs under Instantaneous Safety Constraints in Non-Convex Feature Spaces

Amirhossein Roknilamouki

383

25 Feb 2025

Last-Iterate Convergence of General Parameterized Policies in Constrained MDPs

Washim Uddin Mondal

Vaneet Aggarwal

373

21 Aug 2024

Last-Iterate Global Convergence of Policy Gradients for Constrained Reinforcement Learning

Alessandro Montenegro

Marco Mussi

Matteo Papini

Alberto Maria Metelli

BDL

220

15 Jul 2024

Spectral-Risk Safe Reinforcement Learning with Convergence Guarantees

349

29 May 2024

A CMDP-within-online framework for Meta-Safe Reinforcement Learning

Ming Jin

309

26 May 2024

Natural Policy Gradient and Actor Critic Methods for Constrained Multi-Task Reinforcement Learning

Sihan Zeng

Thinh T. Doan

Justin Romberg

238

03 May 2024

Global Convergence Guarantees for Federated Policy Gradient Methods with Adversaries

382

15 Mar 2024

Sampling-based Safe Reinforcement Learning for Nonlinear Dynamical Systems

231

06 Mar 2024

Conflict-Averse Gradient Aggregation for Constrained Multi-Objective Reinforcement Learning

334

01 Mar 2024

Truly No-Regret Learning in Constrained MDPs

446

24 Feb 2024

A Survey of Constraint Formulations in Safe Reinforcement Learning

Akifumi Wachi

Xun Shen

Yanan Sui

362

03 Feb 2024

Safe Reinforcement Learning with Instantaneous Constraints: The Role of Aggressive Exploration

Honghao Wei

Xin Liu

Lei Ying

223

22 Dec 2023

A safe exploration approach to constrained Markov decision processesInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

Tingting Ni

Maryam Kamgarpour

403

01 Dec 2023

Last-Iterate Convergent Policy Gradient Primal-Dual Methods for Constrained MDPsNeural Information Processing Systems (NeurIPS), 2023

Dongsheng Ding

Chen-Yu Wei

Jianchao Tan

Alejandro Ribeiro

417

20 Jun 2023

A Primal-Dual-Critic Algorithm for Offline Constrained Reinforcement LearningInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

393

13 Jun 2023

Cancellation-Free Regret Bounds for Lagrangian Approaches in Constrained Markov Decision Processes

353

12 Jun 2023

Provably Efficient Generalized Lagrangian Policy Optimization for Safe Multi-Agent Reinforcement LearningConference on Learning for Dynamics & Control (L4DC), 2023

397

31 May 2023

Scalable Primal-Dual Actor-Critic Method for Safe Multi-Agent RL with General UtilitiesNeural Information Processing Systems (NeurIPS), 2023

425

27 May 2023

Long-Term Fairness with Unknown DynamicsNeural Information Processing Systems (NeurIPS), 2023

Yang Liu

318

19 Apr 2023

A Near-Optimal Algorithm for Safe Reinforcement Learning Under Instantaneous Hard ConstraintsInternational Conference on Machine Learning (ICML), 2023

Ming Shi

Yitao Liang

Ness B. Shroff

228

08 Feb 2023

Safe Posterior Sampling for Constrained MDPs with Bounded Constraint Violation

K. C. Kalagarla

Rahul Jain

Pierluigi Nuzzo

243

27 Jan 2023

Trust Region-Based Safe Distributional Reinforcement Learning for Multiple ConstraintsNeural Information Processing Systems (NeurIPS), 2023

Dohyeong Kim

Kyungjae Lee

Songhwai Oh

291

26 Jan 2023

Constrained Reinforcement Learning via Dissipative Saddle Flow DynamicsAsilomar Conference on Signals, Systems and Computers (ACSSC), 2022

Tianqi Zheng

Pengcheng You

Enrique Mallada

219

03 Dec 2022

Learning Globally Smooth Functions on ManifoldsInternational Conference on Machine Learning (ICML), 2022

Alejandro Ribeiro

589

01 Oct 2022

Enforcing Hard Constraints with Soft Barriers: Safe Reinforcement Learning in Unknown Stochastic EnvironmentsInternational Conference on Machine Learning (ICML), 2022

420

29 Sep 2022

A Near-Optimal Primal-Dual Method for Off-Policy Learning in CMDPNeural Information Processing Systems (NeurIPS), 2022

264

13 Jul 2022

Provably Efficient Model-Free Constrained RL with Linear Function ApproximationNeural Information Processing Systems (NeurIPS), 2022

A. Ghosh

Xingyu Zhou

Ness B. Shroff

448

23 Jun 2022

Near-Optimal Sample Complexity Bounds for Constrained MDPsNeural Information Processing Systems (NeurIPS), 2022

Sharan Vaswani

Lin F. Yang

Csaba Szepesvári

319

13 Jun 2022

Anchor-Changing Regularized Natural Policy Gradient for Multi-Objective Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

262

10 Jun 2022

Convergence and sample complexity of natural policy gradient primal-dual methods for constrained MDPs

406

06 Jun 2022

A Review of Safe Reinforcement Learning: Methods, Theory and Applications

Guang Chen

Jun Wang

677

318

20 May 2022

Challenging Common Assumptions in Convex Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

Mirco Mutti

Ric De Santi

Piersilvio De Bartolomeis

Marcello Restelli

OffRL

451

03 Feb 2022

Concave Utility Reinforcement Learning with Zero-Constraint Violations

Mridul Agarwal

Qinbo Bai

Vaneet Aggarwal

471

12 Sep 2021

Scheduling and Power Control for Wireless Multicast Systems via Deep Reinforcement Learning

189

27 Sep 2020