Constrained Reinforcement Learning Has Zero Duality Gap

29 October 2019

Alejandro Ribeiro

Papers citing "Constrained Reinforcement Learning Has Zero Duality Gap"

44 / 44 papers shown

Title
IISE PG&E Energy Analytics Challenge 2025: Hourly-Binned Regression Models Beat Transformers in Load Forecasting Millend Roy Vladimir Pyltsov Yinbo Hu 12 0 0 16 May 2025
Resolving Conflicting Constraints in Multi-Agent Reinforcement Learning with Layered Safety Jason J. Choi Jasmine Jerry Aloor Jingqi Li Maria G. Mendoza H. Balakrishnan Claire J. Tomlin 33 0 0 04 May 2025
Context-aware Constrained Reinforcement Learning Based Energy-Efficient Power Scheduling for Non-stationary XR Data Traffic Kexuan Wang An Liu 49 0 0 13 Mar 2025
Primal-Dual Sample Complexity Bounds for Constrained Markov Decision Processes with Multiple Constraints Max Buckley Konstantinos Papathanasiou Andreas Spanopoulos 55 0 0 09 Mar 2025
HWC-Loco: A Hierarchical Whole-Body Control Approach to Robust Humanoid Locomotion Sixu Lin Guanren Qiao Yunxin Tai Ang Li Kui Jia Guiliang Liu 41 0 0 02 Mar 2025
Polynomial-Time Approximability of Constrained Reinforcement Learning Jeremy McMahan 207 0 0 11 Feb 2025
Learning to Slice Wi-Fi Networks: A State-Augmented Primal-Dual Approach Yiugit Berkay Uslu Roya Doostnejad Alejandro Ribeiro Navid Naderializadeh 48 4 0 28 Jan 2025
Enhancing Safety in Reinforcement Learning with Human Feedback via Rectified Policy Optimization Xiyue Peng Hengquan Guo Jiawei Zhang Dongqing Zou Ziyu Shao Honghao Wei Xin Liu 47 0 0 25 Oct 2024
C-MORL: Multi-Objective Reinforcement Learning through Efficient Discovery of Pareto Front Ruohong Liu Yuxin Pan Linjie Xu Lei Song Jiang Bian Pengcheng You Yize Chen 48 1 0 03 Oct 2024
Near-Optimal Policy Identification in Robust Constrained Markov Decision Processes via Epigraph Form Toshinori Kitamura Tadashi Kozuno Wataru Kumagai Kenta Hoshino Y. Hosoe Kazumi Kasaura Masashi Hamaya Paavo Parmas Yutaka Matsuo 74 1 0 29 Aug 2024
Constrained Reinforcement Learning Under Model Mismatch Zhongchang Sun Sihong He Fei Miao Shaofeng Zou 46 4 0 02 May 2024
A Dual Perspective of Reinforcement Learning for Imposing Policy Constraints Bram De Cooman Johan A. K. Suykens 43 0 0 25 Apr 2024
Structured Reinforcement Learning for Media Streaming at the Wireless Edge Archana Bura Sarat Chandra Bobbili Shreyas Rameshkumar Desik Rengarajan D. Kalathil S. Shakkottai 31 0 0 10 Apr 2024
A Policy Gradient Primal-Dual Algorithm for Constrained MDPs with Uniform PAC Guarantees Toshinori Kitamura Tadashi Kozuno Masahiro Kato Yuki Ichihara Soichiro Nishimori Akiyoshi Sannai Sho Sonoda Wataru Kumagai Yutaka Matsuo 44 2 0 31 Jan 2024
HiBid: A Cross-Channel Constrained Bidding System with Budget Allocation by Hierarchical Offline Deep Reinforcement Learning Hao Wang Bo Tang Chi Harold Liu Shangqin Mao Jiahong Zhou Zipeng Dai Yaqi Sun Qianlong Xie Xingxing Wang Dong Wang OffRL 41 3 0 29 Dec 2023
Confronting Reward Model Overoptimization with Constrained RLHF Ted Moskovitz Aaditya K. Singh DJ Strouse T. Sandholm Ruslan Salakhutdinov Anca D. Dragan Stephen Marcus McAleer 50 48 0 06 Oct 2023
Resilient Constrained Learning Ignacio Hounie Alejandro Ribeiro Luiz F. O. Chamon 29 10 0 04 Jun 2023
A Multiplicative Value Function for Safe and Efficient Reinforcement Learning Nick Bührer Zhejun Zhang Alexander Liniger Feng Yu Luc Van Gool 29 1 0 07 Mar 2023
Optimal Transport Perturbations for Safe Reinforcement Learning with Robustness Guarantees James Queeney E. C. Ozcan I. Paschalidis Christos G. Cassandras OOD OffRL 33 5 0 31 Jan 2023
Constrained Reinforcement Learning via Dissipative Saddle Flow Dynamics Tianqi Zheng Pengcheng You Enrique Mallada 39 3 0 03 Dec 2022
Trustworthy Reinforcement Learning Against Intrinsic Vulnerabilities: Robustness, Safety, and Generalizability Mengdi Xu Zuxin Liu Peide Huang Wenhao Ding Zhepeng Cen Bo-wen Li Ding Zhao 79 45 0 16 Sep 2022
Mean-Field Approximation of Cooperative Constrained Multi-Agent Reinforcement Learning (CMARL) Washim Uddin Mondal Vaneet Aggarwal S. Ukkusuri 37 4 0 15 Sep 2022
Constrained Update Projection Approach to Safe Policy Optimization Long Yang Jiaming Ji Juntao Dai Linrui Zhang Binbin Zhou Pengfei Li Yaodong Yang Gang Pan 41 43 0 15 Sep 2022
A Risk-Sensitive Approach to Policy Optimization Jared Markowitz Ryan W. Gardner Ashley J. Llorens R. Arora I-J. Wang OffRL 34 6 0 19 Aug 2022
Safe Reinforcement Learning via Confidence-Based Filters Sebastian Curi Armin Lederer Sandra Hirche Andreas Krause OffRL 24 4 0 04 Jul 2022
Near-Optimal Sample Complexity Bounds for Constrained MDPs Sharan Vaswani Lin F. Yang Csaba Szepesvári 35 32 0 13 Jun 2022
Algorithm for Constrained Markov Decision Process with Linear Convergence E. Gladin Maksim Lavrik-Karmazin K. Zainullina Varvara Rudenko Alexander V. Gasnikov Martin Takáč 33 6 0 03 Jun 2022
On the Robustness of Safe Reinforcement Learning under Observational Perturbations Zuxin Liu Zijian Guo Zhepeng Cen Huan Zhang Jie Tan Bo-wen Li Ding Zhao OOD OffRL 48 35 0 29 May 2022
Penalized Proximal Policy Optimization for Safe Reinforcement Learning Linrui Zhang Li Shen Long Yang Shi-Yong Chen Bo Yuan Xueqian Wang Dacheng Tao 18 62 0 24 May 2022
A Review of Safe Reinforcement Learning: Methods, Theory and Applications Shangding Gu Longyu Yang Yali Du Guang Chen Florian Walter Jun Wang Alois C. Knoll OffRL AI4TS 117 241 0 20 May 2022
Inter-Cell Slicing Resource Partitioning via Coordinated Multi-Agent Deep Reinforcement Learning T. Hu Qi Liao Qiang Liu D. Wellington Georg Carle 17 10 0 25 Feb 2022
MuZero with Self-competition for Rate Control in VP9 Video Compression Amol Mandhane A. Zhernov Maribeth Rauh Chenjie Gu Miaosen Wang ... Jackson Broshear Julian Schrittwieser Thomas Hubert Oriol Vinyals Timothy A. Mann 37 44 0 14 Feb 2022
Convergence Rates of Two-Time-Scale Gradient Descent-Ascent Dynamics for Solving Nonconvex Min-Max Problems Thinh T. Doan 22 15 0 17 Dec 2021
OnSlicing: Online End-to-End Network Slicing with Reinforcement Learning Qiang Liu Nakjung Choi Tao Han OffRL 32 29 0 02 Nov 2021
Finite-Time Complexity of Online Primal-Dual Natural Actor-Critic Algorithm for Constrained Markov Decision Processes Sihan Zeng Thinh T. Doan Justin Romberg 102 17 0 21 Oct 2021
Parallel Deep Neural Networks Have Zero Duality Gap Yifei Wang Tolga Ergen Mert Pilanci 79 10 0 13 Oct 2021
A Provably-Efficient Model-Free Algorithm for Constrained Markov Decision Processes Honghao Wei Xin Liu Lei Ying 29 21 0 03 Jun 2021
CRPO: A New Approach for Safe Reinforcement Learning with Convergence Guarantee Tengyu Xu Yingbin Liang Guanghui Lan 52 122 0 11 Nov 2020
Learning with Safety Constraints: Sample Complexity of Reinforcement Learning for Constrained MDPs Aria HasanzadeZonuzy Archana Bura D. Kalathil S. Shakkottai 32 38 0 01 Aug 2020
Responsive Safety in Reinforcement Learning by PID Lagrangian Methods Adam Stooke Joshua Achiam Pieter Abbeel 31 287 0 08 Jul 2020
Probably Approximately Correct Constrained Learning Luiz F. O. Chamon Alejandro Ribeiro 22 38 0 09 Jun 2020
Exploration-Exploitation in Constrained MDPs Yonathan Efroni Shie Mannor Matteo Pirotta 33 171 0 04 Mar 2020
Provably Efficient Safe Exploration via Primal-Dual Policy Optimization Dongsheng Ding Xiaohan Wei Zhuoran Yang Zhaoran Wang M. Jovanović 25 159 0 01 Mar 2020
Risk-Sensitive and Robust Decision-Making: a CVaR Optimization Approach Yinlam Chow Aviv Tamar Shie Mannor Marco Pavone 73 314 0 06 Jun 2015