Constrained Policy Optimization

30 May 2017

Pieter Abbeel

Papers citing "Constrained Policy Optimization"

50 / 304 papers shown

Title
Safe Reinforcement Learning Using Black-Box Reachability Analysis Mahmoud Selim Amr Alanwar Shreyas Kousik Grace Gao Marco Pavone Karl H. Johansson 29 32 0 15 Apr 2022
Infinite-Horizon Reach-Avoid Zero-Sum Games via Deep Reinforcement Learning Jingqi Li Donggun Lee Somayeh Sojoudi Claire Tomlin 27 11 0 18 Mar 2022
How to Learn from Risk: Explicit Risk-Utility Reinforcement Learning for Efficient and Safe Driving Strategies Lukas M. Schmidt Sebastian Rietsch Axel Plinge Bjoern M. Eskofier Christopher Mutschler OffRL 35 5 0 16 Mar 2022
Safe Reinforcement Learning for Legged Locomotion Tsung-Yen Yang Tingnan Zhang Linda Luu Sehoon Ha Jie Tan Wenhao Yu 29 40 0 05 Mar 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 405 12,150 0 04 Mar 2022
Distributional Reinforcement Learning for Scheduling of Chemical Production Processes M. Mowbray Dongda Zhang Ehecatl Antonio del Rio Chanona OffRL 25 6 0 01 Mar 2022
Neural-Progressive Hedging: Enforcing Constraints in Reinforcement Learning with Stochastic Programming Supriyo Ghosh L. Wynter Shiau Hong Lim D. Nguyen 34 0 0 27 Feb 2022
A Globally Convergent Evolutionary Strategy for Stochastic Constrained Optimization with Applications to Reinforcement Learning Youssef Diouane Aurelien Lucchi Vihang Patil 29 3 0 21 Feb 2022
Learning a Shield from Catastrophic Action Effects: Never Repeat the Same Mistake Shahaf S. Shperberg Bo Liu Peter Stone 34 7 0 19 Feb 2022
System Safety and Artificial Intelligence Roel Dobbe 33 34 0 18 Feb 2022
L2C2: Locally Lipschitz Continuous Constraint towards Stable and Smooth Reinforcement Learning Taisuke Kobayashi 28 15 0 15 Feb 2022
MuZero with Self-competition for Rate Control in VP9 Video Compression Amol Mandhane A. Zhernov Maribeth Rauh Chenjie Gu Miaosen Wang ... Jackson Broshear Julian Schrittwieser Thomas Hubert Oriol Vinyals Timothy A. Mann 37 44 0 14 Feb 2022
Saute RL: Almost Surely Safe Reinforcement Learning Using State Augmentation Aivar Sootla Alexander I. Cowen-Rivers Taher Jafferjee Ziyan Wang D. Mguni Jun Wang Haitham Bou-Ammar 34 54 0 14 Feb 2022
SAFER: Data-Efficient and Safe Reinforcement Learning via Skill Acquisition Dylan Slack Yinlam Chow Bo Dai Nevan Wichers OffRL 37 7 0 10 Feb 2022
Challenging Common Assumptions in Convex Reinforcement Learning Mirco Mutti Ric De Santi Piersilvio De Bartolomeis Marcello Restelli OffRL 37 21 0 03 Feb 2022
You May Not Need Ratio Clipping in PPO Mingfei Sun Vitaly Kurin Guoqing Liu Sam Devlin Tao Qin Katja Hofmann Shimon Whiteson 18 15 0 31 Jan 2022
Towards Safe Reinforcement Learning with a Safety Editor Policy Haonan Yu Wei Xu Haichao Zhang OffRL 69 31 0 28 Jan 2022
GoSafeOpt: Scalable Safe Exploration for Global Optimization of Dynamical Systems Bhavya Sukhija M. Turchetta David Lindner Andreas Krause Sebastian Trimpe Dominik Baumann 33 17 0 24 Jan 2022
Safe Deep RL in 3D Environments using Human Feedback Matthew Rahtz Vikrant Varma Ramana Kumar Zachary Kenton Shane Legg Jan Leike 34 4 0 20 Jan 2022
Conservative Distributional Reinforcement Learning with Safety Constraints Hengrui Zhang Youfang Lin Sheng Han Shuo Wang Kai Lv OffRL 26 5 0 18 Jan 2022
SABLAS: Learning Safe Control for Black-box Dynamical Systems Zengyi Qin Dawei Sun Chuchu Fan 26 43 0 06 Jan 2022
Constraint Sampling Reinforcement Learning: Incorporating Expertise For Faster Learning Tong Mu Georgios Theocharous David Arbour Emma Brunskill 33 6 0 30 Dec 2021
Safe Reinforcement Learning with Chance-constrained Model Predictive Control Samuel Pfrommer Tanmay Gautam Alec Zhou Somayeh Sojoudi 21 24 0 27 Dec 2021
Model-Based Safe Reinforcement Learning with Time-Varying State and Control Constraints: An Application to Intelligent Vehicles Xinglong Zhang Yaoqian Peng Biao Luo Wei Pan Xin Xu Haibin Xie 27 11 0 18 Dec 2021
Towards Disturbance-Free Visual Mobile Manipulation Tianwei Ni Kiana Ehsani Luca Weihs Jordi Salvador 28 9 0 17 Dec 2021
Convergence Rates of Two-Time-Scale Gradient Descent-Ascent Dynamics for Solving Nonconvex Min-Max Problems Thinh T. Doan 22 15 0 17 Dec 2021
Conservative and Adaptive Penalty for Model-Based Safe Reinforcement Learning Yecheng Jason Ma Andrew Shen Osbert Bastani Dinesh Jayaraman 18 25 0 14 Dec 2021
Recent Advances in Reinforcement Learning in Finance B. Hambly Renyuan Xu Huining Yang OffRL 29 168 0 08 Dec 2021
Quantile Filtered Imitation Learning David Brandfonbrener William F. Whitney Rajesh Ranganath Joan Bruna 33 6 0 02 Dec 2021
CLARA: A Constrained Reinforcement Learning Based Resource Allocation Framework for Network Slicing Yongshuai Liu J. Ding Zhi-Li Zhang Xin Liu 25 19 0 16 Nov 2021
Look Before You Leap: Safe Model-Based Reinforcement Learning with Human Intervention Yunkun Xu Zhen-yu Liu Guifang Duan Jiangcheng Zhu X. Bai Jianrong Tan 18 9 0 10 Nov 2021
Safe Policy Optimization with Local Generalized Linear Function Approximations Akifumi Wachi Yunyue Wei Yanan Sui OffRL 35 10 0 09 Nov 2021
Generalized Proximal Policy Optimization with Sample Reuse James Queeney I. Paschalidis Christos G. Cassandras OffRL 42 47 0 29 Oct 2021
Learning to Be Cautious Montaser Mohammedalamen Dustin Morrill Alexander Sieusahai Yash Satsangi Michael Bowling 18 3 0 29 Oct 2021
TRAIL: Near-Optimal Imitation Learning with Suboptimal Data Mengjiao Yang Sergey Levine Ofir Nachum OffRL 41 42 0 27 Oct 2021
What Would Jiminy Cricket Do? Towards Agents That Behave Morally Dan Hendrycks Mantas Mazeika Andy Zou Sahil Patel Christine Zhu Jesus Navarro D. Song Bo Li Jacob Steinhardt 16 58 0 25 Oct 2021
Finite-Time Complexity of Online Primal-Dual Natural Actor-Critic Algorithm for Constrained Markov Decision Processes Sihan Zeng Thinh T. Doan Justin Romberg 102 17 0 21 Oct 2021
Safe Autonomous Racing via Approximate Reachability on Ego-vision Bingqing Chen Jonathan M Francis Jean Oh Eric Nyberg Sylvia Herbert 59 14 0 14 Oct 2021
Offline Reinforcement Learning with Soft Behavior Regularization Haoran Xu Xianyuan Zhan Jianxiong Li Honglei Yin OffRL 31 31 0 14 Oct 2021
Multi-Agent Constrained Policy Optimisation Shangding Gu J. Kuba Munning Wen Ruiqing Chen Ziyan Wang Zheng Tian Jun Wang Alois Knoll Yaodong Yang 98 49 0 06 Oct 2021
Improving Safety in Deep Reinforcement Learning using Unsupervised Action Planning Hao-Lun Hsu Qiuhua Huang Sehoon Ha OffRL 42 11 0 29 Sep 2021
MetaDrive: Composing Diverse Driving Scenarios for Generalizable Reinforcement Learning Quanyi Li Zhenghao Peng Lan Feng Qihang Zhang Zhenghai Xue Bolei Zhou 43 232 0 26 Sep 2021
Decentralized Global Connectivity Maintenance for Multi-Robot Navigation: A Reinforcement Learning Approach Minghao Li Yingrui Jie Yang Kong Hui Cheng 43 9 0 17 Sep 2021
Balancing detectability and performance of attacks on the control channel of Markov Decision Processes Alessio Russo Alexandre Proutiere AAML 38 6 0 15 Sep 2021
Safe Nonlinear Control Using Robust Neural Lyapunov-Barrier Functions Charles Dawson Zengyi Qin Sicun Gao Chuchu Fan 120 173 0 14 Sep 2021
Exploration in Deep Reinforcement Learning: From Single-Agent to Multiagent Domain Jianye Hao Tianpei Yang Hongyao Tang Chenjia Bai Jinyi Liu Zhaopeng Meng Peng Liu Zhen Wang OffRL 41 93 0 14 Sep 2021
Achieving Zero Constraint Violation for Constrained Reinforcement Learning via Primal-Dual Approach Qinbo Bai Amrit Singh Bedi Mridul Agarwal Alec Koppel Vaneet Aggarwal 107 56 0 13 Sep 2021
Concave Utility Reinforcement Learning with Zero-Constraint Violations Mridul Agarwal Qinbo Bai Vaneet Aggarwal 38 12 0 12 Sep 2021
Data Generation Method for Learning a Low-dimensional Safe Region in Safe Reinforcement Learning Zhehua Zhou Ozgur S. Oguz Yi Ren M. Leibold M. Buss OffRL 22 0 0 10 Sep 2021
Learning Practically Feasible Policies for Online 3D Bin Packing Hang Zhao Chenyang Zhu Xin Xu Hui Huang Kai Xu OffRL 32 80 0 31 Aug 2021