v1v2 (latest)

Return Capping: Sample-Efficient CVaR Policy Gradient Optimisation

29 April 2025

Papers citing "Return Capping: Sample-Efficient CVaR Policy Gradient Optimisation"

22 / 22 papers shown

Policy Optimization Prefers The Path of Least Resistance

167

22 Oct 2025

Risk-Aware Reinforcement Learning with Bandit-Based Adaptation for Quadrupedal Locomotion

Yuanhong Zeng

Anushri Dixit

OffRL

101

16 Oct 2025

Ergodic Risk Measures: Towards a Risk-Aware Foundation for Continual Reinforcement Learning

Juan Sebastian Rojas

Chi-Guhn Lee

150

03 Oct 2025

Gymnasium: A Standard Interface for Reinforcement Learning Environments

...

416

501

24 Jul 2024

A Simple Mixture Policy Parameterization for Improving Sample Efficiency of CVaR Optimization

356

17 Mar 2024

Learning Risk-Aware Quadrupedal Locomotion using Distributional Reinforcement LearningIEEE International Conference on Robotics and Automation (ICRA), 2023

Lukas Schneider

Jonas Frey

Takahiro Miki

Marco Hutter

322

25 Sep 2023

An Alternative to Variance: Gini Deviation for Risk-averse Policy GradientNeural Information Processing Systems (NeurIPS), 2023

363

17 Jul 2023

Risk-Aware Reward Shaping of Reinforcement Learning Agents for Autonomous DrivingAnnual Conference of the IEEE Industrial Electronics Society (IECON), 2023

Zengjie Zhang

180

05 Jun 2023

Efficient Risk-Averse Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

288

10 May 2022

Risk-Averse Bayes-Adaptive Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2021

Marc Rigter

Bruno Lacerda

Nick Hawes

198

10 Feb 2021

Worst Cases Policy GradientsConference on Robot Learning (CoRL), 2019

Yichuan Tang

Jian Zhang

Ruslan Salakhutdinov

169

09 Nov 2019

Being Optimistic to Be Conservative: Quickly Learning a CVaR PolicyAAAI Conference on Artificial Intelligence (AAAI), 2019

320

05 Nov 2019

Risk Averse Robust Adversarial Reinforcement Learning

152

107

31 Mar 2019

Implicit Quantile Networks for Distributional Reinforcement Learning

David Silver

332

621

14 Jun 2018

A Distributional Perspective on Reinforcement Learning

304

1,714

21 Jul 2017

Proximal Policy Optimization Algorithms

1.3K

24,405

20 Jul 2017

Robust Adversarial Reinforcement Learning

320

972

08 Mar 2017

578

5,414

05 Jun 2016

Risk-Constrained Reinforcement Learning with Percentile Risk Criteria

354

583

05 Dec 2015

Contextual Markov Decision Processes

Assaf Hallak

Dotan Di Castro

Shie Mannor

384

286

08 Feb 2015

Optimizing the CVaR via SamplingAAAI Conference on Artificial Intelligence (AAAI), 2014

Aviv Tamar

Yonatan Glassner

Shie Mannor

478

203

15 Apr 2014

Variance-Constrained Actor-Critic Algorithms for Discounted and Average Reward MDPsMachine-mediated learning (ML), 2014

Prashanth L.A.

Mohammad Ghavamzadeh

271

25 Mar 2014