Non-decreasing Quantile Function Network with Efficient Exploration for
Distributional Reinforcement Learning

Non-decreasing Quantile Function Network with Efficient Exploration for Distributional Reinforcement Learning

International Joint Conference on Artificial Intelligence (IJCAI), 2021

14 May 2021

ArXiv (abs)PDF HTML

Papers citing "Non-decreasing Quantile Function Network with Efficient Exploration for Distributional Reinforcement Learning"

11 / 11 papers shown

Title
Beyond CVaR: Leveraging Static Spectral Risk Measures for Enhanced Decision-Making in Distributional Reinforcement Learning Mehrdad Moghimi Hyejin Ku OffRL 330 3 0 03 Jan 2025
A Simple Mixture Policy Parameterization for Improving Sample Efficiency of CVaR Optimization Yudong Luo Yangchen Pan Han Wang Juil Sock Pascal Poupart 299 5 0 17 Mar 2024
Pitfall of Optimism: Distributional Reinforcement Learning by Randomizing Risk CriterionNeural Information Processing Systems (NeurIPS), 2023 Taehyun Cho Seung Han Heesoo Lee Kyungjae Lee Jungwoo Lee 365 6 0 25 Oct 2023
Variance Control for Distributional Reinforcement LearningInternational Conference on Machine Learning (ICML), 2023 Qi Kuang Zhoufan Zhu Liwen Zhang Fan Zhou OffRL 279 4 0 30 Jul 2023
An Alternative to Variance: Gini Deviation for Risk-averse Policy GradientNeural Information Processing Systems (NeurIPS), 2023 Yudong Luo Guiliang Liu Pascal Poupart Yangchen Pan 284 12 0 17 Jul 2023
Toward Risk-based Optimistic Exploration for Cooperative Multi-Agent Reinforcement LearningAdaptive Agents and Multi-Agent Systems (AAMAS), 2023 Ji-Yun Oh Joonkee Kim Minchan Jeong Se-Young Yun 161 1 0 03 Mar 2023
Distributional Method for Risk Averse Reinforcement Learning Ziteng Cheng S. Jaimungal Nick G. Martin 136 0 0 27 Feb 2023
Distributional Actor-Critic Ensemble for Uncertainty-Aware Continuous ControlIEEE International Joint Conference on Neural Network (IJCNN), 2022 T. Kanazawa Haiyan Wang Chetan Gupta UQCV 244 7 0 27 Jul 2022
Risk Perspective Exploration in Distributional Reinforcement Learning Ji-Yun Oh Joonkee Kim Se-Young Yun 141 5 0 28 Jun 2022
The Sufficiency of Off-Policyness and Soft Clipping: PPO is still Insufficient according to an Off-Policy MeasureAAAI Conference on Artificial Intelligence (AAAI), 2022 Xing Chen Dongcui Diao Hechang Chen Hengshuai Yao Haiyin Piao Zhixiao Sun Zhiwei Yang Randy Goebel Bei Jiang Yi-Ju Chang OffRL 365 23 0 20 May 2022
A Cramér Distance perspective on Quantile Regression based Distributional Reinforcement Learning Alix Lhéritier Nicolas Bondoux 157 5 0 01 Oct 2021