v1v2 (latest)

Distributional Policy Optimization: An Alternative Approach for Continuous Control

Neural Information Processing Systems (NeurIPS), 2019

23 May 2019

Papers citing "Distributional Policy Optimization: An Alternative Approach for Continuous Control"

27 / 27 papers shown

Adaptive Nesterov Accelerated Distributional Deep Hedging for Efficient Volatility Risk Management

Lei Zhao

Lin Cai

Wu-Sheng Lu

246

25 Feb 2025

Learning in complex action spaces without policy gradients

283

08 Oct 2024

Predicting Long-Term Human Behaviors in Discrete Representations via Physics-Guided Diffusion

415

29 May 2024

Action-Quantized Offline Reinforcement Learning for Robotic Skill LearningConference on Robot Learning (CoRL), 2023

337

18 Oct 2023

Distributional Soft Actor-Critic with Three RefinementsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Jingliang Duan

Wenxuan Wang

Liming Xiao

Jiaxin Gao

Shengbo Eben Li

Chang Liu

Ya-Qin Zhang

Bo Cheng

Keqiang Li

OODD OffRL

363

09 Oct 2023

Provably Convergent Policy Optimization via Metric-aware Trust Region Methods

268

25 Jun 2023

Towards Optimal Pricing of Demand Response -- A Nonparametric Constrained Policy Optimization ApproachIEEE Power & Energy Society General Meeting (PESGM), 2023

Jun Song

Chaoyue Zhao

OffRL

24 Jun 2023

Representation-Driven Reinforcement LearningInternational Conference on Machine Learning (ICML), 2023

Ofir Nabati

Guy Tennenholtz

Shie Mannor

356

31 May 2023

Latent-Conditioned Policy Gradient for Multi-Objective Deep Reinforcement LearningInternational Conference on Artificial Neural Networks (ICANN), 2023

T. Kanazawa

Chetan Gupta

339

15 Mar 2023

Reinforcement Learning with History-Dependent Dynamic ContextsInternational Conference on Machine Learning (ICML), 2023

297

04 Feb 2023

Distillation Policy Optimization

Jianfei Ma

OffRL

621

01 Feb 2023

Coordinate Ascent for Off-Policy RL with Global Convergence GuaranteesInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2022

282

10 Dec 2022

Decision-making with Speculative Opponent ModelsIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2022

353

22 Nov 2022

Optimistic Curiosity Exploration and Conservative Exploitation with Linear Reward Shaping

232

15 Sep 2022

Automated Reinforcement Learning: An Overview

Yaoxin Wu

Wen Song

Yingqian Zhang

OffRL

490

13 Jan 2022

Continuous Control with Action Quantization from Demonstrations

Sertan Girgin

Olivier Pietquin

219

19 Oct 2021

Maximum Entropy Reinforcement Learning with Mixture Policies

Nir Baram

Guy Tennenholtz

Shie Mannor

157

18 Mar 2021

A Study of Policy Gradient on a Class of Exactly Solvable Models

Gavin McCracken

Colin Daniels

Rosie Zhao

Anna M. Brandenberger

Prakash Panangaden

Doina Precup

182

03 Nov 2020

Learning to Represent Action Values as a Hypergraph on the Action VerticesInternational Conference on Learning Representations (ICLR), 2020

Arash Tavakoli

Mehdi Fatemi

Petar Kormushev

230

28 Oct 2020

Hamilton-Jacobi Deep Q-Learning for Deterministic Continuous-Time Systems with Lipschitz Continuous ControlsJournal of machine learning research (JMLR), 2020

Jeongho Kim

Jaeuk Shin

Insoon Yang

259

27 Oct 2020

Implicit Distributional Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2020

Yuguang Yue

Zhendong Wang

Mingyuan Zhou

OffRL

216

13 Jul 2020

Optimistic Distributionally Robust Policy Optimization

Jun Song

Chaoyue Zhao

205

14 Jun 2020

Non-local Policy Optimization via Diversity-regularized Collaborative Exploration

Zhenghao Peng

Hao Sun

Bolei Zhou

275

14 Jun 2020

Zeroth-Order Supervised Policy Improvement

318

11 Jun 2020

Novel Policy Seeking with Constrained Optimization

408

21 May 2020

Convergence of Q-value in case of Gaussian rewards

141

07 Mar 2020

Sample-based Distributional Policy GradientConference on Learning for Dynamics & Control (L4DC), 2020

Rahul Singh

Keuntaek Lee

Yongxin Chen

176

08 Jan 2020