Distributed Distributional Deterministic Policy Gradients

23 April 2018

David Budden

Dan Horgan

Papers citing "Distributed Distributional Deterministic Policy Gradients"

50 / 108 papers shown

Title
UC-MOA: Utility-Conditioned Multi-Objective Alignment for Distributional Pareto-Optimality Zelei Cheng Xin-Qiang Cai Yuting Tang Pushi Zhang Boming Yang Xinyu Xing Xinyu Xing 49 0 0 10 Mar 2025
IGN : Implicit Generative Networks Haozheng Luo Tianyi Wu Feiyu Han Zhijun Yan OffRL 29 1 0 24 Feb 2025
Adaptive Data Exploitation in Deep Reinforcement Learning Mingqi Yuan Bo Li Xin Jin Wenjun Zeng OffRL 175 0 0 22 Jan 2025
ManiSkill-HAB: A Benchmark for Low-Level Manipulation in Home Rearrangement Tasks Arth Shukla Stone Tao Hao Su 91 6 0 09 Dec 2024
Acceleration for Deep Reinforcement Learning using Parallel and Distributed Computing: A Survey Zhihong Liu Xin Xu Peng Qiao Dongsheng Li OffRL 22 2 0 08 Nov 2024
Q-Distribution guided Q-learning for offline reinforcement learning: Uncertainty penalized Q-value via consistency model Jing Zhang Linjiajie Fang Kexin Shi Wenjia Wang Bing-Yi Jing OffRL 36 0 0 27 Oct 2024
Parallel Distributional Deep Reinforcement Learning for Mapless Navigation of Terrestrial Mobile Robots V. A. Kich A. H. Kolling J. C. Jesus Gabriel V. Heisler Hiago Jacobs ... André da Silva Kelbouscas Akihisa Ohya Ricardo B. Grando Paulo Lilles Jorge Drews-Jr D. T. Gamarra 30 3 0 11 Aug 2024
UDQL: Bridging The Gap between MSE Loss and The Optimal Value Function in Offline Reinforcement Learning Yu Zhang Rui Yu Zhipeng Yao Wenyuan Zhang Jun Wang Liming Zhang OffRL 53 0 0 05 Jun 2024
Policy Gradient Methods for Risk-Sensitive Distributional Reinforcement Learning with Provable Convergence Minheng Xiao Xian Yu Lei Ying 40 2 0 23 May 2024
RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes Kyle Stachowicz Sergey Levine 17 6 0 07 May 2024
CTD4 -- A Deep Continuous Distributional Actor-Critic Agent with a Kalman Fusion of Multiple Critics David Valencia Henry Williams Trevor Gee Bruce A MacDonaland Minas V. Liarokapis Minas Liarokapis OffRL 24 2 0 04 May 2024
Transductive Reward Inference on Graph B. Qu Xiaofeng Cao Qing-Wu Guo Yi Chang Ivor W. Tsang Chengqi Zhang OffRL 35 0 0 06 Feb 2024
Zero-Shot Reinforcement Learning via Function Encoders Tyler Ingebrand Amy Zhang Ufuk Topcu OffRL 40 2 0 30 Jan 2024
MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot Learning Rafael Rafailov Kyle Hatch Victor Kolev John D. Martin Mariano Phielipp Chelsea Finn OffRL OnRL 22 9 0 06 Jan 2024
Spreeze: High-Throughput Parallel Reinforcement Learning Framework Jing Hou Guang Chen Ruiqi Zhang Zhijun Li Shangding Gu Changjun Jiang OffRL 26 2 0 11 Dec 2023
Provable Representation with Efficient Planning for Partial Observable Reinforcement Learning Hongming Zhang Tongzheng Ren Chenjun Xiao Dale Schuurmans Bo Dai 45 3 0 20 Nov 2023
Robust Adversarial Reinforcement Learning via Bounded Rationality Curricula Aryaman Reddi Maximilian Tölle Jan Peters Georgia Chalvatzaki Carlo DÉramo 39 4 0 03 Nov 2023
On the Theory of Risk-Aware Agents: Bridging Actor-Critic and Economics Michal Nauman Marek Cygan 35 1 0 30 Oct 2023
SDGym: Low-Code Reinforcement Learning Environments using System Dynamics Models Emmanuel Klu Sameer Sethi DJ Passey Donald Martin AI4CE SyDa 31 0 0 19 Oct 2023
Boosting Continuous Control with Consistency Policy Yuhui Chen Haoran Li Dongbin Zhao OffRL 41 20 0 10 Oct 2023
Learning Risk-Aware Quadrupedal Locomotion using Distributional Reinforcement Learning Lukas Schneider Jonas Frey Takahiro Miki Marco Hutter 30 9 0 25 Sep 2023
Bag of Policies for Distributional Deep Exploration Asen Nachkov Luchen Li Giulia Luise Filippo Valdettaro Aldo A. Faisal OffRL 40 0 0 03 Aug 2023
Policy Gradient Methods in the Presence of Symmetries and State Abstractions Prakash Panangaden S. Rezaei-Shoshtari Rosie Zhao D. Meger Doina Precup 25 2 0 09 May 2023
MAC-PO: Multi-Agent Experience Replay via Collective Priority Optimization Yongsheng Mei Hanhan Zhou Tian-Shing Lan Guru Venkataramani Peng Wei 39 38 0 21 Feb 2023
Maneuver Decision-Making For Autonomous Air Combat Through Curriculum Learning And Reinforcement Learning With Sparse Rewards Yuxin Wei Hong-Peng Zhang Chang Huang 18 3 0 12 Feb 2023
Distributional GFlowNets with Quantile Flows Dinghuai Zhang L. Pan Ricky T. Q. Chen Aaron Courville Yoshua Bengio 29 25 0 11 Feb 2023
Distillation Policy Optimization Jianfei Ma OffRL 23 1 0 01 Feb 2023
On Realization of Intelligent Decision-Making in the Real World: A Foundation Decision Model Perspective Ying Wen Bo Liu M. Zhou Shufang Hou Zhe Cao Chenyang Le Jingxiao Chen Zheng Tian Weinan Zhang Jun Wang AI4CE 23 10 0 24 Dec 2022
Learning Physically Realizable Skills for Online Packing of General 3D Shapes Hang Zhao Zherong Pan Yang Yu Kai Xu OffRL 37 13 0 05 Dec 2022
Quantile Constrained Reinforcement Learning: A Reinforcement Learning Framework Constraining Outage Probability Whiyoung Jung Myungsik Cho Jongeui Park Young-Jin Sung 32 4 0 28 Nov 2022
Solving Continuous Control via Q-learning Tim Seyde Peter Werner Wilko Schwarting Igor Gilitschenski Martin Riedmiller Daniela Rus Markus Wulfmeier OffRL LRM 35 22 0 22 Oct 2022
Learning Robust Dynamics through Variational Sparse Gating A. Jain Shivakanth Sujit S. Joshi Vincent Michalski Danijar Hafner Samira Ebrahimi Kahou 27 8 0 21 Oct 2022
RMBench: Benchmarking Deep Reinforcement Learning for Robotic Manipulator Control Yanfei Xiang Xin Wang Shu Hu Bin Zhu Xiaomeng Huang Xi Wu Siwei Lyu SSL 29 5 0 20 Oct 2022
Long N-step Surrogate Stage Reward to Reduce Variances of Deep Reinforcement Learning in Complex Problems Junmin Zhong Ruofan Wu J. Si LRM 13 0 0 10 Oct 2022
Reinforcement Learning Algorithms: An Overview and Classification Fadi AlMahamid Katarina Grolinger 16 40 0 29 Sep 2022
Dynamic Prompt Learning via Policy Gradient for Semi-structured Mathematical Reasoning Pan Lu Liang Qiu Kai-Wei Chang Ying Nian Wu Song-Chun Zhu Tanmay Rajpurohit Peter Clark A. Kalyan ReLM LRM 43 267 0 29 Sep 2022
Ensemble Reinforcement Learning in Continuous Spaces -- A Hierarchical Multi-Step Approach for Policy Training Gang Chen Victoria Huang OffRL 37 0 0 29 Sep 2022
Optimizing Industrial HVAC Systems with Hierarchical Reinforcement Learning William Wong Praneet Dutta Octavian Voicu Yuri Chervonyi Cosmin Paduraru Jerry Luo OffRL AI4CE 28 5 0 16 Sep 2022
Continuous MDP Homomorphisms and Homomorphic Policy Gradient S. Rezaei-Shoshtari Rosie Zhao Prakash Panangaden D. Meger Doina Precup 33 18 0 15 Sep 2022
Entropy Enhanced Multi-Agent Coordination Based on Hierarchical Graph Learning for Continuous Action Space Yining Chen Ke Wang Guang-hua Song Xiaohong Jiang 25 3 0 23 Aug 2022
Minimum Description Length Control Theodore H. Moskovitz Ta-Chu Kao M. Sahani M. Botvinick 26 1 0 17 Jul 2022
Auto-Encoding Adversarial Imitation Learning Kaifeng Zhang Rui Zhao Ziming Zhang Yang Gao 19 1 0 22 Jun 2022
Reincarnating Reinforcement Learning: Reusing Prior Computation to Accelerate Progress Rishabh Agarwal Max Schwarzer Pablo Samuel Castro Aaron C. Courville Marc G. Bellemare OffRL OnRL 31 63 0 03 Jun 2022
Flow-based Recurrent Belief State Learning for POMDPs Xiaoyu Chen Yao Mu Ping Luo Sheng Li Jianyu Chen 43 18 0 23 May 2022
A Generalist Agent Scott E. Reed Konrad Zolna Emilio Parisotto Sergio Gomez Colmenarejo Alexander Novikov ... Yutian Chen R. Hadsell Oriol Vinyals Mahyar Bordbar Nando de Freitas LM&Ro LLMAG AI4CE 56 787 0 12 May 2022
Revisiting Gaussian mixture critics in off-policy reinforcement learning: a sample-based approach Bobak Shahriari A. Abdolmaleki Arunkumar Byravan A. Friesen Siqi Liu Jost Tobias Springenberg N. Heess Matthew W. Hoffman Martin Riedmiller OffRL 43 9 0 21 Apr 2022
Learning Purely Tactile In-Hand Manipulation with a Torque-Controlled Hand Leon Sievers Johannes Pitz Berthold Bäuml 19 37 0 07 Apr 2022
Asynchronous Reinforcement Learning for Real-Time Control of Physical Robots Yufeng Yuan Rupam Mahmood OffRL 28 19 0 23 Mar 2022
Reinforcement Learning with Heterogeneous Data: Estimation and Inference Elynn Y. Chen Rui Song Michael I. Jordan OffRL 21 10 0 31 Jan 2022
Pessimistic Model Selection for Offline Deep Reinforcement Learning Chao-Han Huck Yang Zhengling Qi Yifan Cui Pin-Yu Chen OffRL 24 4 0 29 Nov 2021