v1v2 (latest)

Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor

4 January 2018

Pieter Abbeel

Papers citing "Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor"

50 / 4,552 papers shown

Compute-Optimal Scaling for Value-Based Deep RL

185

20 Aug 2025

MAVIS: Multi-Objective Alignment via Value-Guided Inference-Time Search

218

19 Aug 2025

FedRAIN-Lite: Federated Reinforcement Algorithms for Improving Idealised Numerical Weather and Climate Models

127

19 Aug 2025

Ethics-Aware Safe Reinforcement Learning for Rare-Event Risk Control in Interactive Urban Driving

Dianzhao Li

Ostap Okhrin

224

19 Aug 2025

CAMAR: Continuous Actions Multi-Agent Routing

Artem Pshenitsyn

Aleksandr I. Panov

A. Skrynnik

138

18 Aug 2025

Large VLM-based Vision-Language-Action Models for Robotic Manipulation: A Survey

247

18 Aug 2025

Synthetic Data is Sufficient for Zero-Shot Visual Generalization from Offline Data

219

17 Aug 2025

Contact-Rich and Deformable Foot Modeling for Locomotion Control of the Human Musculoskeletal System

Haixin Gong

Chen Zhang

Yanan Sui

16 Aug 2025

Beyond Fixed Morphologies: Learning Graph Policies with Trust Region Compensation in Variable Action Spaces

Thomas Gallien

115

16 Aug 2025

Fusing Rewards and Preferences in Reinforcement Learning

Sadegh Khorasani

Saber Salehkaleybar

Negar Kiyavash

Matthias Grossglauser

155

15 Aug 2025

ETTRL: Balancing Exploration and Exploitation in LLM Test-Time Reinforcement Learning Via Entropy Mechanism

166

15 Aug 2025

A learning-driven automatic planning framework for proton PBS treatments of H&N cancers

Qingqing Wang

Liqiang Xiao

Chang Chang

149

14 Aug 2025

Large Model Empowered Embodied AI: A Survey on Decision-Making and Embodied Learning

170

14 Aug 2025

GenFlowRL: Shaping Rewards with Generative Object-Centric Flow in Visual Reinforcement Learning

14 Aug 2025

Towards Safe Imitation Learning via Potential Field-Guided Flow Matching

140

12 Aug 2025

SegDAC: Improving Visual Reinforcement Learning by Extracting Dynamic Object-Centric Representations from Pretrained Vision Models

Alexandre Brown

Glen Berseth

VLM

207

12 Aug 2025

Sparsity-Driven Plasticity in Multi-Task Reinforcement Learning

Aleksandar Todorov

Juan Cardenas-Cartagena

140

09 Aug 2025

Offline-to-Online Reinforcement Learning with Classifier-Free Diffusion Generation

193

09 Aug 2025

Learning Causal Structure Distributions for Robust PlanningIEEE Robotics and Automation Letters (IEEE RA-L), 2025

Alejandro Murillo-Gonzalez

Junhong Xu

Lantao Liu

CML

202

08 Aug 2025

Reparameterization Proximal Policy Optimization

185

08 Aug 2025

DistillDrive: End-to-End Multi-Mode Autonomous Driving Distillation by Isomorphic Hetero-Source Planning Model

07 Aug 2025

Uncertainty-aware Predict-Then-Optimize Framework for Equitable Post-Disaster Power RestorationInternational Joint Conference on Artificial Intelligence (IJCAI), 2024

130

06 Aug 2025

GTPO and GRPO-S: Token and Sequence-Level Reward Shaping with Policy Entropy

270

06 Aug 2025

Sequence Aware SAC Control for Engine Fuel Consumption Optimization in Electrified Powertrain

06 Aug 2025

CogniPlan: Uncertainty-Guided Path Planning with Conditional Generative Layout Prediction

Ritabrata Chakraborty

Guillaume Sartoretti

118

05 Aug 2025

Scaling DRL for Decision Making: A Survey on Data, Network, and Training Budget Strategies

178

05 Aug 2025

Reinforcement Learning for Target Zone Blood Glucose Control

Muhammad Salman Haleem

Baoxiang Wang

OffRL OOD

05 Aug 2025

Computationally efficient Gauss-Newton reinforcement learning for model predictive control

D. Brandner

Sebastien Gros

Sergio Lucia

128

04 Aug 2025

Multi-Policy Pareto Front Tracking Based Online and Offline Multi-Objective Reinforcement Learning

140

04 Aug 2025

Decomposing the Entropy-Performance Exchange: The Missing Keys to Unlocking Effective Reinforcement Learning

153

04 Aug 2025

Is Exploration or Optimization the Problem for Deep Reinforcement Learning?

Glen Berseth

OffRL

154

02 Aug 2025

MoRe-ERL: Learning Motion Residuals using Episodic Reinforcement LearningIEEE Robotics and Automation Letters (IEEE RA-L), 2025

159

02 Aug 2025

OID-PPO: Optimal Interior Design using Proximal Policy Optimization by Transforming Design Guidelines into Reward Functions

01 Aug 2025

Learning Pivoting Manipulation with Force and Vision Feedback Using Optimization-based Demonstrations

241

01 Aug 2025

Quality-of-Service Aware LLM Routing for Edge Computing with Multiple ExpertsIEEE Transactions on Mobile Computing (IEEE TMC), 2025

136

01 Aug 2025

Learning Network Dismantling Without Handcrafted Inputs

Homayoun Hamedmoghadam

GNN

180

01 Aug 2025

UAV-ON: A Benchmark for Open-World Object Goal Navigation with Aerial Agents

284

01 Aug 2025

Directional Ensemble Aggregation for Actor-Critics

184

31 Jul 2025

One-Step Flow Policy Mirror Descent

258

31 Jul 2025

Personalized Education with Ranking Alignment Recommendation

136

31 Jul 2025

Benchmarking Massively Parallelized Multi-Task Reinforcement Learning for Robotics Tasks

275

31 Jul 2025

Efficient Differentially Private Fine-Tuning of LLMs via Reinforcement Learning

140

30 Jul 2025

Learning to Prune Branches in Modern Tree-Fruit OrchardsIEEE International Conference on Robotics and Automation (ICRA), 2025

Abhinav Jain

Cindy Grimm

Stefan Lee

30 Jul 2025

On Policy Stochasticity in Mutual Information Optimal Control of Linear Systems

Shoju Enami

Kenji Kashima

106

29 Jul 2025

Assistax: A Hardware-Accelerated Reinforcement Learning Benchmark for Assistive Robotics

Christiane B. Wiebel-Herboth

Subramanian Ramamoorthy

Stefano V. Albrecht

156

29 Jul 2025

DeepGo: Predictive Directed Greybox FuzzingNetwork and Distributed System Security Symposium (NDSS), 2025

278

29 Jul 2025

MoDeSuite: Robot Learning Task Suite for Benchmarking Mobile Manipulation with Deformable Objects

178

29 Jul 2025

Handoff Design in User-Centric Cell-Free Massive MIMO Networks Using DRLIEEE Transactions on Communications (IEEE Trans. Commun.), 2025

28 Jul 2025

Geometry of Neural Reinforcement Learning in Continuous State and Action SpacesInternational Conference on Learning Representations (ICLR), 2025

Saket Tiwari

Omer Gottesman

George Konidaris

226

28 Jul 2025

Free Energy-Inspired Cognitive Risk Integration for AV Navigation in Pedestrian-Rich Environments

190

28 Jul 2025