v1v2 (latest)

Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor

4 January 2018

Pieter Abbeel

Papers citing "Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor"

50 / 4,552 papers shown

Mind Your Entropy: From Maximum Entropy to Trajectory Entropy-Constrained RL

25 Oct 2025

Toward Humanoid Brain-Body Co-design: Joint Optimization of Control and Morphology for Fall Recovery

160

25 Oct 2025

Computational Hardness of Reinforcement Learning with Partial

q^π

-Realizability

Shayan Karimi

Xiaoqi Tan

155

24 Oct 2025

DEEDEE: Fast and Scalable Out-of-Distribution Dynamics Detection

Tala Aljaafari

Varun Kanade

Philip Torr

Christian Schroeder de Witt

OODD OffRL

260

24 Oct 2025

GSWorld: Closed-Loop Photo-Realistic Simulation Suite for Robotic Manipulation

184

23 Oct 2025

Multi-Modal Decentralized Reinforcement Learning for Modular Reconfigurable Lunar Robots

Ashutosh Mishra

S. Santra

Elian Neppel

Edoardo M. Rossi Lombardi

Shamistan Karimov

Kentaro Uno

Kazuya Yoshida

23 Oct 2025

Hierarchical DLO Routing with Reinforcement Learning and In-Context Vision-language Models

129

22 Oct 2025

A Communication-Efficient Decentralized Actor-Critic Algorithm

Xiaoxing Ren

Nicola Bastianello

Thomas Parisini

Andreas A. Malikopoulos

105

22 Oct 2025

Continual Knowledge Adaptation for Reinforcement Learning

196

22 Oct 2025

SEA: Semantic Map Prediction for Active Exploration of Uncertain Areas

157

22 Oct 2025

Efficient Model-Based Reinforcement Learning for Robot Control via Online Learning

124

21 Oct 2025

NTKMTL: Mitigating Task Imbalance in Multi-Task Learning from Neural Tangent Kernel Perspective

128

21 Oct 2025

Actor-Free Continuous Control via Structurally Maximizable Q-Functions

117

21 Oct 2025

Heterogeneous Adversarial Play in Interactive Environments

153

21 Oct 2025

ADPO: Anchored Direct Preference Optimization

Wang Zixian

318

21 Oct 2025

ALPINE: A Lightweight and Adaptive Privacy-Decision Agent Framework for Dynamic Edge Crowdsensing

117

20 Oct 2025

RESample: A Robust Data Augmentation Framework via Exploratory Sampling for Robotic Manipulation

205

20 Oct 2025

Provably Optimal Reinforcement Learning under Safety Filtering

129

20 Oct 2025

D2C-HRHR: Discrete Actions with Double Distributional Critics for High-Risk-High-Return Tasks

100

20 Oct 2025

Closing the Sim2Real Performance Gap in RL

160

20 Oct 2025

Multimodal Safety Is Asymmetric: Cross-Modal Exploits Unlock Black-Box MLLMs Jailbreaks

121

20 Oct 2025

Consistent Zero-Shot Imitation with Contrastive Goal Inference

Kathryn Wantlin

Chongyi Zheng

Benjamin Eysenbach

187

20 Oct 2025

Continuous Q-Score Matching: Diffusion Guided Reinforcement Learning for Continuous-Time Control

Chengxiu Hua

Jiawen Gu

Yushun Tang

261

20 Oct 2025

Iterative Refinement of Flow Policies in Probability Space for Online Reinforcement Learning

183

17 Oct 2025

HEADER: Hierarchical Robot Exploration via Attention-Based Deep Reinforcement Learning with Expert-Guided Reward

106

17 Oct 2025

ProSh: Probabilistic Shielding for Model-free Reinforcement Learning

Edwin Hamel-De le Court

Gaspard Ohlmann

Francesco Belardinelli

141

17 Oct 2025

OffSim: Offline Simulator for Model-based Offline Inverse Reinforcement Learning

104

17 Oct 2025

A Hard-Label Black-Box Evasion Attack against ML-based Malicious Traffic Detection Systems

106

16 Oct 2025

RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

350

16 Oct 2025

ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning

Roger Creus Castanyer

215

16 Oct 2025

SkyDreamer: Interpretable End-to-End Vision-Based Drone Racing with Model-Based Reinforcement Learning

Aderik Verraest

Stavrow A. Bahnam

Robin Ferede

Guido C. H. E de Croon

Christophe De Wagter

178

16 Oct 2025

ViTacGen: Robotic Pushing with Vision-to-Touch GenerationIEEE Robotics and Automation Letters (IEEE RA-L), 2025

149

15 Oct 2025

A New Perspective on Transformers in Online Reinforcement Learning for Continuous Control

143

15 Oct 2025

Transfer learning strategies for accelerating reinforcement-learning-based flow control

Saeed Salehi

AI4CE

121

15 Oct 2025

STEMS: Spatial-Temporal Enhanced Safe Multi-Agent Coordination for Building Energy Management

15 Oct 2025

Thompson Sampling via Fine-Tuning of LLMs

181

15 Oct 2025

Simplicial Embeddings Improve Sample Efficiency in Actor-Critic Agents

147

15 Oct 2025

Bayesian Optimization for Dynamic Pricing and Learning

Anush Anand

Pranav Agrawal

Tejas Bodas

133

14 Oct 2025

Diffusion Models for Reinforcement Learning: Foundations, Taxonomy, and Development

208

14 Oct 2025

Finite-time Convergence Analysis of Actor-Critic with Evolving Reward

Rui Hu

Yu Chen

Longbo Huang

150

14 Oct 2025

Human-in-the-Loop Bandwidth Estimation for Quality of Experience Optimization in Real-Time Video Communication

14 Oct 2025

Rethinking the Role of Dynamic Sparse Training for Scalable Deep Reinforcement Learning

171

14 Oct 2025

Inclusive Fitness as a Key Step Towards More Advanced Social Behaviors in Multi-Agent Reinforcement Learning Settings

Andries Rosseau

Raphael Avalos

Ann Nowé

14 Oct 2025

Heterogeneous RBCs via deep multi-agent reinforcement learning

Federico Gabriele

Aldo Glielmo

Marco Taboga

14 Oct 2025

ADARL: Adaptive Low-Rank Structures for Robust Policy Learning under Uncertainty

112

13 Oct 2025

Constraint-Aware Reinforcement Learning via Adaptive Action Scaling

Murad Dawood

Usama Ahmed Siddiquie

Shahram Khorshidi

Maren Bennewitz

156

13 Oct 2025

Game-Theoretic Risk-Shaped Reinforcement Learning for Safe Autonomous Driving

125

13 Oct 2025

Reinforced sequential Monte Carlo for amortised sampling

126

13 Oct 2025

Refinery: Active Fine-tuning and Deployment-time Optimization for Contact-Rich Policies

13 Oct 2025

A Primer on SO(3) Action Representations in Deep Reinforcement Learning

Martin Schuck

Sherif Samy

Angela P. Schoellig

101

13 Oct 2025