v1v2 (latest)

Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor

4 January 2018

Pieter Abbeel

Papers citing "Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor"

50 / 4,552 papers shown

FlowRL: Matching Reward Distributions for LLM Reasoning

...

246

18 Sep 2025

Evolving Language Models without Labels: Majority Drives Selection, Novelty Promotes Variation

177

18 Sep 2025

Sample Efficient Experience Replay in Non-stationary Environments

...

132

18 Sep 2025

SHaRe-RL: Structured, Interactive Reinforcement Learning for Contact-Rich Industrial Assembly Tasks

104

17 Sep 2025

StableTracker: Learning to Stably Track Target via Differentiable Simulation

160

17 Sep 2025

Reinforcement Learning for Robotic Insertion of Flexible Cables in Industrial Settings

116

17 Sep 2025

SEG-Parking: Towards Safe, Efficient, and Generalizable Autonomous Parking via End-to-End Offline Reinforcement Learning

105

17 Sep 2025

Online Learning of Deceptive Policies under Intermittent Observation

122

17 Sep 2025

Large Language Model-Empowered Decision Transformer for UAV-Enabled Data Collection

106

17 Sep 2025

EvoEmpirBench: Dynamic Spatial Reasoning with Agent-ExpVer

205

16 Sep 2025

Force-Modulated Visual Policy for Robot-Assisted Dressing with Arm Motions

113

16 Sep 2025

GRATE: a Graph transformer-based deep Reinforcement learning Approach for Time-efficient autonomous robot Exploration

144

16 Sep 2025

Empowering Multi-Robot Cooperation via Sequential World Models

212

16 Sep 2025

MEMBOT: Memory-Based Robot in Intermittent POMDP

Youzhi Liang

Eyan Noronha

OffRL

14 Sep 2025

Mutual Information Tracks Policy Coherence in Reinforcement Learning

Cameron Reid

Wael Hafez

Amirhossein Nazeri

120

12 Sep 2025

Reinforcement learning for spin torque oscillator tasks

J. Mojsiejuk

Sławomir Ziętek

W. Skowroñski

12 Sep 2025

CDE: Curiosity-Driven Exploration for Efficient Reinforcement Learning in Large Language Models

...

176

11 Sep 2025

Off Policy Lyapunov Stability in Reinforcement Learning

Sarvan Gill

Daniela Constantinescu

11 Sep 2025

Sample-Efficient Online Control Policy Learning with Real-Time Recursive Model Updates

Zixin Zhang

James Avtges

Todd Murphey

121

10 Sep 2025

RAPID Quantum Detection and Demodulation of Covert Communications: Breaking the Noise Limit with Solid-State Spin Sensors

Amirhossein Taherpour

Abbas Taherpour

Tamer Khattab

110

09 Sep 2025

The Choice of Divergence: A Neglected Key to Mitigating Diversity Collapse in Reinforcement Learning with Verifiable Reward

...

187

09 Sep 2025

Interactive Shaping of Granular Media Using Reinforcement Learning

117

08 Sep 2025

Simulation Priors for Data-Efficient Deep Learning

135

06 Sep 2025

TalkToAgent: A Human-centric Explanation of Reinforcement Learning Agents with Large Language Models

155

05 Sep 2025

DeGuV: Depth-Guided Visual Reinforcement Learning for Generalization and Interpretability in Manipulation

121

05 Sep 2025

Solving Robotics Tasks with Prior Demonstration via Exploration-Efficient Deep Reinforcement Learning

Chengyandan Shen

Christoffer Sloth

OffRL

113

04 Sep 2025

Learning Multi-Stage Pick-and-Place with a Legged Mobile ManipulatorIEEE Robotics and Automation Letters (IEEE RA-L), 2025

204

04 Sep 2025

Bootstrapping Reinforcement Learning with Sub-optimal Policies for Autonomous Driving

04 Sep 2025

Reinforcement Learning for Robust Ageing-Aware Control of Li-ion Battery Systems with Data-Driven Formal Verification

Rudi Coppola

Hovsep Touloujian

Pierfrancesco Ombrini

Manuel Mazo Jr

OffRL

04 Sep 2025

On Entropy Control in LLM-RL Algorithms

Han Shen

155

03 Sep 2025

Uncertainty-driven Adaptive Exploration

Leonidas Bakopoulos

Georgios Chalkiadakis

184

03 Sep 2025

DUViN: Diffusion-Based Underwater Visual Navigation via Knowledge-Transferred Depth Features

124

03 Sep 2025

Non-conflicting Energy Minimization in Reinforcement Learning based Robot Control

135

01 Sep 2025

Adaptive Vehicle Speed Classification via BMCNN with Reinforcement Learning-Enhanced Acoustic Processing

31 Aug 2025

Jacobian Exploratory Dual-Phase Reinforcement Learning for Dynamic Endoluminal Navigation of Deformable Continuum Robots

Yu Tian

Chi Kit Ng

Hongliang Ren

30 Aug 2025

LLM-Driven Policy Diffusion: Enhancing Generalization in Offline Reinforcement Learning

Hanping Zhang

Yuhong Guo

OffRL

178

30 Aug 2025

Machine Intelligence on the Edge: Interpretable Cardiac Pattern Localisation Using Reinforcement Learning

29 Aug 2025

First Order Model-Based RL through Decoupled Backpropagation

Joseph Amigo

Rooholla Khorrambakht

Elliot Chane-Sane

Nicolas Mansard

Ludovic Righetti

161

29 Aug 2025

Convergence of regularized agent-state-based Q-learning in POMDPs

Amit Sinha

Matthieu Geist

Aditya Mahajan

29 Aug 2025

Single Agent Robust Deep Reinforcement Learning for Bus Fleet Control

Yifan Zhang

28 Aug 2025

Divide, Discover, Deploy: Factorized Skill Learning with Symmetry and Style Priors

151

27 Aug 2025

MUA-RL: Multi-turn User-interacting Agent Reinforcement Learning for agentic tool use

119

26 Aug 2025

Stability and Generalization for Bellman Residuals

Enoch H. Kang

Kyoungseok Jang

OffRL

113

26 Aug 2025

ANO : Faster is Better in Noisy Landscape

Adrien Kegreisz

ODL

381

25 Aug 2025

Convergence and Generalization of Anti-Regularization for Parametric Models

Dongseok Kim

Wonjun Jeong

Gisung Oh

231

24 Aug 2025

Autonomous UAV Flight Navigation in Confined Spaces: A Reinforcement Learning Approach

164

22 Aug 2025

A Dynamical Systems Framework for Reinforcement Learning Safety and Robustness Verification

Ahmed Nasir

Abdelhafid Zenati

21 Aug 2025

Understanding Action Effects through Instrumental Empowerment in Multi-Agent Reinforcement Learning

156

21 Aug 2025

Search-Based Credit Assignment for Offline Preference-Based Reinforcement Learning

245

21 Aug 2025

Compute-Optimal Scaling for Value-Based Deep RL

185

20 Aug 2025