Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2006.09359
Cited By

AWAC: Accelerating Online Reinforcement Learning with Offline Datasets

v1v2v3v4v5v6 (latest)

AWAC: Accelerating Online Reinforcement Learning with Offline Datasets

16 June 2020

Abhishek Gupta

ArXiv (abs)PDF HTML

Papers citing "AWAC: Accelerating Online Reinforcement Learning with Offline Datasets"

50 / 496 papers shown

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

186

0

0

04 Dec 2025

Guided Flow Policy: Learning from High-Value Actions in Offline Reinforcement Learning

Guided Flow Policy: Learning from High-Value Actions in Offline Reinforcement Learning

Franki Nguimatsia Tiofack

Théotime Le Hellard

Nicolas Perrin-Gilbert

Justin Carpentier

312

1

0

03 Dec 2025

Real-World Reinforcement Learning of Active Perception Behaviors

Real-World Reinforcement Learning of Active Perception Behaviors

Gaspard Lambrechts

Dinesh Jayaraman

289

3

0

01 Dec 2025

Forecasting in Offline Reinforcement Learning for Non-stationary Environments

Forecasting in Offline Reinforcement Learning for Non-stationary Environments

259

0

0

01 Dec 2025

Discover, Learn, and Reinforce: Scaling Vision-Language-Action Pretraining with Diverse RL-Generated Trajectories

Discover, Learn, and Reinforce: Scaling Vision-Language-Action Pretraining with Diverse RL-Generated Trajectories

Tianxiang Zhang

254

0

0

24 Nov 2025

One-Step Generative Policies with Q-Learning: A Reformulation of MeanFlow

One-Step Generative Policies with Q-Learning: A Reformulation of MeanFlow

221

4

0

17 Nov 2025

Quantile Q-Learning: Revisiting Offline Extreme Q-Learning with Quantile Regression

Quantile Q-Learning: Revisiting Offline Extreme Q-Learning with Quantile Regression

164

0

0

15 Nov 2025

Treatment Stitching with Schrödinger Bridge for Enhancing Offline Reinforcement Learning in Adaptive Treatment Strategies

Treatment Stitching with Schrödinger Bridge for Enhancing Offline Reinforcement Learning in Adaptive Treatment Strategies

205

3

0

15 Nov 2025

Diffusion Policies with Value-Conditional Optimization for Offline Reinforcement Learning

Diffusion Policies with Value-Conditional Optimization for Offline Reinforcement Learning

297

0

0

12 Nov 2025

Partial Action Replacement: Tackling Distribution Shift in Offline MARL

Partial Action Replacement: Tackling Distribution Shift in Offline MARL

Giovanni Montana

181

1

0

10 Nov 2025

From Static to Dynamic: Enhancing Offline-to-Online Reinforcement Learning via Energy-Guided Diffusion Stratification

From Static to Dynamic: Enhancing Offline-to-Online Reinforcement Learning via Energy-Guided Diffusion Stratification

508

0

0

05 Nov 2025

Adaptive Neighborhood-Constrained Q Learning for Offline Reinforcement Learning

Adaptive Neighborhood-Constrained Q Learning for Offline Reinforcement Learning

192

1

0

04 Nov 2025

Leveraging Discrete Function Decomposability for Scientific Design

Leveraging Discrete Function Decomposability for Scientific Design

James C. Bowden

Jennifer Listgarten

153

0

0

04 Nov 2025

Self-Improving Vision-Language-Action Models with Data Generation via Residual RL

Self-Improving Vision-Language-Action Models with Data Generation via Residual RL

...

693

21

0

30 Oct 2025

LRT-Diffusion: Calibrated Risk-Aware Guidance for Diffusion Policies

LRT-Diffusion: Calibrated Risk-Aware Guidance for Diffusion Policies

136

0

0

28 Oct 2025

RM-RL: Role-Model Reinforcement Learning for Precise Robot Manipulation

RM-RL: Role-Model Reinforcement Learning for Precise Robot Manipulation

230

0

0

16 Oct 2025

RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning

460

24

0

16 Oct 2025

A New Perspective on Transformers in Online Reinforcement Learning for Continuous Control

A New Perspective on Transformers in Online Reinforcement Learning for Continuous Control

Daniil Zelezetsky

Egor Cherepanov

Alexey K. Kovelev

Aleksandr I. Panov

192

2

0

15 Oct 2025

Adversarial Fine-tuning in Offline-to-Online Reinforcement Learning for Robust Robot Control

Adversarial Fine-tuning in Offline-to-Online Reinforcement Learning for Robust Robot Control

AAML OffRL OnRL

370

0

0

15 Oct 2025

Human-in-the-Loop Bandwidth Estimation for Quality of Experience Optimization in Real-Time Video Communication

Human-in-the-Loop Bandwidth Estimation for Quality of Experience Optimization in Real-Time Video Communication

120

0

0

14 Oct 2025

Offline Reinforcement Learning with Generative Trajectory Policies

Offline Reinforcement Learning with Generative Trajectory Policies

185

0

0

13 Oct 2025

Dejavu: Towards Experience Feedback Learning for Embodied Intelligence

Dejavu: Towards Experience Feedback Learning for Embodied Intelligence

Shalayiding Sirejiding

Bayram Bayramli

197

0

0

11 Oct 2025

Continual Learning for Adaptive AI Systems

Continual Learning for Adaptive AI Systems

Md Hasibul Amin

Tamzid Tanvi Alam

297

3

0

09 Oct 2025

Expressive Value Learning for Scalable Offline Reinforcement Learning

Expressive Value Learning for Scalable Offline Reinforcement Learning

Nicolas Espinosa-Dice

Kianté Brantley

307

1

0

09 Oct 2025

DEAS: DEtached value learning with Action Sequence for Scalable Offline RL

DEAS: DEtached value learning with Action Sequence for Scalable Offline RL

179

2

0

09 Oct 2025

RAMAC: Multimodal Risk-Aware Offline Reinforcement Learning and the Role of Behavior Regularization

RAMAC: Multimodal Risk-Aware Offline Reinforcement Learning and the Role of Behavior Regularization

216

0

0

03 Oct 2025

Diffusion Alignment as Variational Expectation-Maximization

Diffusion Alignment as Variational Expectation-Maximization

162

0

0

01 Oct 2025

Integrating Offline Pre-Training with Online Fine-Tuning: A Reinforcement Learning Approach for Robot Social Navigation

Integrating Offline Pre-Training with Online Fine-Tuning: A Reinforcement Learning Approach for Robot Social Navigation

263

0

0

01 Oct 2025

Realistic CDSS Drug Dosing with End-to-end Recurrent Q-learning for Dual Vasopressor Control

Realistic CDSS Drug Dosing with End-to-end Recurrent Q-learning for Dual Vasopressor Control

Alexandre Kalimouttou

Jennifer Yuntong Zhang

Christopher W. Seymour

Romain Pirracchio

198

0

0

01 Oct 2025

Accelerating Transformers in Online RL

Accelerating Transformers in Online RL

Daniil Zelezetsky

Aleksandr I. Panov

159

0

0

30 Sep 2025

Robust Policy Expansion for Offline-to-Online RL under Diverse Data Corruption

Robust Policy Expansion for Offline-to-Online RL under Diverse Data Corruption

394

0

0

29 Sep 2025

Residual Off-Policy RL for Finetuning Behavior Cloning Policies

Residual Off-Policy RL for Finetuning Behavior Cloning Policies

Anusha Nagabandi

293

15

0

23 Sep 2025

Diffusion Policies with Offline and Inverse Reinforcement Learning for Promoting Physical Activity in Older Adults Using Wearable Sensors

Diffusion Policies with Offline and Inverse Reinforcement Learning for Promoting Physical Activity in Older Adults Using Wearable Sensors

Ladda Thiamwong

187

0

0

22 Sep 2025

LLM-Guided Task- and Affordance-Level Exploration in Reinforcement Learning

LLM-Guided Task- and Affordance-Level Exploration in Reinforcement Learning

Zlatan Ajanović

178

1

0

20 Sep 2025

Uncertainty-Based Smooth Policy Regularisation for Reinforcement Learning with Few Demonstrations

Uncertainty-Based Smooth Policy Regularisation for Reinforcement Learning with Few Demonstrations

Charles A. Hepburn

Giovanni Montana

305

0

0

19 Sep 2025

Solving Robotics Tasks with Prior Demonstration via Exploration-Efficient Deep Reinforcement Learning

Solving Robotics Tasks with Prior Demonstration via Exploration-Efficient Deep Reinforcement Learning

Chengyandan Shen

Christoffer Sloth

195

0

0

04 Sep 2025

Retrosynthesis Planning via Worst-path Policy Optimisation in Tree-structured MDPs

Retrosynthesis Planning via Worst-path Policy Optimisation in Tree-structured MDPs

Giovanni Montana

207

0

0

01 Sep 2025

Re:Frame -- Retrieving Experience From Associative Memory

Re:Frame -- Retrieving Experience From Associative Memory

Daniil Zelezetsky

Egor Cherepanov

Aleksandr Panov

106

1

0

26 Aug 2025

Double Check My Desired Return: Transformer with Target Alignment for Offline Reinforcement Learning

Double Check My Desired Return: Transformer with Target Alignment for Offline Reinforcement Learning

221

0

0

22 Aug 2025

Exploiting Policy Idling for Dexterous Manipulation

Exploiting Policy Idling for Dexterous Manipulation

Philemon Brakel

Antonia Bronars

Markus Wulfmeier

240

1

0

21 Aug 2025

Offline-to-Online Reinforcement Learning with Classifier-Free Diffusion Generation

Offline-to-Online Reinforcement Learning with Classifier-Free Diffusion Generation

273

3

0

09 Aug 2025

DiWA: Diffusion Policy Adaptation with World Models

DiWA: Diffusion Policy Adaptation with World Models

Akshay L Chandra

Iman Nematollahi

Chenguang Huang

Tim Welschehold

Wolfram Burgard

233

15

0

05 Aug 2025

RAD: Retrieval High-quality Demonstrations to Enhance Decision-making

RAD: Retrieval High-quality Demonstrations to Enhance Decision-making

254

0

0

21 Jul 2025

Supervised Fine Tuning on Curated Data is Reinforcement Learning (and can be improved)

Supervised Fine Tuning on Curated Data is Reinforcement Learning (and can be improved)

Jost Tobias Springenberg

307

17

0

17 Jul 2025

Reinforcement Learning with Action Chunking

Reinforcement Learning with Action Chunking

496

37

0

10 Jul 2025

Augmenting Online RL with Offline Data is All You Need: A Unified Hybrid RL Algorithm Design and Analysis

Augmenting Online RL with Offline Data is All You Need: A Unified Hybrid RL Algorithm Design and Analysis

504

0

0

01 Jul 2025

Flow-Based Single-Step Completion for Efficient and Expressive Policy Learning

Flow-Based Single-Step Completion for Efficient and Expressive Policy Learning

Prajwal Koirala

452

5

0

26 Jun 2025

Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity

Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity

Samin Yeasar Arnob

288

0

0

20 Jun 2025

CAWR: Corruption-Averse Advantage-Weighted Regression for Robust Policy Optimization

CAWR: Corruption-Averse Advantage-Weighted Regression for Robust Policy Optimization

329

0

0

18 Jun 2025

Steering Your Diffusion Policy with Latent Space Reinforcement Learning

Steering Your Diffusion Policy with Latent Space Reinforcement Learning

Andrew Wagenmaker

Mitsuhiko Nakamoto

Anusha Nagabandi

378

68

0

18 Jun 2025

1 2 3 4...8 9 10

Page 1 of 10