v1v2v3v4 (latest)

Offline Reinforcement Learning as One Big Sequence Modeling Problem

Neural Information Processing Systems (NeurIPS), 2021

3 June 2021

ArXiv (abs)PDF HTML HuggingFace (2 upvotes)

Papers citing "Offline Reinforcement Learning as One Big Sequence Modeling Problem"

50 / 530 papers shown

Towards Understanding Transformers in Learning Random Walks

Wei Shi

Yuan Cao

133

28 Nov 2025

Efficient Diffusion Planning with Temporal Diffusion

219

26 Nov 2025

Dynamical Properties of Tokens in Self-Attention and Effects of Positional Encoding

117

25 Nov 2025

SENTINEL: A Fully End-to-End Language-Action Model for Humanoid Whole Body Control

450

24 Nov 2025

A Comparison Between Decision Transformers and Traditional Offline Reinforcement Learning Algorithms

Ali Murtaza Caunhye

Asad Jeewa

190

20 Nov 2025

Quantile Q-Learning: Revisiting Offline Extreme Q-Learning with Quantile Regression

164

15 Nov 2025

Learning to Focus: Prioritizing Informative Histories with Structured Attention Mechanisms in Partially Observable Reinforcement Learning

Daniel De Dios Allegue

J. He

F. Oliehoek

OffRL

338

10 Nov 2025

Towards Reinforcement Learning Based Log Loading Automation

103

30 Oct 2025

Online Optimization for Offline Safe Reinforcement Learning

179

24 Oct 2025

Modeling Expert Interactions in Sparse Mixture of Experts via Graph Structures

Minh Khoi Nguyen Nhat

227

18 Oct 2025

A New Perspective on Transformers in Online Reinforcement Learning for Continuous Control

192

15 Oct 2025

Robust Adversarial Reinforcement Learning in Stochastic Games via Sequence Modeling

Xiaohang Tang

Zhuowen Cheng

Satyabrat Kumar

140

13 Oct 2025

Learning with Incomplete Context: Linear Contextual Bandits with Pretrained Imputation

Hao Yan

Heyan Zhang

Yongyi Guo

213

10 Oct 2025

Expressive Value Learning for Scalable Offline Reinforcement Learning

Nicolas Espinosa-Dice

Kianté Brantley

Wen Sun

OffRL

308

09 Oct 2025

Test-Time Graph Search for Goal-Conditioned Reinforcement Learning

171

08 Oct 2025

RAMAC: Multimodal Risk-Aware Offline Reinforcement Learning and the Role of Behavior Regularization

219

03 Oct 2025

Integrating Offline Pre-Training with Online Fine-Tuning: A Reinforcement Learning Approach for Robot Social Navigation

264

01 Oct 2025

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

194

01 Oct 2025

Accelerating Transformers in Online RL

159

30 Sep 2025

MUVLA: Learning to Explore Object Navigation via Map Understanding

154

30 Sep 2025

Understanding and Enhancing the Planning Capability of Language Models via Multi-Token Prediction

291

27 Sep 2025

Structural Information-based Hierarchical Diffusion for Offline Reinforcement Learning

166

26 Sep 2025

DAWM: Diffusion Action World Models for Offline Reinforcement Learning via Action-Inferred Transitions

162

23 Sep 2025

Mental Accounts for Actions: EWA-Inspired Attention in Decision Transformers

Zahra Aref

Narayan B. Mandayam

OffRL

179

19 Sep 2025

An Uncertainty-Weighted Decision Transformer for Navigation in Dense, Complex Driving Scenarios

184

16 Sep 2025

Generalizing Beyond Suboptimality: Offline Reinforcement Learning Learns Effective Scheduling through Random Data

290

12 Sep 2025

floq: Training Critics via Flow-Matching for Scaling Compute in Value-Based RL

278

08 Sep 2025

Wavelet Fourier Diffuser: Frequency-Aware Diffusion Model for Reinforcement Learning

Yifu Luo

Yongzhe Chang

Xueqian Wang

195

04 Sep 2025

Generative Auto-Bidding in Large-Scale Competitive Auctions via Diffusion Completer-Aligner

183

03 Sep 2025

Generative Sequential Notification Optimization via Multi-Objective Decision Transformers

Gokulraj Mohanasundaram

Fedor Borisyuk

Prakruthi Prabhakar

OffRL

285

02 Sep 2025

Learning to Ask: Decision Transformers for Adaptive Quantitative Group Testing

Mahdi Soleymani

Tara Javidi

205

01 Sep 2025

Adaptive Scaling of Policy Constraints for Offline Reinforcement Learning

171

27 Aug 2025

Re:Frame -- Retrieving Experience From Associative Memory

108

26 Aug 2025

Double Check My Desired Return: Transformer with Target Alignment for Offline Reinforcement Learning

222

22 Aug 2025

Learning to See and Act: Task-Aware Virtual View Exploration for Robotic Manipulation

...

498

07 Aug 2025

CLASS: Contrastive Learning via Action Sequence Supervision for Robot Manipulation

239

03 Aug 2025

GeoExplorer: Active Geo-localization with Curiosity-Driven Exploration

227

31 Jul 2025

RAD: Retrieval High-quality Demonstrations to Enhance Decision-making

257

21 Jul 2025

Towards Bio-Inspired Robotic Trajectory Planning via Self-Supervised RNNInternational Conference on Artificial Neural Networks (ICANN), 2025

212

02 Jul 2025

TransDreamerV3: Implanting Transformer In DreamerV3

Shruti Sadanand Dongare

Amun Kharel

Jonathan Samuel

Xiaona Zhou

154

20 Jun 2025

Scaling Algorithm Distillation for Continuous Control with Mamba

Samuel Beaussant

Mehdi Mounsif

269

16 Jun 2025

SAIL: Faster-than-Demonstration Execution of Imitation Learning Policies

Nadun Ranawaka Arachchige

...

312

13 Jun 2025

Intention-Conditioned Flow Occupancy Models

395

10 Jun 2025

How to Provably Improve Return Conditioned Supervised Learning?

274

10 Jun 2025

Policy-Based Trajectory Clustering in Offline Reinforcement Learning

393

10 Jun 2025

Accelerating Diffusion Planners in Offline RL via Reward-Aware Consistency Trajectory Distillation

385

09 Jun 2025

Local Manifold Approximation and Projection for Manifold-Aware Diffusion Planning

Kyowoon Lee

Jaesik Choi

DiffM

396

01 Jun 2025

Mastering Massive Multi-Task Reinforcement Learning via Mixture-of-Expert Decision Transformer

253

30 May 2025

Normalizing Flows are Capable Models for RL

Raj Ghugare

Benjamin Eysenbach

OffRL AI4CE

421

29 May 2025

BOFormer: Learning to Solve Multi-Objective Bayesian Optimization via Non-Markovian RLInternational Conference on Learning Representations (ICLR), 2025

381

28 May 2025