Decision Transformer: Reinforcement Learning via Sequence Modeling

2 June 2021

Aravind Rajeswaran

Pieter Abbeel

Papers citing "Decision Transformer: Reinforcement Learning via Sequence Modeling"

50 / 314 papers shown

Title
Zero-Shot Reinforcement Learning from Low Quality Data Scott Jeen Tom Bewley Jonathan M. Cullen OffRL OnRL 34 0 0 26 Sep 2023
Machine Learning Meets Advanced Robotic Manipulation Saeid Nahavandi R. Alizadehsani D. Nahavandi Chee Peng Lim Kevin Kelly Fernando Bello 24 17 0 22 Sep 2023
OpenChat: Advancing Open-source Language Models with Mixed-Quality Data Guan-Bo Wang Sijie Cheng Xianyuan Zhan Xiangang Li Sen Song Yang Liu ALM 13 227 0 20 Sep 2023
Subwords as Skills: Tokenization for Sparse-Reward Reinforcement Learning David Yunis Justin Jung Falcon Z. Dai Matthew R. Walter OffRL 35 0 0 08 Sep 2023
Hundreds Guide Millions: Adaptive Offline Reinforcement Learning with Expert Guidance Qisen Yang Shenzhi Wang Qihang Zhang Gao Huang Shiji Song OffRL OnRL 21 8 0 04 Sep 2023
Rule-Based Error Detection and Correction to Operationalize Movement Trajectory Classification B. Xi Kevin Scaria Paulo Shakarian Paulo Shakarian 32 2 0 28 Aug 2023
MTD-GPT: A Multi-Task Decision-Making GPT Model for Autonomous Driving at Unsignalized Intersections Jiaqi Liu Peng Hang Xiao Qi Jianqiang Wang Jian-jun Sun 23 42 0 30 Jul 2023
Dynamic deep-reinforcement-learning algorithm in Partially Observed Markov Decision Processes Saki Omi Hyo-Sang Shin Namhoon Cho Antonios Tsourdos 19 3 0 29 Jul 2023
Benchmarking Offline Reinforcement Learning on Real-Robot Hardware Nico Gürtler Sebastian Blaes Pavel Kolev Felix Widmaier Manuel Wüthrich Stefan Bauer Bernhard Schölkopf Georg Martius OffRL 30 28 0 28 Jul 2023
PASTA: Pretrained Action-State Transformer Agents Raphael Boige Yannis Flet-Berliac Arthur Flajolet Guillaume Richard Thomas Pierrot LM&Ro OffRL 26 5 0 20 Jul 2023
Towards Self-Assembling Artificial Neural Networks through Neural Developmental Programs Elias Najarro Shyam Sudhakaran S. Risi 28 15 0 17 Jul 2023
Image Transformation Sequence Retrieval with General Reinforcement Learning Enrique Mas-Candela Antonio Ríos-Vila Jorge Calvo-Zaragoza 17 0 0 13 Jul 2023
Diffusion Policies for Out-of-Distribution Generalization in Offline Reinforcement Learning S. E. Ada Erhan Öztop Emre Ugur OffRL 38 15 0 10 Jul 2023
Large Language Models as General Pattern Machines Suvir Mirchandani F. Xia Peter R. Florence Brian Ichter Danny Driess Montse Gonzalez Arenas Kanishka Rao Dorsa Sadigh Andy Zeng LLMAG 46 183 0 10 Jul 2023
Deep Attention Q-Network for Personalized Treatment Recommendation Simin Ma Junghwan Lee N. Serban Shihao Yang OffRL 24 5 0 04 Jul 2023
Prioritized Trajectory Replay: A Replay Memory for Data-driven Reinforcement Learning Jinyi Liu Y. Ma Jianye Hao Yujing Hu Yan Zheng Tangjie Lv Changjie Fan OffRL 42 2 0 27 Jun 2023
Train Offline, Test Online: A Real Robot Learning Benchmark G. Zhou Victoria Dean M. K. Srirama Aravind Rajeswaran Jyothish Pari ... Tianhe Yu Pieter Abbeel Lerrel Pinto Chelsea Finn Abhi Gupta OffRL 54 39 0 01 Jun 2023
Safe Offline Reinforcement Learning with Real-Time Budget Constraints Qian Lin Bo Tang Zifan Wu Chao Yu Shangqin Mao Qianlong Xie Xingxing Wang Dong Wang OffRL 34 11 0 01 Jun 2023
Passive learning of active causal strategies in agents and language models Andrew Kyle Lampinen Stephanie C. Y. Chan Ishita Dasgupta A. Nam Jane X. Wang 29 15 0 25 May 2023
Policy Representation via Diffusion Probability Model for Reinforcement Learning Long Yang Zhixiong Huang Fenghao Lei Yucun Zhong Yiming Yang Cong Fang Shiting Wen Binbin Zhou Zhouchen Lin DiffM 25 39 0 22 May 2023
Augmenting Autotelic Agents with Large Language Models Cédric Colas Laetitia Teodorescu Pierre-Yves Oudeyer Xingdi Yuan Marc-Alexandre Côté LLMAG LM&Ro 26 22 0 21 May 2023
Multimodal Web Navigation with Instruction-Finetuned Foundation Models Hiroki Furuta Kuang-Huei Lee Ofir Nachum Yutaka Matsuo Aleksandra Faust S. Gu Izzeddin Gur LM&Ro 36 90 0 19 May 2023
Goal-Conditioned Supervised Learning with Sub-Goal Prediction Tom Jurgenson Aviv Tamar 13 1 0 17 May 2023
Prompt-Tuning Decision Transformer with Preference Ranking Shengchao Hu Li Shen Ya-Qin Zhang Dacheng Tao OffRL 26 14 0 16 May 2023
Mixture of personality improved Spiking actor network for efficient multi-agent cooperation Xiyun Li Ziyi Ni Jingqing Ruan Linghui Meng Jing Shi Tielin Zhang Bo Xu 53 4 0 10 May 2023
Federated Ensemble-Directed Offline Reinforcement Learning Desik Rengarajan N. Ragothaman D. Kalathil S. Shakkottai OffRL 24 1 0 04 May 2023
Distance Weighted Supervised Learning for Offline Interaction Data Joey Hejna Jensen Gao Dorsa Sadigh OffRL 36 12 0 26 Apr 2023
Think Before You Act: Unified Policy for Interleaving Language Reasoning with Actions Lina Mezghani Piotr Bojanowski Alahari Karteek Sainbayar Sukhbaatar LM&Ro OffRL LRM 13 8 0 18 Apr 2023
ENTL: Embodied Navigation Trajectory Learner Klemen Kotar Aaron Walsman Roozbeh Mottaghi 13 6 0 05 Apr 2023
Optimal Goal-Reaching Reinforcement Learning via Quasimetric Learning Tongzhou Wang Antonio Torralba Phillip Isola Amy Zhang OffRL 21 31 0 03 Apr 2023
Chain-of-Thought Predictive Control Zhiwei Jia Vineet Thumuluri Fangchen Liu Ling-Hao Chen Zhiao Huang H. Su LM&Ro 28 20 0 03 Apr 2023
Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization Haoran Xu Li Jiang Jianxiong Li Zhuoran Yang Zhaoran Wang Victor Chan Xianyuan Zhan OffRL 36 71 0 28 Mar 2023
The Quality-Diversity Transformer: Generating Behavior-Conditioned Trajectories with Decision Transformers Valentin Macé Raphael Boige Félix Chalumeau Thomas Pierrot Guillaume Richard Nicolas Perrin-Gilbert OffRL 32 12 0 27 Mar 2023
Inverse Reinforcement Learning without Reinforcement Learning Gokul Swamy Sanjiban Choudhury J. Andrew Bagnell Zhiwei Steven Wu 21 33 0 26 Mar 2023
CB2: Collaborative Natural Language Interaction Research Platform Jacob Sharf Mustafa Omer Gul Yoav Artzi LLMAG 35 1 0 14 Mar 2023
Preference Transformer: Modeling Human Preferences using Transformers for RL Changyeon Kim Jongjin Park Jinwoo Shin Honglak Lee Pieter Abbeel Kimin Lee OffRL 30 61 0 02 Mar 2023
VIPeR: Provably Efficient Algorithm for Offline RL with Neural Function Approximation Thanh Nguyen-Tang R. Arora OffRL 38 5 0 24 Feb 2023
A Theoretical Understanding of Shallow Vision Transformers: Learning, Generalization, and Sample Complexity Hongkang Li M. Wang Sijia Liu Pin-Yu Chen ViT MLT 35 56 0 12 Feb 2023
Level Generation Through Large Language Models Graham Todd Sam Earle Muhammad Umair Nasir M. Green Julian Togelius 19 73 0 11 Feb 2023
Language Decision Transformers with Exponential Tilt for Interactive Text Environments Nicolas Angelard-Gontier Pau Rodríguez López I. Laradji David Vazquez C. Pal OffRL 18 1 0 10 Feb 2023
AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners Zhixuan Liang Yao Mu Mingyu Ding Fei Ni M. Tomizuka Ping Luo 64 99 0 03 Feb 2023
Policy Expansion for Bridging Offline-to-Online Reinforcement Learning Haichao Zhang Weiwen Xu Haonan Yu CLL OffRL OnRL 34 62 0 02 Feb 2023
6-DoF Robotic Grasping with Transformer Zhenjie Zhao Han Yu Hang Wu Xuebo Zhang ViT 28 0 0 29 Jan 2023
FedHQL: Federated Heterogeneous Q-Learning Flint Xiaofeng Fan Yining Ma Zhongxiang Dai Cheston Tan Bryan Kian Hsiang Low Roger Wattenhofer FedML 21 7 0 26 Jan 2023
An Analysis of Attention via the Lens of Exchangeability and Latent Variable Models Yufeng Zhang Boyi Liu Qi Cai Lingxiao Wang Zhaoran Wang 45 11 0 30 Dec 2022
On Realization of Intelligent Decision-Making in the Real World: A Foundation Decision Model Perspective Ying Wen Ziyu Wan M. Zhou Shufang Hou Zhe Cao Chenyang Le Jingxiao Chen Zheng Tian Weinan Zhang J. Wang AI4CE 16 10 0 24 Dec 2022
Multi-embodiment Legged Robot Control as a Sequence Modeling Problem Chenyi Yu Weinan Zhang H. Lai Zheng Tian L. Kneip Jun Wang 23 15 0 18 Dec 2022
FECAM: Frequency Enhanced Channel Attention Mechanism for Time Series Forecasting Maowei Jiang Pengyu Zeng Kai-Ming Wang Huan Liu Wenbo Chen Haoran Liu AI4TS 27 50 0 02 Dec 2022
Is Conditional Generative Modeling all you need for Decision-Making? Anurag Ajay Yilun Du Abhi Gupta J. Tenenbaum Tommi Jaakkola Pulkit Agrawal DiffM 39 359 0 28 Nov 2022
Multi-Environment Pretraining Enables Transfer to Action Limited Datasets David Venuto Sherry Yang Pieter Abbeel Doina Precup Igor Mordatch Ofir Nachum OffRL 20 5 0 23 Nov 2022