Efficient Online Reinforcement Learning with Offline Data

6 February 2023

Papers citing "Efficient Online Reinforcement Learning with Offline Data"

50 / 128 papers shown

Title
Enhancing Sample Efficiency and Exploration in Reinforcement Learning through the Integration of Diffusion Models and Proximal Policy Optimization Gao Tianci Dmitriev D. Dmitry Konstantin A. Neusypin Yang Bo Rao Shengren OffRL 31 1 0 02 Sep 2024
Diffusion Policy Policy Optimization Allen Z. Ren Justin Lidard Lars L. Ankile Anthony Simeonov Pulkit Agrawal Anirudha Majumdar Benjamin Burchfiel Hongkai Dai Max Simchowitz 45 36 0 01 Sep 2024
Unsupervised-to-Online Reinforcement Learning Junsu Kim Seohong Park Sergey Levine OnRL 53 3 0 27 Aug 2024
D5RL: Diverse Datasets for Data-Driven Deep Reinforcement Learning Rafael Rafailov Kyle Hatch Anikait Singh Laura Smith Aviral Kumar ... Victor Kolev Philip J. Ball Jiajun Wu Chelsea Finn Sergey Levine OffRL 34 3 0 15 Aug 2024
Hybrid Reinforcement Learning Breaks Sample Size Barriers in Linear MDPs Kevin Tan Wei Fan Yuting Wei OffRL 74 2 0 08 Aug 2024
Jacta: A Versatile Planner for Learning Dexterous and Whole-body Manipulation Jan Brüdigam Ali-Adeeb Abbas Maks Sorokin Kuan Fang Brandon Hung Maya Guru Stefan Sosnowski Jiuguang Wang Sandra Hirche Simon Le Cleac'h 36 2 0 02 Aug 2024
Language-Conditioned Offline RL for Multi-Robot Navigation Steven D. Morad Ajay Shankar J. Blumenkamp Amanda Prorok LM&Ro OffRL 48 6 0 29 Jul 2024
Energy-Guided Diffusion Sampling for Offline-to-Online Reinforcement Learning Xu-Hui Liu Tian-Shuo Liu Shengyi Jiang Ruifeng Chen Zhilong Zhang Xinwei Chen Yang Yu OffRL OnRL 34 2 0 17 Jul 2024
Green Screen Augmentation Enables Scene Generalisation in Robotic Manipulation Eugene Teoh Sumit Patidar Xiao Ma Stephen James 43 5 0 10 Jul 2024
HiLMa-Res: A General Hierarchical Framework via Residual RL for Combining Quadrupedal Locomotion and Manipulation Xiaoyu Huang Qiayuan Liao Yiming Ni Zhongyu Li Laura Smith Sergey Levine Xue Bin Peng K. Sreenath 43 3 0 09 Jul 2024
Normalization and effective learning rates in reinforcement learning Clare Lyle Zeyu Zheng Khimya Khetarpal James Martens H. V. Hasselt Razvan Pascanu Will Dabney 19 7 0 01 Jul 2024
Efficient Offline Reinforcement Learning: The Critic is Critical Adam Jelley Trevor A. McInroe Sam Devlin Amos Storkey OffRL 39 1 0 19 Jun 2024
Hybrid Reinforcement Learning from Offline Observation Alone Yuda Song J. Andrew Bagnell Aarti Singh OffRL 84 2 0 11 Jun 2024
ATraDiff: Accelerating Online Reinforcement Learning with Imaginary Trajectories Qianlan Yang Yu-Xiong Wang OnRL 39 1 0 06 Jun 2024
DEER: A Delay-Resilient Framework for Reinforcement Learning with Variable Delays Bo Xia Yilun Kong Yongzhe Chang Bo Yuan Zhiheng Li Xueqian Wang Bin Liang OffRL 42 3 0 05 Jun 2024
RL in Latent MDPs is Tractable: Online Guarantees via Off-Policy Evaluation Jeongyeol Kwon Shie Mannor C. Caramanis Yonathan Efroni OffRL 40 2 0 03 Jun 2024
Bayesian Design Principles for Offline-to-Online Reinforcement Learning Haotian Hu Yiqin Yang Jianing Ye Chengjie Wu Ziqing Mai Yujing Hu Tangjie Lv Changjie Fan Qianchuan Zhao Chongjie Zhang OffRL OnRL 39 3 0 31 May 2024
Offline-Boosted Actor-Critic: Adaptively Blending Optimal Historical Behaviors in Deep Off-Policy RL Yu-Juan Luo Tianying Ji Gang Hua Jianwei Zhang Huazhe Xu Xianyuan Zhan OffRL OnRL 36 2 0 28 May 2024
Leveraging Offline Data in Linear Latent Bandits Chinmaya Kausik Kevin Tan Ambuj Tewari OffRL 29 2 0 27 May 2024
Bigger, Regularized, Optimistic: scaling for compute and sample-efficient continuous control Michal Nauman M. Ostaszewski Krzysztof Jankowski Piotr Milo's Marek Cygan OffRL 45 16 0 25 May 2024
Which Experiences Are Influential for RL Agents? Efficiently Estimating The Influence of Experiences Takuya Hiraoka Guanquan Wang Takashi Onishi Yoshimasa Tsuruoka 45 0 0 23 May 2024
Ensemble Successor Representations for Task Generalization in Offline-to-Online Reinforcement Learning Changhong Wang Xudong Yu Chenjia Bai Qiaosheng Zhang Zhen Wang 40 1 0 12 May 2024
Reverse Forward Curriculum Learning for Extreme Sample and Demonstration Efficiency in Reinforcement Learning Stone Tao Arth Shukla Tse-kai Chan Hao Su OffRL 41 4 0 06 May 2024
Overcoming Knowledge Barriers: Online Imitation Learning from Visual Observation with Pretrained World Models Xingyuan Zhang Philip Becker-Ehmck Patrick van der Smagt Maximilian Karl OffRL 50 0 0 29 Apr 2024
REBEL: Reinforcement Learning via Regressing Relative Rewards Zhaolin Gao Jonathan D. Chang Wenhao Zhan Owen Oertell Gokul Swamy Kianté Brantley Thorsten Joachims J. Andrew Bagnell Jason D. Lee Wen Sun OffRL 38 31 0 25 Apr 2024
Dataset Reset Policy Optimization for RLHF Jonathan D. Chang Wenhao Zhan Owen Oertell Kianté Brantley Dipendra Kumar Misra Jason D. Lee Wen Sun OffRL 22 21 0 12 Apr 2024
Sequential Decision Making with Expert Demonstrations under Unobserved Heterogeneity Vahid Balazadeh Meresht Keertana Chidambaram Viet Nguyen Rahul G. Krishnan Vasilis Syrgkanis 44 0 0 10 Apr 2024
Demonstration Guided Multi-Objective Reinforcement Learning Junlin Lu Patrick Mannion Karl Mason 27 0 0 05 Apr 2024
Learning Off-policy with Model-based Intrinsic Motivation For Active Online Exploration Yibo Wang Jiang Zhao OffRL OnRL 25 0 0 31 Mar 2024
Bootstrapping Reinforcement Learning with Imitation for Vision-Based Agile Flight Jiaxu Xing Angel Romero L. Bauersfeld Davide Scaramuzza 42 14 0 18 Mar 2024
Dissecting Deep RL with High Update Ratios: Combatting Value Divergence Marcel Hussing C. Voelcker Igor Gilitschenski Amir-massoud Farahmand Eric Eaton 34 3 0 09 Mar 2024
Reconciling Reality through Simulation: A Real-to-Sim-to-Real Approach for Robust Manipulation M. Torné Anthony Simeonov Zechu Li April Chan Tao Chen Abhishek Gupta Pulkit Agrawal 44 57 0 06 Mar 2024
A Case for Validation Buffer in Pessimistic Actor-Critic Michal Nauman M. Ostaszewski Marek Cygan 34 0 0 01 Mar 2024
Overestimation, Overfitting, and Plasticity in Actor-Critic: the Bitter Lesson of Reinforcement Learning Michal Nauman Michal Bortkiewicz Piotr Milo's Tomasz Trzciñski M. Ostaszewski Marek Cygan OffRL 30 17 0 01 Mar 2024
Hybrid Inverse Reinforcement Learning Juntao Ren Gokul Swamy Zhiwei Steven Wu J. Andrew Bagnell Sanjiban Choudhury 36 18 0 13 Feb 2024
Fine-tuning Reinforcement Learning Models is Secretly a Forgetting Mitigation Problem Maciej Wolczyk Bartłomiej Cupiał M. Ostaszewski Michal Bortkiewicz Michal Zajkac Razvan Pascanu Lukasz Kuciñski Piotr Milo's CLL 48 13 0 05 Feb 2024
SERL: A Software Suite for Sample-Efficient Robotic Reinforcement Learning Jianlan Luo Zheyuan Hu Charles Xu You Liang Tan Jacob Berg Archit Sharma S. Schaal Chelsea Finn Abhishek Gupta Sergey Levine OffRL OnRL 34 40 0 29 Jan 2024
Efficient Sparse-Reward Goal-Conditioned Reinforcement Learning with a High Replay Ratio and Regularization Takuya Hiraoka OffRL 27 1 0 10 Dec 2023
Stable Online and Offline Reinforcement Learning for Antibody CDRH3 Design Yannick Vogt Mehdi Naouar M. Kalweit Christoph Cornelius Miething Justus Duyster Roland Mertelsmann Gabriel Kalweit Joschka Boedecker OffRL OnRL 32 0 0 29 Nov 2023
Replay across Experiments: A Natural Extension of Off-Policy RL Dhruva Tirumala Thomas Lampe José Enrique Chen Tuomas Haarnoja Sandy Huang ... Tim Hertweck Leonard Hasenclever Martin Riedmiller N. Heess Markus Wulfmeier OffRL 32 8 0 27 Nov 2023
Reinforcement Learning from Diffusion Feedback: Q* for Image Search Aboli Rajan Marathe VLM 41 0 0 27 Nov 2023
RLIF: Interactive Imitation Learning as Reinforcement Learning Jianlan Luo Perry Dong Yuexiang Zhai Yi Ma Sergey Levine OffRL 27 14 0 21 Nov 2023
Offline Data Enhanced On-Policy Policy Gradient with Provable Guarantees Yifei Zhou Ayush Sekhari Yuda Song Wen Sun OffRL OnRL 30 8 0 14 Nov 2023
Accelerating Exploration with Unlabeled Prior Data Qiyang Li Jason Zhang Dibya Ghosh Amy Zhang Sergey Levine OffRL OnRL 31 9 0 09 Nov 2023
Uni-O4: Unifying Online and Offline Deep Reinforcement Learning with Multi-Step On-Policy Optimization Kun Lei Zhengmao He Chenhao Lu Kaizhe Hu Yang Gao Huazhe Xu OffRL OnRL 51 13 0 06 Nov 2023
Imitation Bootstrapped Reinforcement Learning Hengyuan Hu Suvir Mirchandani Dorsa Sadigh 41 24 0 03 Nov 2023
Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment Annie S. Chen Govind Chada Laura M. Smith Archit Sharma Zipeng Fu Sergey Levine Chelsea Finn 46 7 0 02 Nov 2023
On the Theory of Risk-Aware Agents: Bridging Actor-Critic and Economics Michal Nauman Marek Cygan 35 1 0 30 Oct 2023
Unsupervised Behavior Extraction via Random Intent Priors Haotian Hu Yiqin Yang Jianing Ye Ziqing Mai Chongjie Zhang OffRL 32 6 0 28 Oct 2023
Bootstrap Your Own Skills: Learning to Solve New Tasks with Large Language Model Guidance Jesse Zhang Jiahui Zhang Karl Pertsch Ziyi Liu Xiang Ren Minsuk Chang Shao-Hua Sun Joseph J. Lim LLMAG LM&Ro 99 60 0 16 Oct 2023