Overcoming Exploration in Reinforcement Learning with Demonstrations

28 September 2017

Pieter Abbeel

Papers citing "Overcoming Exploration in Reinforcement Learning with Demonstrations"

50 / 175 papers shown

Title
VLM Q-Learning: Aligning Vision-Language Models for Interactive Decision-Making Jake Grigsby Yuke Zhu Michael S Ryoo Juan Carlos Niebles OffRL VLM 41 0 0 06 May 2025
Dynamic Action Interpolation: A Universal Approach for Accelerating Reinforcement Learning with Expert Guidance Wenjun Cao 52 0 0 26 Apr 2025
Diffusion Stabilizer Policy for Automated Surgical Robot Manipulations Chonlam Ho Jianshu Hu Haoran Wang Qi Dou Yutong Ban MedIm 76 1 0 03 Mar 2025
Safe Multi-Agent Navigation guided by Goal-Conditioned Safe Reinforcement Learning Meng Feng Viraj Parimi B. Williams 77 1 0 25 Feb 2025
MILE: Model-based Intervention Learning Yigit Korkmaz Erdem Bıyık 88 2 0 21 Feb 2025
ConRFT: A Reinforced Fine-tuning Method for VLA Models via Consistency Policy Yuhui Chen Shuai Tian Shugao Liu Yingting Zhou Haoran Li Dongbin Zhao OffRL 106 1 0 08 Feb 2025
Inverse-RLignment: Large Language Model Alignment from Demonstrations through Inverse Reinforcement Learning Hao Sun M. Schaar 94 14 0 28 Jan 2025
Blockchain-assisted Demonstration Cloning for Multi-Agent Deep Reinforcement Learning Ahmed Alagha Jamal Bentahar Hadi Otrok Shakti Singh R. Mizouni 53 3 0 19 Jan 2025
RbRL2.0: Integrated Reward and Policy Learning for Rating-based Reinforcement Learning Mingkang Wu Devin White Vernon J. Lawhern Nicholas R. Waytowich Yongcan Cao OffRL 39 0 0 13 Jan 2025
DIPPER: Direct Preference Optimization to Accelerate Primitive-Enabled Hierarchical Reinforcement Learning Utsav Singh Souradip Chakraborty Wesley A Suttle Brian M. Sadler Vinay P. Namboodiri Amrit Singh Bedi OffRL 53 0 0 03 Jan 2025
Marvel: Accelerating Safe Online Reinforcement Learning with Finetuned Offline Policy Keru Chen Honghao Wei Zhigang Deng Sen Lin OffRL OnRL 94 0 0 31 Dec 2024
Dense Dynamics-Aware Reward Synthesis: Integrating Prior Experience with Demonstrations Cevahir Köprülü Po-han Li Tianyu Qiu Ruihan Zhao T. Westenbroek David Fridovich-Keil Sandeep P. Chinchali Ufuk Topcu OffRL 94 0 0 02 Dec 2024
Autonomous Driving at Unsignalized Intersections: A Review of Decision-Making Challenges and Reinforcement Learning-Based Solutions Mohammad K. Al-Sharman Luc Edes Bert Sun Vishal Jayakumar Mohamed A. Daoud Derek Rayside W. Melek 29 1 0 20 Sep 2024
DemoStart: Demonstration-led auto-curriculum applied to sim-to-real with multi-fingered robots Maria Bauzá José Enrique Chen Valentin Dalibard Nimrod Gileadi Roland Hafner ... Martin Riedmiller Jon Scholz Konstantinos Bousmalis Francesco Nori Nicolas Heess 34 5 0 10 Sep 2024
The Evolution of Reinforcement Learning in Quantitative Finance: A Survey Nikolaos Pippas Cagatay Turkay Elliot A. Ludvig AIFin 92 3 0 20 Aug 2024
Jacta: A Versatile Planner for Learning Dexterous and Whole-body Manipulation Jan Brüdigam Ali-Adeeb Abbas Maks Sorokin Kuan Fang Brandon Hung Maya Guru Stefan Sosnowski Jiuguang Wang Sandra Hirche Simon Le Cleac'h 36 2 0 02 Aug 2024
LGR2: Language Guided Reward Relabeling for Accelerating Hierarchical Reinforcement Learning Utsav Singh Pramit Bhattacharyya Vinay P. Namboodiri LM&Ro 47 1 0 09 Jun 2024
ATraDiff: Accelerating Online Reinforcement Learning with Imaginary Trajectories Qianlan Yang Yu-Xiong Wang OnRL 42 1 0 06 Jun 2024
DEER: A Delay-Resilient Framework for Reinforcement Learning with Variable Delays Bo Xia Yilun Kong Yongzhe Chang Bo Yuan Zhiheng Li Xueqian Wang Bin Liang OffRL 50 3 0 05 Jun 2024
VICtoR: Learning Hierarchical Vision-Instruction Correlation Rewards for Long-horizon Manipulation Kuo-Han Hung Pang-Chi Lo Jia-Fong Yeh Han-Yuan Hsu Yi-Ting Chen Winston H. Hsu 33 0 0 26 May 2024
Learning Prehensile Dexterity by Imitating and Emulating State-only Observations Yunhai Han Zhenyang Chen Harish Ravichandar 30 5 0 08 Apr 2024
Enhancing Reinforcement Learning Agents with Local Guides Paul Daoudi Bogdan Robu Christophe Prieur Ludovic Dos Santos M. Barlier OnRL 31 3 0 21 Feb 2024
Training Large Language Models for Reasoning through Reverse Curriculum Reinforcement Learning Zhiheng Xi Wenxiang Chen Boyang Hong Senjie Jin Rui Zheng ... Xinbo Zhang Peng Sun Tao Gui Qi Zhang Xuanjing Huang LRM 39 21 0 08 Feb 2024
HAIM-DRL: Enhanced Human-in-the-loop Reinforcement Learning for Safe and Efficient Autonomous Driving Zilin Huang Zihao Sheng Chengyuan Ma Sikai Chen 22 29 0 06 Jan 2024
Human-AI Collaboration in Real-World Complex Environment with Reinforcement Learning Md Saiful Islam Srijita Das S. Gottipati William Duguay Clodéric Mars Jalal Arabneydi Antoine Fagette Matthew J. Guzdial Matthew E. Taylor 38 1 0 23 Dec 2023
Human-Machine Teaming for UAVs: An Experimentation Platform Laila El Moujtahid S. Gottipati Clodéric Mars Matthew E. Taylor 21 1 0 18 Dec 2023
Building Open-Ended Embodied Agent via Language-Policy Bidirectional Adaptation Shaopeng Zhai Jie Wang Tianyi Zhang Fuxian Huang Qi Zhang Ming Zhou Jing Hou Yu Qiao Yu Liu LLMAG LM&Ro 37 1 0 12 Dec 2023
A Q-learning approach to the continuous control problem of robot inverted pendulum balancing Mohammad Safeea Pedro Neto 20 7 0 05 Dec 2023
RLIF: Interactive Imitation Learning as Reinforcement Learning Jianlan Luo Perry Dong Yuexiang Zhai Yi Ma Sergey Levine OffRL 30 14 0 21 Nov 2023
Signal Temporal Logic-Guided Apprenticeship Learning Aniruddh Gopinath Puranic Jyotirmoy V. Deshmukh Stefanos Nikolaidis 43 2 0 09 Nov 2023
Enhanced Generalization through Prioritization and Diversity in Self-Imitation Reinforcement Learning over Procedural Environments with Sparse Rewards Alain Andres Daochen Zha Javier Del Ser 37 0 0 01 Nov 2023
Reinforcement Learning in the Era of LLMs: What is Essential? What is needed? An RL Perspective on RLHF, Prompting, and Beyond Hao Sun OffRL 34 21 0 09 Oct 2023
One ACT Play: Single Demonstration Behavior Cloning with Action Chunking Transformers Abraham George A. Farimani OffRL 25 11 0 18 Sep 2023
Hundreds Guide Millions: Adaptive Offline Reinforcement Learning with Expert Guidance Qisen Yang Shenzhi Wang Qihang Zhang Gao Huang Shiji Song OffRL OnRL 26 8 0 04 Sep 2023
FoX: Formation-aware exploration in multi-agent reinforcement learning Yonghyeon Jo Sunwoo Lee Junghyuk Yum Seungyul Han 35 5 0 22 Aug 2023
A Framework for Learning from Demonstration with Minimal Human Effort Marc Rigter Bruno Lacerda Nick Hawes 20 28 0 15 Jun 2023
Adaptive action supervision in reinforcement learning from real-world multi-agent demonstrations Keisuke Fujii Kazushi Tsutsui Atom Scott Hiroshi Nakahara Naoya Takeishi Yoshinobu Kawahara 29 6 0 22 May 2023
Deep Reinforcement Learning-Based Control for Stomach Coverage Scanning of Wireless Capsule Endoscopy Yameng Zhang Long Bai Li Liu Hongliang Ren Max Q.-H. Meng 18 9 0 18 May 2023
Aiding reinforcement learning for set point control Ruoqing Zhang Per Mattsson T. Wigren 21 3 0 20 Apr 2023
Exploiting Symmetry and Heuristic Demonstrations in Off-policy Reinforcement Learning for Robotic Manipulation Amir M. Soufi Enayati Zengjie Zhang Kashish Gupta H. Najjaran OffRL 11 0 0 12 Apr 2023
CRISP: Curriculum inducing Primitive Informed Subgoal Prediction Utsav Singh Vinay P. Namboodiri 31 3 0 07 Apr 2023
Constrained Exploration in Reinforcement Learning with Optimality Preservation Peter C. Y. Chen 11 0 0 05 Apr 2023
End-to-end deep learning-based framework for path planning and collision checking: bin picking application Mehran Ghafarian Tamizi Homayoun Honari Aleksey Nozdryn-Plotnicki H. Najjaran 19 6 0 31 Mar 2023
Recent Advances of Deep Robotic Affordance Learning: A Reinforcement Learning Perspective Xintong Yang Ze Ji Jing Wu Yunyu Lai 38 12 0 09 Mar 2023
Seq2Seq Imitation Learning for Tactile Feedback-based Manipulation Wenyan Yang A. Angleraud R. Pieters Joni Pajarinen Joni-Kristian Kämäräinen 32 6 0 05 Mar 2023
Teach a Robot to FISH: Versatile Imitation from One Minute of Demonstrations Siddhant Haldar Jyothish Pari A. Rai Lerrel Pinto 24 66 0 02 Mar 2023
Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement Learning Archit Sharma Ahmed M. Ahmed Rehaan Ahmad Chelsea Finn SSL 54 17 0 02 Mar 2023
Expert-Free Online Transfer Learning in Multi-Agent Reinforcement Learning A. Castagna Ivana Dusparic OffRL 18 2 0 02 Mar 2023
Demonstration-Guided Reinforcement Learning with Efficient Exploration for Task Automation of Surgical Robot Tao Huang Kai-xiang Chen Bin Li Yunhui Liu Qingxu Dou 35 23 0 20 Feb 2023
Natural Language-conditioned Reinforcement Learning with Inside-out Task Language Development and Translation Jing-Cheng Pang Xinyi Yang Sibei Yang Yang Yu 29 8 0 18 Feb 2023