Sample-Efficient Reinforcement Learning with Stochastic Ensemble Value Expansion

4 July 2018

Papers citing "Sample-Efficient Reinforcement Learning with Stochastic Ensemble Value Expansion"

50 / 82 papers shown

Title
Uncertainty-aware Latent Safety Filters for Avoiding Out-of-Distribution Failures Junwon Seo Kensuke Nakamura Andrea V. Bajcsy 56 0 0 01 May 2025
MInCo: Mitigating Information Conflicts in Distracted Visual Model-based Reinforcement Learning Shiguang Sun Hanbo Zhang Zeyang Liu Xinrui Yang Lipeng Wan Bing Yan Xingyu Chen Xuguang Lan 38 0 0 05 Apr 2025
Reducing Reward Dependence in RL Through Adaptive Confidence Discounting Muhammed Yusuf Satici David L. Roberts OffRL 46 0 0 28 Feb 2025
Zero-shot Model-based Reinforcement Learning using Large Language Models Abdelhakim Benechehab Youssef Attia El Hili Ambroise Odonnat Oussama Zekri Albert Thomas Giuseppe Paolo Maurizio Filippone I. Redko Balázs Kégl OffRL 69 1 0 17 Feb 2025
MAD-TD: Model-Augmented Data stabilizes High Update Ratio RL C. Voelcker Marcel Hussing Eric Eaton Amir-massoud Farahmand Igor Gilitschenski 39 1 0 11 Oct 2024
Learning to Refine Input Constrained Control Barrier Functions via Uncertainty-Aware Online Parameter Adaptation Taekyung Kim Robin Inho Kee Dimitra Panagou 46 6 0 22 Sep 2024
A Survey on Reinforcement Learning Applications in SLAM Mohammad Dehghani Tezerjani Mohammad Khoshnazar Mohammadhamed Tangestanizadeh Arman Kiani Qing Yang 37 2 0 26 Aug 2024
SigmaRL: A Sample-Efficient and Generalizable Multi-Agent Reinforcement Learning Framework for Motion Planning Jianye Xu Pan Hu Bassam Alrifaee 44 5 0 14 Aug 2024
Meta-Gradient Search Control: A Method for Improving the Efficiency of Dyna-style Planning Bradley Burega John D. Martin Luke Kapeluck Michael Bowling 40 0 0 27 Jun 2024
Fusion-PSRO: Nash Policy Fusion for Policy Space Response Oracles Jiesong Lian Yucong Huang Chengdong Ma Mingzhi Wang Ying Wen Long Hu Yixue Hao 62 0 0 31 May 2024
Trust the Model Where It Trusts Itself -- Model-Based Actor-Critic with Uncertainty-Aware Rollout Adaption Bernd Frauenknecht Artur Eisele Devdutt Subhasish Friedrich Solowjow Sebastian Trimpe 49 5 0 29 May 2024
State-Constrained Offline Reinforcement Learning Charles A. Hepburn Yue Jin Giovanni Montana OffRL 37 0 0 23 May 2024
Learning Off-policy with Model-based Intrinsic Motivation For Active Online Exploration Yibo Wang Jiang Zhao OffRL OnRL 25 0 0 31 Mar 2024
A comparison of RL-based and PID controllers for 6-DOF swimming robots: hybrid underwater object tracking F. Lotfi K. Virji Nicholas Dudek Gregory Dudek 27 0 0 29 Jan 2024
MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot Learning Rafael Rafailov Kyle Hatch Victor Kolev John D. Martin Mariano Phielipp Chelsea Finn OffRL OnRL 22 9 0 06 Jan 2024
Multi-agent Reinforcement Learning: A Comprehensive Survey Dom Huh Prasant Mohapatra AI4CE 36 8 0 15 Dec 2023
One is More: Diverse Perspectives within a Single Network for Efficient DRL Yiqin Tan Ling Pan Longbo Huang OffRL 38 0 0 21 Oct 2023
Uncertainty-aware transfer across tasks using hybrid model-based successor feature reinforcement learning Parvin Malekzadeh Ming Hou Konstantinos N. Plataniotis 46 1 0 16 Oct 2023
Machine Learning Meets Advanced Robotic Manipulation Saeid Nahavandi R. Alizadehsani D. Nahavandi Chee Peng Lim Kevin Kelly Fernando Bello 24 17 0 22 Sep 2023
Off-Policy RL Algorithms Can be Sample-Efficient for Continuous Control via Sample Multiple Reuse Jiafei Lyu Le Wan Zongqing Lu Xiu Li OffRL 31 9 0 29 May 2023
Efficient Sensitivity Analysis for Parametric Robust Markov Chains Thom S. Badings Sebastian Junges Ahmadreza Marandi Ufuk Topcu N. Jansen 31 1 0 01 May 2023
Policy Resilience to Environment Poisoning Attacks on Reinforcement Learning Hang Xu Xinghua Qu Zinovi Rabinovich 26 1 0 24 Apr 2023
Exploiting Symmetry and Heuristic Demonstrations in Off-policy Reinforcement Learning for Robotic Manipulation Amir M. Soufi Enayati Zengjie Zhang Kashish Gupta H. Najjaran OffRL 8 0 0 12 Apr 2023
Ensemble Latent Space Roadmap for Improved Robustness in Visual Action Planning M. Lippi Michael C. Welle Andrea Gasparri Danica Kragic 27 0 0 27 Mar 2023
Safe and Sample-efficient Reinforcement Learning for Clustered Dynamic Environments Hongyi Chen Changliu Liu OffRL 13 14 0 24 Mar 2023
Model-Based Uncertainty in Value Functions Carlos E. Luis A. Bottero Julia Vinogradska Felix Berkenkamp Jan Peters 36 13 0 24 Feb 2023
Is Model Ensemble Necessary? Model-based RL via a Single Model with Lipschitz Regularized Value Function Ruijie Zheng Xiyao Wang Huazhe Xu Furong Huang 48 13 0 02 Feb 2023
Neural Spline Search for Quantile Probabilistic Modeling Ruoxi Sun Chun-Liang Li Sercan Ö. Arik Michael W. Dusenberry Chen-Yu Lee Tomas Pfister AI4TS 42 5 0 12 Jan 2023
Model-based Trajectory Stitching for Improved Offline Reinforcement Learning Charles A. Hepburn Giovanni Montana OffRL 29 13 0 21 Nov 2022
Controlling Commercial Cooling Systems Using Reinforcement Learning Jerry Luo Cosmin Paduraru Octavian Voicu Yuri Chervonyi Scott A. Munns ... Sims Witherspoon D. Parish Peter Dolan Chenyu Zhao D. Mankowitz OffRL AI4CE 28 25 0 11 Nov 2022
On Many-Actions Policy Gradient Michal Nauman Marek Cygan 17 0 0 24 Oct 2022
Integrated Decision and Control for High-Level Automated Vehicles by Mixed Policy Gradient and Its Experiment Verification Yang Guan Liye Tang Chuanxiao Li Shengbo Eben Li Yangang Ren Junqing Wei Bo Zhang Ke Li 18 0 0 19 Oct 2022
When to Update Your Model: Constrained Model-based Reinforcement Learning Tianying Ji Yu-Juan Luo Gang Hua Mingxuan Jing Fengxiang He Wen-bing Huang 24 18 0 15 Oct 2022
Open-Ended Diverse Solution Discovery with Regulated Behavior Patterns for Cross-Domain Adaptation Kang Xu Yan Ma Bingsheng Wei Wei Li 27 3 0 24 Sep 2022
A Survey on Model-based Reinforcement Learning Fan Luo Tian Xu Hang Lai Xiong-Hui Chen Weinan Zhang Yang Yu OffRL LRM 50 101 0 19 Jun 2022
Mingling Foresight with Imagination: Model-Based Cooperative Multi-Agent Reinforcement Learning Zhiwei Xu Dapeng Li Bin Zhang Yuan Zhan Yunru Bai Guoliang Fan OffRL 27 6 0 20 Apr 2022
Revisiting Model-based Value Expansion Daniel Palenicek M. Lutter Jan Peters 21 2 0 28 Mar 2022
Temporal Difference Learning for Model Predictive Control Nicklas Hansen Xiaolong Wang H. Su PINN MU 36 222 0 09 Mar 2022
Neural-Progressive Hedging: Enforcing Constraints in Reinforcement Learning with Stochastic Programming Supriyo Ghosh L. Wynter Shiau Hong Lim D. Nguyen 26 0 0 27 Feb 2022
Model-Value Inconsistency as a Signal for Epistemic Uncertainty Angelos Filos Eszter Vértes Zita Marinho Gregory Farquhar Diana Borsa A. Friesen Feryal M. P. Behbahani Tom Schaul André Barreto Simon Osindero 44 7 0 08 Dec 2021
ED2: Environment Dynamics Decomposition World Models for Continuous Control Jianye Hao Yifu Yuan Cong Wang Zhen Wang OffRL 16 1 0 06 Dec 2021
Look Before You Leap: Safe Model-Based Reinforcement Learning with Human Intervention Yunkun Xu Zhen-yu Liu Guifang Duan Jiangcheng Zhu X. Bai Jianrong Tan 12 9 0 10 Nov 2021
Gradients are Not All You Need Luke Metz C. Freeman S. Schoenholz Tal Kachman 28 93 0 10 Nov 2021
Imaginary Hindsight Experience Replay: Curious Model-based Learning for Sparse Reward Tasks Robert McCarthy Qiang Wang S. Redmond OffRL 27 15 0 05 Oct 2021
Hierarchical Primitive Composition: Simultaneous Activation of Skills with Inconsistent Action Dimensions in Multiple Hierarchies Jeong-Hoon Lee Jongeun Choi 26 8 0 05 Oct 2021
Learning Dynamics Models for Model Predictive Agents M. Lutter Leonard Hasenclever Arunkumar Byravan Gabriel Dulac-Arnold Piotr Trochim N. Heess J. Merel Yuval Tassa AI4CE 57 26 0 29 Sep 2021
Deep Reinforcement Learning with Adjustments H. Khorasgani Haiyan Wang Chetan Gupta Susumu Serita 15 2 0 28 Sep 2021
When should agents explore? Miruna Pislar David Szepesvari Georg Ostrovski Diana Borsa Tom Schaul 40 22 0 26 Aug 2021
Visual Adversarial Imitation Learning using Variational Models Rafael Rafailov Tianhe Yu Aravind Rajeswaran Chelsea Finn SSL 28 49 0 16 Jul 2021
Evaluating the progress of Deep Reinforcement Learning in the real world: aligning domain-agnostic and domain-specific research J. Luis E. Crawley B. Cameron OffRL 25 6 0 07 Jul 2021