Reducing Variance in Temporal-Difference Value Estimation via Ensemble of Deep Networks

International Conference on Machine Learning (ICML), 2022

16 September 2022

Pieter Abbeel

ArXiv (abs)PDF HTML Github (11★)

Papers citing "Reducing Variance in Temporal-Difference Value Estimation via Ensemble of Deep Networks"

9 / 9 papers shown

RAPID: An Efficient Reinforcement Learning Algorithm for Small Language Models

167

03 Oct 2025

Uncovering RL Integration in SSL Loss: Objective-Specific Implications for Data-Efficient RL

Ömer Veysel Çağatan

Barış Akgün

OffRL

499

22 Oct 2024

Generalized Gaussian Temporal Difference Error for Uncertainty-aware Reinforcement Learning

482

05 Aug 2024

The Curse of Diversity in Ensemble-Based Exploration

249

07 May 2024

REValueD: Regularised Ensemble Value-Decomposition for Factorisable Markov Decision ProcessesInternational Conference on Learning Representations (ICLR), 2024

David Ireland

Giovanni Montana

300

16 Jan 2024

On the Importance of Exploration for Generalization in Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

Yiding Jiang

J. Zico Kolter

Roberta Raileanu

UQCV OffRL

203

08 Jun 2023

Ensemble Value Functions for Efficient Exploration in Multi-Agent Reinforcement LearningAdaptive Agents and Multi-Agent Systems (AAMAS), 2023

646

07 Feb 2023

Q-Ensemble for Offline RL: Don't Scale the Ensemble, Scale the Batch Size

263

20 Nov 2022

An Experimental Comparison Between Temporal Difference and Residual Gradient with Neural Network Approximation

241

25 May 2022