v1v2v3 (latest)

Hindsight Experience Replay

5 July 2017

Pieter Abbeel

Papers citing "Hindsight Experience Replay"

50 / 1,340 papers shown

A Learning System for Motion Planning of Free-Float Dual-Arm Space Manipulator towards Non-Cooperative ObjectAerospace Science and Technology (AST), 2022

225

06 Jul 2022

DualAfford: Learning Collaborative Visual Affordance for Dual-gripper ManipulationInternational Conference on Learning Representations (ICLR), 2022

Zhehuan Chen

469

05 Jul 2022

Goal-Conditioned Generators of Deep PoliciesAAAI Conference on Artificial Intelligence (AAAI), 2022

165

04 Jul 2022

USHER: Unbiased Sampling for Hindsight Experience ReplayConference on Robot Learning (CoRL), 2022

Liam Schramm

Yunfu Deng

Edgar Granados

Abdeslam Boularias

03 Jul 2022

Watch and Match: Supercharging Imitation with Regularized Optimal TransportConference on Robot Learning (CoRL), 2022

307

30 Jun 2022

Dext-Gen: Dexterous Grasping in Sparse Reward Environments with Full Orientation Control

Jan Brüdigam

229

28 Jun 2022

DistSPECTRL: Distributing Specifications in Multi-Agent Reinforcement Learning Systems

Joe Eappen

Suresh Jagannathan

166

28 Jun 2022

Phasic Self-Imitative Reduction for Sparse-Reward Goal-Conditioned Reinforcement LearningInternational Conference on Machine Learning (ICML), 2022

213

24 Jun 2022

Video PreTraining (VPT): Learning to Act by Watching Unlabeled Online VideosNeural Information Processing Systems (NeurIPS), 2022

Jeff Clune

499

368

23 Jun 2022

Walk the Random Walk: Learning to Discover and Reach Goals Without Supervision

236

23 Jun 2022

Curious Exploration via Structured World Models Yields Zero-Shot Object ManipulationNeural Information Processing Systems (NeurIPS), 2022

406

22 Jun 2022

Learning Neuro-Symbolic Skills for Bilevel PlanningConference on Robot Learning (CoRL), 2022

Tomas Lozano-Perez

279

21 Jun 2022

MASER: Multi-Agent Reinforcement Learning with Subgoals Generated from Experience Replay BufferInternational Conference on Machine Learning (ICML), 2022

185

20 Jun 2022

A Survey on Model-based Reinforcement LearningScience China Information Sciences (Sci. China Inf. Sci.), 2022

347

153

19 Jun 2022

AnyMorph: Learning Transferable Polices By Inferring Agent MorphologyInternational Conference on Machine Learning (ICML), 2022

Brandon Trabucco

Mariano Phielipp

Glen Berseth

177

17 Jun 2022

Generalised Policy Improvement with Geometric Policy CompositionInternational Conference on Machine Learning (ICML), 2022

186

17 Jun 2022

BYOL-Explore: Exploration by Bootstrapped PredictionNeural Information Processing Systems (NeurIPS), 2022

...

Bilal Piot

284

16 Jun 2022

Contrastive Learning as Goal-Conditioned Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

Tianjun Zhang

392

213

15 Jun 2022

Stein Variational Goal Generation for adaptive Exploration in Multi-Goal Reinforcement LearningInternational Conference on Machine Learning (ICML), 2022

Nicolas Castanet

Sylvain Lamprier

Olivier Sigaud

263

14 Jun 2022

Pragmatically Learning from Pedagogical Demonstrations in Multi-Goal EnvironmentsNeural Information Processing Systems (NeurIPS), 2022

Hugo Caselles-Dupré

Olivier Sigaud

Mohamed Chetouani

219

09 Jun 2022

Deep Hierarchical Planning from PixelsNeural Information Processing Systems (NeurIPS), 2022

Danijar Hafner

Kuang-Huei Lee

Ian S. Fischer

Pieter Abbeel

228

119

08 Jun 2022

Discrete State-Action Abstraction via the Successor Representation

A. Attali

Pedro Cisneros-Velarde

M. Morales

Nancy M. Amato

OffRL

189

07 Jun 2022

Imitating Past Successes can be Very SuboptimalNeural Information Processing Systems (NeurIPS), 2022

265

07 Jun 2022

Introspective Experience Replay: Look Back When Surprised

Ramnath Kumar

Dheeraj M. Nagaraj

OffRL

313

07 Jun 2022

How Far I'll Go: Offline Goal-Conditioned Reinforcement Learning via

f

-Advantage RegressionNeural Information Processing Systems (NeurIPS), 2022

280

07 Jun 2022

Achieving Goals using Reward Shaping and Curriculum LearningFuture Technologies Conference (FT), 2022

195

06 Jun 2022

Language and Culture Internalisation for Human-Like Autotelic AI

244

02 Jun 2022

When does return-conditioned supervised learning work for offline reinforcement learning?Neural Information Processing Systems (NeurIPS), 2022

David Brandfonbrener

Joan Bruna

261

02 Jun 2022

Fast and Precise: Adjusting Planning Horizon with Adaptive Subgoal SearchInternational Conference on Learning Representations (ICLR), 2022

568

01 Jun 2022

Human-AI Shared Control via Policy DissectionNeural Information Processing Systems (NeurIPS), 2022

Haibin Wu

385

31 May 2022

DEP-RL: Embodied Exploration for Reinforcement Learning in Overactuated and Musculoskeletal SystemsInternational Conference on Learning Representations (ICLR), 2022

232

30 May 2022

Autoformalization with Large Language ModelsNeural Information Processing Systems (NeurIPS), 2022

Albert Q. Jiang

431

235

25 May 2022

Scalable Multi-Agent Model-Based Reinforcement LearningAdaptive Agents and Multi-Agent Systems (AAMAS), 2022

Vladimir Egorov

A. Shpilman

192

25 May 2022

Hierarchical Planning Through Goal-Conditioned Offline Reinforcement LearningIEEE Robotics and Automation Letters (RA-L), 2022

Jinning Li

Chen Tang

Masayoshi Tomizuka

Wei Zhan

OffRL

292

24 May 2022

Task Relabelling for Multi-task Transfer using Successor Features

Martin Balla

Diego Perez-Liebana

131

20 May 2022

Planning with Diffusion for Flexible Behavior SynthesisInternational Conference on Machine Learning (ICML), 2022

1.0K

986

20 May 2022

A Fully Controllable Agent in the Path Planning using Goal-Conditioned Reinforcement Learning

G. Lee

153

20 May 2022

Transformer with Memory ReplayAAAI Conference on Artificial Intelligence (AAAI), 2022

R. Liu

Barzan Mozafari

OffRL

322

19 May 2022

Dexterous Robotic Manipulation using Deep Reinforcement Learning and Knowledge Transfer for Complex Sparse Reward-based Tasks

Qiang Wang

Francisco Roldan Sanchez

Stefan Bauer

312

19 May 2022

Planning to Practice: Efficient Online Fine-Tuning by Composing Goals in Latent SpaceIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2022

252

17 May 2022

Provably Safe Deep Reinforcement Learning for Robotic Manipulation in Human EnvironmentsIEEE International Conference on Robotics and Automation (ICRA), 2022

Jakob Thumm

Matthias Althoff

273

12 May 2022

A State-Distribution Matching Approach to Non-Episodic Reinforcement LearningInternational Conference on Machine Learning (ICML), 2022

178

11 May 2022

Simultaneous Double Q-learning with Conservative Advantage Learning for Actor-Critic Methods

111

08 May 2022

Diverse Imitation Learning via Self-Organizing Generative ModelsIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2022

Arash Vahabpour

Tianyi Wang

Qiujing Lu

Omead Brandon Pooladzandi

V. Roychowdhury

SSL

201

06 May 2022

State Representation Learning for Goal-Conditioned Reinforcement Learning

Lorenzo Steccanella

Anders Jonsson

SSL OffRL

180

04 May 2022

Unsupervised Reinforcement Learning for Transferable Manipulation Skill DiscoveryIEEE Robotics and Automation Letters (RA-L), 2022

206

29 Apr 2022

Bilinear value networks

278

28 Apr 2022

Bisimulation Makes Analogies in Goal-Conditioned Reinforcement LearningInternational Conference on Machine Learning (ICML), 2022

Philippe Hansen-Estruch

310

27 Apr 2022

Relational Abstractions for Generalized Reinforcement Learning on Symbolic ProblemsInternational Joint Conference on Artificial Intelligence (IJCAI), 2022

Rushang Karia

Siddharth Srivastava

NAI OffRL

136

27 Apr 2022

Executive Function: A Contrastive Value Policy for Resampling and Relabeling Perceptions via Hindsight Summarization?

Christopher T. Lengerich

Ben Lengerich

141

27 Apr 2022