Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
1707.01495
Cited By

Hindsight Experience Replay

v1v2v3 (latest)

Hindsight Experience Replay

5 July 2017

Marcin Andrychowicz

Jonas Schneider

Pieter Abbeel

Wojciech Zaremba

ArXiv (abs)PDF HTML

Papers citing "Hindsight Experience Replay"

50 / 1,339 papers shown

SAGAS: Semantic-Aware Graph-Assisted Stitching for Offline Temporal Logic Planning

SAGAS: Semantic-Aware Graph-Assisted Stitching for Offline Temporal Logic Planning

72

0

0

30 Nov 2025

Hyper-GoalNet: Goal-Conditioned Manipulation Policy Learning with HyperNetworks

Hyper-GoalNet: Goal-Conditioned Manipulation Policy Learning with HyperNetworks

73

1

0

26 Nov 2025

MagBotSim: Physics-Based Simulation and Reinforcement Learning Environments for Magnetic Robotics

Cedric Grothues

105

0

0

20 Nov 2025

Expressive Temporal Specifications for Reward Monitoring

Expressive Temporal Specifications for Reward Monitoring

Francesco Belardinelli

137

0

0

16 Nov 2025

NFQ2.0: The CartPole Benchmark Revisited

NFQ2.0: The CartPole Benchmark Revisited

Martin Riedmiller

74

0

0

16 Nov 2025

Beyond Fixed Tasks: Unsupervised Environment Design for Task-Level Pairs

Beyond Fixed Tasks: Unsupervised Environment Design for Task-Level Pairs

Daniel Furelos-Blanco

Frederik Kelbel

Alessandra Russo

116

0

0

16 Nov 2025

Physically-Grounded Goal Imagination: Physics-Informed Variational Autoencoder for Self-Supervised Reinforcement Learning

Physically-Grounded Goal Imagination: Physics-Informed Variational Autoencoder for Self-Supervised Reinforcement Learning

Lan Thi Ha Nguyen

521

0

0

10 Nov 2025

Enabling Off-Policy Imitation Learning with Deep Actor Critic Stabilization

Enabling Off-Policy Imitation Learning with Deep Actor Critic Stabilization

Shalabh Bhatnagar

96

0

0

10 Nov 2025

Learning to Focus: Prioritizing Informative Histories with Structured Attention Mechanisms in Partially Observable Reinforcement Learning

Learning to Focus: Prioritizing Informative Histories with Structured Attention Mechanisms in Partially Observable Reinforcement Learning

Daniel De Dios Allegue

273

0

0

10 Nov 2025

Learning from Online Videos at Inference Time for Computer-Use Agents

Learning from Online Videos at Inference Time for Computer-Use Agents

153

0

0

06 Nov 2025

Adaptable Hindsight Experience Replay for Search-Based Learning

Adaptable Hindsight Experience Replay for Search-Based Learning

Alexandros Vazaios

Cedric Derstroff

Kristian Kersting

72

0

0

05 Nov 2025

SLAP: Shortcut Learning for Abstract Planning

SLAP: Shortcut Learning for Abstract Planning

Benjamin Eysenbach

125

1

0

02 Nov 2025

Reinforcement Learning for Robotic Safe Control with Force Sensing

Reinforcement Learning for Robotic Safe Control with Force Sensing

60

9

0

30 Oct 2025

Dense and Diverse Goal Coverage in Multi Goal Reinforcement Learning

Dense and Diverse Goal Coverage in Multi Goal Reinforcement Learning

Sagalpreet Singh

110

0

0

29 Oct 2025

Learning "Partner-Aware" Collaborators in Multi-Party Collaboration

Learning "Partner-Aware" Collaborators in Multi-Party Collaboration

Nikhil Krishnaswamy

118

0

0

26 Oct 2025

Confounding Robust Deep Reinforcement Learning: A Causal Approach

Confounding Robust Deep Reinforcement Learning: A Causal Approach

Elias Bareinboim

180

0

0

24 Oct 2025

A Unified Framework for Zero-Shot Reinforcement Learning

A Unified Framework for Zero-Shot Reinforcement Learning

Jacopo Di Ventura

Jan Felix Kleuker

Thomas M. Moerland

88

0

0

23 Oct 2025

DAIL: Beyond Task Ambiguity for Language-Conditioned Reinforcement Learning

DAIL: Beyond Task Ambiguity for Language-Conditioned Reinforcement Learning

144

0

0

22 Oct 2025

A Principle of Targeted Intervention for Multi-Agent Reinforcement Learning

A Principle of Targeted Intervention for Multi-Agent Reinforcement Learning

252

0

0

20 Oct 2025

Consistent Zero-Shot Imitation with Contrastive Goal Inference

Consistent Zero-Shot Imitation with Contrastive Goal Inference

Kathryn Wantlin

Benjamin Eysenbach

176

0

0

20 Oct 2025

DDBot: Differentiable Physics-based Digging Robot for Unknown Granular Materials

DDBot: Differentiable Physics-based Digging Robot for Unknown Granular Materials

196

0

0

20 Oct 2025

RLAF: Reinforcement Learning from Automaton Feedback

RLAF: Reinforcement Learning from Automaton Feedback

Mahyar Alinejad

Alvaro Velasquez

107

0

0

17 Oct 2025

ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning

ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning

Roger Creus Castanyer

Pablo Samuel Castro

OffRL LRM AI4CE

213

0

0

16 Oct 2025

Demystifying the Mechanisms Behind Emergent Exploration in Goal-conditioned RL

Demystifying the Mechanisms Behind Emergent Exploration in Goal-conditioned RL

Mahsa Bastankhah

Thomas L. Griffiths

Benjamin Eysenbach

92

1

0

15 Oct 2025

A Primer on SO(3) Action Representations in Deep Reinforcement Learning

A Primer on SO(3) Action Representations in Deep Reinforcement Learning

Angela P. Schoellig

100

0

0

13 Oct 2025

Sample-Efficient Online Learning in LM Agents via Hindsight Trajectory Rewriting

Sample-Efficient Online Learning in LM Agents via Hindsight Trajectory Rewriting

Benjamin Van Durme

104

0

0

11 Oct 2025

Towards Safe Maneuvering of Double-Ackermann-Steering Robots with a Soft Actor-Critic Framework

Towards Safe Maneuvering of Double-Ackermann-Steering Robots with a Soft Actor-Critic Framework

Kohio Deflesselle

Mélodie Daniel

101

0

0

11 Oct 2025

Dejavu: Towards Experience Feedback Learning for Embodied Intelligence

Dejavu: Towards Experience Feedback Learning for Embodied Intelligence

Shalayiding Sirejiding

Bayram Bayramli

156

0

0

11 Oct 2025

BaNEL: Exploration Posteriors for Generative Modeling Using Only Negative Rewards

BaNEL: Exploration Posteriors for Generative Modeling Using Only Negative Rewards

124

0

0

10 Oct 2025

Analytical Survey of Learning with Low-Resource Data: From Analysis to Investigation

Analytical Survey of Learning with Low-Resource Data: From Analysis to Investigation

...

184

3

0

10 Oct 2025

Agent Learning via Early Experience

Agent Learning via Early Experience

...

Eric Fosler-Lussier

195

6

0

09 Oct 2025

Test-Time Graph Search for Goal-Conditioned Reinforcement Learning

Test-Time Graph Search for Goal-Conditioned Reinforcement Learning

Evgenii Opryshko

Igor Gilitschenski

124

2

0

08 Oct 2025

Automaton Constrained Q-Learning

Automaton Constrained Q-Learning

Anastasios Manganaris

Vittorio Giammarino

191

0

0

06 Oct 2025

Learning on the Job: Test-Time Curricula for Targeted Reinforcement Learning

Learning on the Job: Test-Time Curricula for Targeted Reinforcement Learning

Jonas Hübotter

Leander Diaz-Bone

155

1

0

06 Oct 2025

Learning to Act Through Contact: A Unified View of Multi-Task Robot Learning

Learning to Act Through Contact: A Unified View of Multi-Task Robot Learning

111

0

0

04 Oct 2025

D2 Actor Critic: Diffusion Actor Meets Distributional Critic

D2 Actor Critic: Diffusion Actor Meets Distributional Critic

Bradly C. Stadie

259

1

0

03 Oct 2025

Aristotle: IMO-level Automated Theorem Proving

Aristotle: IMO-level Automated Theorem Proving

Mathïs Fédérico

...

Harold Williams

166

4

0

01 Oct 2025

Simultaneous Multi-objective Alignment Across Verifiable and Non-verifiable Rewards

Simultaneous Multi-objective Alignment Across Verifiable and Non-verifiable Rewards

Jonathan D. Chang

Prithviraj Ammanabrolu

160

0

0

01 Oct 2025

Fixing That Free Lunch: When, Where, and Why Synthetic Data Fails in Model-Based Policy Optimization

Fixing That Free Lunch: When, Where, and Why Synthetic Data Fails in Model-Based Policy Optimization

David Fridovich-Keil

152

0

0

01 Oct 2025

Efficient On-Policy Reinforcement Learning via Exploration of Sparse Parameter Space

Efficient On-Policy Reinforcement Learning via Exploration of Sparse Parameter Space

76

0

0

30 Sep 2025

In-Context Compositional Q-Learning for Offline Reinforcement Learning

In-Context Compositional Q-Learning for Offline Reinforcement Learning

136

0

0

28 Sep 2025

Offline Goal-conditioned Reinforcement Learning with Quasimetric Representations

Offline Goal-conditioned Reinforcement Learning with Quasimetric Representations

Bill Chunyuan Zheng

Benjamin Eysenbach

164

1

0

24 Sep 2025

Uncertainty-Based Smooth Policy Regularisation for Reinforcement Learning with Few Demonstrations

Uncertainty-Based Smooth Policy Regularisation for Reinforcement Learning with Few Demonstrations

Charles A. Hepburn

Giovanni Montana

188

0

0

19 Sep 2025

Sample Efficient Experience Replay in Non-stationary Environments

Sample Efficient Experience Replay in Non-stationary Environments

...

132

1

0

18 Sep 2025

Self-Supervised Goal-Reaching Results in Multi-Agent Cooperation and Exploration

Self-Supervised Goal-Reaching Results in Multi-Agent Cooperation and Exploration

Chirayu Nimonkar

Benjamin Eysenbach

162

1

0

12 Sep 2025

Dexplore: Scalable Neural Control for Dexterous Manipulation from Reference-Scoped Exploration

Dexplore: Scalable Neural Control for Dexterous Manipulation from Reference-Scoped Exploration

Arsalan Mousavian

108

0

0

11 Sep 2025

Imagined Autocurricula

Imagined Autocurricula

Ahmet H. Güzel

Matthew Jackson

Tim Rocktaschel

Ilija Bogunovic

Jack Parker-Holder

219

1

0

11 Sep 2025

Physics-informed Value Learner for Offline Goal-Conditioned Reinforcement Learning

Physics-informed Value Learner for Offline Goal-Conditioned Reinforcement Learning

Vittorio Giammarino

190

1

0

08 Sep 2025

Reinforcement Learning with Anticipation: A Hierarchical Approach for Long-Horizon Tasks

Reinforcement Learning with Anticipation: A Hierarchical Approach for Long-Horizon Tasks

72

1

0

06 Sep 2025

RoboBallet: Planning for Multi-Robot Reaching with Graph Neural Networks and Reinforcement Learning

RoboBallet: Planning for Multi-Robot Reaching with Graph Neural Networks and Reinforcement Learning

Jonathan Scholz

120

6

0

05 Sep 2025

1 2 3 4...25 26 27