Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
1707.01495
Cited By

Hindsight Experience Replay

v1v2v3 (latest)

Hindsight Experience Replay

5 July 2017

Marcin Andrychowicz

Jonas Schneider

Pieter Abbeel

Wojciech Zaremba

ArXiv (abs)PDF HTML

Papers citing "Hindsight Experience Replay"

50 / 1,339 papers shown

SAGAS: Semantic-Aware Graph-Assisted Stitching for Offline Temporal Logic Planning

SAGAS: Semantic-Aware Graph-Assisted Stitching for Offline Temporal Logic Planning

94

0

0

30 Nov 2025

Hyper-GoalNet: Goal-Conditioned Manipulation Policy Learning with HyperNetworks

Hyper-GoalNet: Goal-Conditioned Manipulation Policy Learning with HyperNetworks

86

1

0

26 Nov 2025

MagBotSim: Physics-Based Simulation and Reinforcement Learning Environments for Magnetic Robotics

Cedric Grothues

110

0

0

20 Nov 2025

Expressive Temporal Specifications for Reward Monitoring

Expressive Temporal Specifications for Reward Monitoring

Francesco Belardinelli

168

0

0

16 Nov 2025

Beyond Fixed Tasks: Unsupervised Environment Design for Task-Level Pairs

Beyond Fixed Tasks: Unsupervised Environment Design for Task-Level Pairs

Daniel Furelos-Blanco

Frederik Kelbel

Alessandra Russo

134

0

0

16 Nov 2025

NFQ2.0: The CartPole Benchmark Revisited

NFQ2.0: The CartPole Benchmark Revisited

Martin Riedmiller

90

0

0

16 Nov 2025

Learning to Focus: Prioritizing Informative Histories with Structured Attention Mechanisms in Partially Observable Reinforcement Learning

Learning to Focus: Prioritizing Informative Histories with Structured Attention Mechanisms in Partially Observable Reinforcement Learning

Daniel De Dios Allegue

288

0

0

10 Nov 2025

Physically-Grounded Goal Imagination: Physics-Informed Variational Autoencoder for Self-Supervised Reinforcement Learning

Physically-Grounded Goal Imagination: Physics-Informed Variational Autoencoder for Self-Supervised Reinforcement Learning

Lan Thi Ha Nguyen

533

0

0

10 Nov 2025

Enabling Off-Policy Imitation Learning with Deep Actor Critic Stabilization

Enabling Off-Policy Imitation Learning with Deep Actor Critic Stabilization

Shalabh Bhatnagar

106

0

0

10 Nov 2025

Learning from Online Videos at Inference Time for Computer-Use Agents

Learning from Online Videos at Inference Time for Computer-Use Agents

166

0

0

06 Nov 2025

Adaptable Hindsight Experience Replay for Search-Based Learning

Adaptable Hindsight Experience Replay for Search-Based Learning

Alexandros Vazaios

Cedric Derstroff

Kristian Kersting

80

0

0

05 Nov 2025

SLAP: Shortcut Learning for Abstract Planning

SLAP: Shortcut Learning for Abstract Planning

Benjamin Eysenbach

129

1

0

02 Nov 2025

Reinforcement Learning for Robotic Safe Control with Force Sensing

Reinforcement Learning for Robotic Safe Control with Force Sensing

82

9

0

30 Oct 2025

Dense and Diverse Goal Coverage in Multi Goal Reinforcement Learning

Dense and Diverse Goal Coverage in Multi Goal Reinforcement Learning

Sagalpreet Singh

117

0

0

29 Oct 2025

Learning "Partner-Aware" Collaborators in Multi-Party Collaboration

Learning "Partner-Aware" Collaborators in Multi-Party Collaboration

Nikhil Krishnaswamy

135

0

0

26 Oct 2025

Confounding Robust Deep Reinforcement Learning: A Causal Approach

Confounding Robust Deep Reinforcement Learning: A Causal Approach

Elias Bareinboim

188

0

0

24 Oct 2025

A Unified Framework for Zero-Shot Reinforcement Learning

A Unified Framework for Zero-Shot Reinforcement Learning

Jacopo Di Ventura

Jan Felix Kleuker

Thomas M. Moerland

92

0

0

23 Oct 2025

DAIL: Beyond Task Ambiguity for Language-Conditioned Reinforcement Learning

DAIL: Beyond Task Ambiguity for Language-Conditioned Reinforcement Learning

155

0

0

22 Oct 2025

A Principle of Targeted Intervention for Multi-Agent Reinforcement Learning

A Principle of Targeted Intervention for Multi-Agent Reinforcement Learning

281

0

0

20 Oct 2025

Consistent Zero-Shot Imitation with Contrastive Goal Inference

Consistent Zero-Shot Imitation with Contrastive Goal Inference

Kathryn Wantlin

Benjamin Eysenbach

187

0

0

20 Oct 2025

DDBot: Differentiable Physics-based Digging Robot for Unknown Granular Materials

DDBot: Differentiable Physics-based Digging Robot for Unknown Granular Materials

229

0

0

20 Oct 2025

RLAF: Reinforcement Learning from Automaton Feedback

RLAF: Reinforcement Learning from Automaton Feedback

Mahyar Alinejad

Alvaro Velasquez

123

0

0

17 Oct 2025

ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning

ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning

Roger Creus Castanyer

Pablo Samuel Castro

OffRL LRM AI4CE

242

0

0

16 Oct 2025

Demystifying the Mechanisms Behind Emergent Exploration in Goal-conditioned RL

Demystifying the Mechanisms Behind Emergent Exploration in Goal-conditioned RL

Mahsa Bastankhah

Thomas L. Griffiths

Benjamin Eysenbach

101

1

0

15 Oct 2025

A Primer on SO(3) Action Representations in Deep Reinforcement Learning

A Primer on SO(3) Action Representations in Deep Reinforcement Learning

Angela P. Schoellig

105

0

0

13 Oct 2025

Sample-Efficient Online Learning in LM Agents via Hindsight Trajectory Rewriting

Sample-Efficient Online Learning in LM Agents via Hindsight Trajectory Rewriting

Benjamin Van Durme

107

0

0

11 Oct 2025

Towards Safe Maneuvering of Double-Ackermann-Steering Robots with a Soft Actor-Critic Framework

Towards Safe Maneuvering of Double-Ackermann-Steering Robots with a Soft Actor-Critic Framework

Kohio Deflesselle

Mélodie Daniel

113

0

0

11 Oct 2025

Dejavu: Towards Experience Feedback Learning for Embodied Intelligence

Dejavu: Towards Experience Feedback Learning for Embodied Intelligence

Shalayiding Sirejiding

Bayram Bayramli

161

0

0

11 Oct 2025

BaNEL: Exploration Posteriors for Generative Modeling Using Only Negative Rewards

BaNEL: Exploration Posteriors for Generative Modeling Using Only Negative Rewards

132

0

0

10 Oct 2025

Analytical Survey of Learning with Low-Resource Data: From Analysis to Investigation

Analytical Survey of Learning with Low-Resource Data: From Analysis to Investigation

...

184

4

0

10 Oct 2025

Agent Learning via Early Experience

Agent Learning via Early Experience

...

Eric Fosler-Lussier

204

14

0

09 Oct 2025

Test-Time Graph Search for Goal-Conditioned Reinforcement Learning

Test-Time Graph Search for Goal-Conditioned Reinforcement Learning

Evgenii Opryshko

Igor Gilitschenski

130

2

0

08 Oct 2025

Automaton Constrained Q-Learning

Automaton Constrained Q-Learning

Anastasios Manganaris

Vittorio Giammarino

206

1

0

06 Oct 2025

Learning on the Job: Test-Time Curricula for Targeted Reinforcement Learning

Learning on the Job: Test-Time Curricula for Targeted Reinforcement Learning

Jonas Hübotter

Leander Diaz-Bone

161

1

0

06 Oct 2025

Learning to Act Through Contact: A Unified View of Multi-Task Robot Learning

Learning to Act Through Contact: A Unified View of Multi-Task Robot Learning

125

0

0

04 Oct 2025

D2 Actor Critic: Diffusion Actor Meets Distributional Critic

D2 Actor Critic: Diffusion Actor Meets Distributional Critic

Bradly C. Stadie

273

1

0

03 Oct 2025

Aristotle: IMO-level Automated Theorem Proving

Aristotle: IMO-level Automated Theorem Proving

Mathïs Fédérico

...

Harold Williams

175

5

0

01 Oct 2025

Simultaneous Multi-objective Alignment Across Verifiable and Non-verifiable Rewards

Simultaneous Multi-objective Alignment Across Verifiable and Non-verifiable Rewards

Jonathan D. Chang

Prithviraj Ammanabrolu

160

0

0

01 Oct 2025

A Forensic Analysis of Synthetic Data in RL: Diagnosing and Solving Algorithmic Failures in Model-Based Policy Optimization

A Forensic Analysis of Synthetic Data in RL: Diagnosing and Solving Algorithmic Failures in Model-Based Policy Optimization

David Fridovich-Keil

177

0

0

01 Oct 2025

Efficient On-Policy Reinforcement Learning via Exploration of Sparse Parameter Space

Efficient On-Policy Reinforcement Learning via Exploration of Sparse Parameter Space

80

0

0

30 Sep 2025

In-Context Compositional Q-Learning for Offline Reinforcement Learning

In-Context Compositional Q-Learning for Offline Reinforcement Learning

149

0

0

28 Sep 2025

Offline Goal-conditioned Reinforcement Learning with Quasimetric Representations

Offline Goal-conditioned Reinforcement Learning with Quasimetric Representations

Bill Chunyuan Zheng

Benjamin Eysenbach

179

2

0

24 Sep 2025

Uncertainty-Based Smooth Policy Regularisation for Reinforcement Learning with Few Demonstrations

Uncertainty-Based Smooth Policy Regularisation for Reinforcement Learning with Few Demonstrations

Charles A. Hepburn

Giovanni Montana

212

0

0

19 Sep 2025

Sample Efficient Experience Replay in Non-stationary Environments

Sample Efficient Experience Replay in Non-stationary Environments

...

152

3

0

18 Sep 2025

Self-Supervised Goal-Reaching Results in Multi-Agent Cooperation and Exploration

Self-Supervised Goal-Reaching Results in Multi-Agent Cooperation and Exploration

Chirayu Nimonkar

Benjamin Eysenbach

168

1

0

12 Sep 2025

Dexplore: Scalable Neural Control for Dexterous Manipulation from Reference-Scoped Exploration

Dexplore: Scalable Neural Control for Dexterous Manipulation from Reference-Scoped Exploration

Arsalan Mousavian

126

0

0

11 Sep 2025

Imagined Autocurricula

Imagined Autocurricula

Ahmet H. Güzel

Matthew Jackson

Tim Rocktaschel

Ilija Bogunovic

Jack Parker-Holder

223

2

0

11 Sep 2025

Physics-informed Value Learner for Offline Goal-Conditioned Reinforcement Learning

Physics-informed Value Learner for Offline Goal-Conditioned Reinforcement Learning

Vittorio Giammarino

225

1

0

08 Sep 2025

Reinforcement Learning with Anticipation: A Hierarchical Approach for Long-Horizon Tasks

Reinforcement Learning with Anticipation: A Hierarchical Approach for Long-Horizon Tasks

79

1

0

06 Sep 2025

RoboBallet: Planning for Multi-Robot Reaching with Graph Neural Networks and Reinforcement Learning

RoboBallet: Planning for Multi-Robot Reaching with Graph Neural Networks and Reinforcement Learning

Jonathan Scholz

153

9

0

05 Sep 2025

1 2 3 4...25 26 27

Page 1 of 27

Pageof 27