v1v2v3 (latest)

Hindsight Experience Replay

5 July 2017

Pieter Abbeel

Papers citing "Hindsight Experience Replay"

50 / 1,339 papers shown

D3HRL: A Distributed Hierarchical Reinforcement Learning Approach Based on Causal Discovery and Spurious Correlation Detection

286

04 May 2025

CAMOUFLAGE: Exploiting Misinformation Detection Systems Through LLM-driven Adversarial Claim Transformation

292

03 May 2025

Neuro-Symbolic Generation of Explanations for Robot Policies with Weighted Signal Temporal Logic

Mikihisa Yuasa

R. Sreenivas

Huy T. Tran

421

30 Apr 2025

Hierarchical Reinforcement Learning in Multi-Goal Spatial Navigation with Autonomous Mobile Robots

Brendon Johnson

Alfredo Weitzenfeld

368

26 Apr 2025

Planning with Diffusion Models for Target-Oriented Dialogue SystemsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

Hanwen Du

Bo Peng

Xia Ning

401

23 Apr 2025

Stop Summation: Min-Form Credit Assignment Is All Process Reward Model Needs for Reasoning

953

21 Apr 2025

Next-Future: Sample-Efficient Policy Learning for Robotic-Arm Tasks

Fikrican Özgür

René Zurbrugg

Suryansh Kumar

293

15 Apr 2025

Digital Twin Catalog: A Large-Scale Photorealistic 3D Object Digital Twin DatasetComputer Vision and Pattern Recognition (CVPR), 2025

...

373

11 Apr 2025

Diffusion Models for Robotic Manipulation: A SurveyFrontiers in Robotics and AI (Front. Robot. AI), 2025

541

11 Apr 2025

TW-CRL: Time-Weighted Contrastive Reward Learning for Efficient Inverse Reinforcement Learning

385

08 Apr 2025

Solving Sokoban using Hierarchical Reinforcement Learning with Landmarks

Sergey Pastukhov

232

06 Apr 2025

Outlook Towards Deployable Continual Learning for Particle Accelerators

260

04 Apr 2025

Reward Generation via Large Vision-Language Model in Offline Reinforcement LearningIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2025

321

03 Apr 2025

Probabilistic Curriculum Learning for Goal-Based Reinforcement Learning

Llewyn Salt

Marcus Gallagher

241

02 Apr 2025

MAER-Nav: Bidirectional Motion Learning Through Mirror-Augmented Experience Replay for Robot Navigation

154

31 Mar 2025

Adventurer: Exploration with BiGAN for Deep Reinforcement Learning

Yongshuai Liu

Xin Liu

GAN

415

24 Mar 2025

Causally Aligned Curriculum LearningInternational Conference on Learning Representations (ICLR), 2025

305

21 Mar 2025

CONTHER: Human-Like Contextual Robot Learning via Hindsight Experience Replay and Transformers without Expert Demonstrations

246

20 Mar 2025

Neural Lyapunov Function Approximation with Self-Supervised Reinforcement LearningIEEE International Conference on Robotics and Automation (ICRA), 2025

Luc McCutcheon

Bahman Gharesifard

Saber Fallah

233

19 Mar 2025

Hierarchical Reinforcement Learning for Safe Mapless Navigation with Congestion EstimationIEEE International Conference on Robotics and Automation (ICRA), 2025

311

15 Mar 2025

LUMOS: Language-Conditioned Imitation Learning with World ModelsIEEE International Conference on Robotics and Automation (ICRA), 2025

224

13 Mar 2025

DiffPO: Diffusion-styled Preference Optimization for Efficient Inference-Time Alignment of Large Language Models

543

06 Mar 2025

Causality-Based Reinforcement Learning Method for Multi-Stage Robotic Tasks

Jiechao Deng

Ning Tan

274

05 Mar 2025

Generative Artificial Intelligence in Robotic Manipulation: A Survey

...

674

05 Mar 2025

ROCKET-2: Steering Visuomotor Policy via Cross-View Goal Alignment

296

04 Mar 2025

Variable-Friction In-Hand Manipulation for Arbitrary Objects via Diffusion-Based Imitation LearningIEEE International Conference on Robotics and Automation (ICRA), 2025

242

04 Mar 2025

M3HF: Multi-agent Reinforcement Learning from Multi-phase Human Feedback of Mixed Quality

476

03 Mar 2025

Sentence-level Reward Model can Generalize Better for Aligning LLM from Human Preference

455

01 Mar 2025

Training a Generally Curious Agent

588

24 Feb 2025

A Simulation Pipeline to Facilitate Real-World Robotic Reinforcement Learning ApplicationsIEEE Systems Conference (SysCon), 2025

Jefferson Silveira

Joshua A. Marshall

Sidney N. Givigi Jr

293

24 Feb 2025

Theoretical Barriers in Bellman-Based Reinforcement Learning

Brieuc Pinon

Raphaël Jungers

Jean-Charles Delvenne

125

17 Feb 2025

Dynamic Reinforcement Learning for ActorsNeural Networks (NN), 2025

Katsunari Shibata

AI4CE

121

17 Feb 2025

Temporal Representation Alignment: Successor Features Enable Emergent Compositionality in Robot Instruction Following

502

08 Feb 2025

Toward Task Generalization via Memory Augmentation in Meta-Reinforcement Learning

607

03 Feb 2025

Search-Based Adversarial Estimates for Improving Sample Efficiency in Off-Policy Reinforcement Learning

Federico Malato

Ville Hautamaki

295

03 Feb 2025

Upside Down Reinforcement Learning with Policy Generators

249

27 Jan 2025

Adaptive Data Exploitation in Deep Reinforcement Learning

916

22 Jan 2025

Pareto Set Learning for Multi-Objective Reinforcement LearningAAAI Conference on Artificial Intelligence (AAAI), 2025

643

12 Jan 2025

Segmenting Text and Learning Their Rewards for Improved RLHF in Language Model

330

07 Jan 2025

Attribute-Based Robotic Grasping with Data-Efficient AdaptationIEEE Transactions on robotics (IEEE TRO), 2025

441

04 Jan 2025

DIPPER: Direct Preference Optimization to Accelerate Primitive-Enabled Hierarchical Reinforcement Learning

414

03 Jan 2025

Hierarchical Subspaces of Policies for Continual Offline Reinforcement Learning

Anthony Kobanda

Rémy Portelas

Odalric-Ambrym Maillard

Ludovic Denoyer

OffRL CLL

687

19 Dec 2024

Learning to Navigate in Mazes with Novel Layouts using Abstract Top-down Maps

Linfeng Zhao

Lawson L. S. Wong

360

16 Dec 2024

Dense Dynamics-Aware Reward Synthesis: Integrating Prior Experience with DemonstrationsConference on Learning for Dynamics & Control (L4DC), 2024

434

02 Dec 2024

Umbrella Reinforcement Learning -- computationally efficient tool for hard non-linear problemsCommunications in nonlinear science & numerical simulation (CNSNS), 2024

Egor E. Nuzhin

Nikolai V. Brilliantov

219

21 Nov 2024

Precision-Focused Reinforcement Learning Model for Robotic Object Pushing

250

13 Nov 2024

Pre-trained Visual Dynamics Representations for Efficient Policy LearningEuropean Conference on Computer Vision (ECCV), 2024

Hao Luo

Bohan Zhou

Zongqing Lu

267

05 Nov 2024

Formal Theorem Proving by Rewarding LLMs to Decompose Proofs Hierarchically

301

04 Nov 2024

Learning World Models for Unconstrained Goal NavigationNeural Information Processing Systems (NeurIPS), 2024

Yuanlin Duan

Wensen Mao

He Zhu

242

03 Nov 2024

Exploring the Edges of Latent State Clusters for Goal-Conditioned Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2024

380

03 Nov 2024