Learning to Utilize Shaping Rewards: A New Approach of Reward Shaping

5 November 2020

Jianye Hao

Changjie Fan

Papers citing "Learning to Utilize Shaping Rewards: A New Approach of Reward Shaping"

50 / 94 papers shown

Sharpness-Guided Group Relative Policy Optimization via Probability Shaping

Tue Le

Nghi D.Q.Bui

Linh Ngo Van

267

29 Oct 2025

Balancing Specialization and Centralization: A Multi-Agent Reinforcement Learning Benchmark for Sequential Industrial Control

102

23 Oct 2025

Fine-tuning Flow Matching Generative Models with Intermediate Feedback

254

20 Oct 2025

Finite-time Convergence Analysis of Actor-Critic with Evolving Reward

Rui Hu

Yu Chen

Longbo Huang

177

14 Oct 2025

Part II: ROLL Flash -- Accelerating RLVR and Agentic Training with Asynchrony

...

124

13 Oct 2025

Towards Safe Reasoning in Large Reasoning Models via Corrective Intervention

195

29 Sep 2025

Preference-Guided Learning for Sparse-Reward Multi-Agent Reinforcement Learning

287

26 Sep 2025

Orchestrate, Generate, Reflect: A VLM-Based Multi-Agent Collaboration Framework for Automated Driving Policy Learning

146

21 Sep 2025

Tree-Guided Diffusion Planner

Hyeonseong Jeon

Cheolhong Min

Jaesik Park

287

29 Aug 2025

Stabilizing Long-term Multi-turn Reinforcement Learning with Gated Rewards

152

14 Aug 2025

Part I: Tricks or Traps? A Deep Dive into RL for LLM Reasoning

...

197

11 Aug 2025

Self-Adapting Language Models

688

12 Jun 2025

AURA: Autonomous Upskilling with Retrieval-Augmented Agents

398

03 Jun 2025

Distributionally Robust Deep Q-Learning

382

25 May 2025

CCL: Collaborative Curriculum Learning for Sparse-Reward Multi-Agent Reinforcement Learning via Co-evolutionary Task EvolutionInternational Conference on Intelligent Computing (ICIC), 2025

316

08 May 2025

Learning Explainable Dense Reward Shapes via Bayesian Optimization

318

22 Apr 2025

Post-Convergence Sim-to-Real Policy Transfer: A Principled Alternative to Cherry-Picking

Dylan Khor

Bowen Weng

377

21 Apr 2025

Towards Fully Automated Decision-Making Systems for Greenhouse Control: Challenges and Opportunities

342

27 Mar 2025

KEA: Keeping Exploration Alive by Proactively Coordinating Exploration Strategies

334

23 Mar 2025

Towards Better Alignment: Training Diffusion Models with Reinforcement Learning Against Sparse RewardsComputer Vision and Pattern Recognition (CVPR), 2025

717

14 Mar 2025

Curiosity-Driven Imagination: Discovering Plan Operators and Learning Associated Policies for Open-World AdaptationIEEE International Conference on Robotics and Automation (ICRA), 2025

Pierrick Lorang

Hong Lu

Matthias Scheutz

373

06 Mar 2025

Closing the Intent-to-Behavior Gap via Fulfillment Priority Logic

B. Mabsout

Abdelrahman AbdelGawad

R. Mancuso

541

04 Mar 2025

Reinforcement learning Based Automated Design of Differential Evolution Algorithm for Black-box Optimization

257

22 Jan 2025

Blockchain-assisted Demonstration Cloning for Multi-Agent Deep Reinforcement LearningIEEE Internet of Things Journal (IEEE IoT J.), 2024

329

19 Jan 2025

Latent Reward: LLM-Empowered Credit Assignment in Episodic Reinforcement LearningAAAI Conference on Artificial Intelligence (AAAI), 2024

555

10 Jan 2025

Fairness in Reinforcement Learning with Bisimulation Metrics

547

03 Jan 2025

Bootstrapped Reward ShapingAAAI Conference on Artificial Intelligence (AAAI), 2025

279

02 Jan 2025

Comprehensive Overview of Reward Engineering and Shaping in Advancing Reinforcement Learning ApplicationsIEEE Access (IEEE Access), 2024

431

31 Dec 2024

Efficient Model-Based Reinforcement Learning Through Optimistic Thompson SamplingInternational Conference on Learning Representations (ICLR), 2024

Jasmine Bayrooti

Carl Henrik Ek

Amanda Prorok

525

07 Oct 2024

ETGL-DDPG: A Deep Deterministic Policy Gradient Algorithm for Sparse Reward Continuous Control

448

07 Oct 2024

Enhancing Inverse Reinforcement Learning through Encoding Dynamic Information in Reward Shaping

352

04 Oct 2024

ELO-Rated Sequence Rewards: Advancing Reinforcement Learning Models

526

05 Sep 2024

Highly Efficient Self-Adaptive Reward Shaping for Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2024

824

06 Aug 2024

Principal-Agent Reinforcement Learning

Tonghan Wang

240

25 Jul 2024

Automatic Environment Shaping is the Next Frontier in RL

428

23 Jul 2024

Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning

227

30 May 2024

Bilevel reinforcement learning via the development of hyper-gradient without lower-level convexity

Yan Yang

Bin Gao

Ya-xiang Yuan

500

30 May 2024

Reinforcement learning

Florentin Wörgötter

731

3,220

16 May 2024

Enhancing Q-Learning with Large Language Model Heuristics

Xiefeng Wu

LRM

397

06 May 2024

On the Sample Efficiency of Abstractions and Potential-Based Reward Shaping in Reinforcement Learning

351

11 Apr 2024

Extremum-Seeking Action Selection for Accelerating Policy OptimizationIEEE International Conference on Robotics and Automation (ICRA), 2024

Ya-Chien Chang

Sicun Gao

318

02 Apr 2024

Decomposing Control Lyapunov Functions for Efficient Reinforcement LearningAmerican Control Conference (ACC), 2024

Antonio Lopez

David Fridovich-Keil

295

18 Mar 2024

Transformable Gaussian Reward Function for Socially-Aware Navigation with Deep Reinforcement Learning

900

22 Feb 2024

Auxiliary Reward Generation with Transition Distance Representation Learning

Siyuan Li

252

12 Feb 2024

Principled Penalty-based Methods for Bilevel Reinforcement Learning and RLHFInternational Conference on Machine Learning (ICML), 2024

432

10 Feb 2024

Reinforcement Learning from Bagged Reward

397

06 Feb 2024

Principal-Agent Reward Shaping in MDPsAAAI Conference on Artificial Intelligence (AAAI), 2023

256

30 Dec 2023

Human-AI Collaboration in Real-World Complex Environment with Reinforcement Learning

238

23 Dec 2023

Toward Computationally Efficient Inverse Reinforcement Learning via Reward Shaping

Finale Doshi-Velez

430

15 Dec 2023

FoMo Rewards: Can we cast foundation models as reward functions?

303

06 Dec 2023