Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2507.21848
Cited By

EDGE-GRPO: Entropy-Driven GRPO with Guided Error Correction for Advantage Diversity

EDGE-GRPO: Entropy-Driven GRPO with Guided Error Correction for Advantage Diversity

29 July 2025

ArXiv (abs)PDF HTML HuggingFace (6 upvotes)Github (17★)

Papers citing "EDGE-GRPO: Entropy-Driven GRPO with Guided Error Correction for Advantage Diversity"

7 / 7 papers shown

Beyond High-Entropy Exploration: Correctness-Aware Low-Entropy Segment-Based Advantage Shaping for Reasoning LLMs

108

1

0

30 Nov 2025

Arbitrary Entropy Policy Optimization Breaks The Exploration Bottleneck of Reinforcement Learning

Arbitrary Entropy Policy Optimization Breaks The Exploration Bottleneck of Reinforcement Learning

369

0

0

09 Oct 2025

Meta-Awareness Enhances Reasoning Models: Self-Alignment Reinforcement Learning

Meta-Awareness Enhances Reasoning Models: Self-Alignment Reinforcement Learning

202

1

0

26 Sep 2025

FastGRPO: Accelerating Policy Optimization via Concurrency-aware Speculative Decoding and Online Draft Learning

FastGRPO: Accelerating Policy Optimization via Concurrency-aware Speculative Decoding and Online Draft Learning

131

1

0

26 Sep 2025

From Uniform to Heterogeneous: Tailoring Policy Optimization to Every Token's Nature

From Uniform to Heterogeneous: Tailoring Policy Optimization to Every Token's Nature

82

3

0

20 Sep 2025

Harnessing Uncertainty: Entropy-Modulated Policy Gradients for Long-Horizon LLM Agents

Harnessing Uncertainty: Entropy-Modulated Policy Gradients for Long-Horizon LLM Agents

156

12

0

11 Sep 2025

Efficiency-Effectiveness Reranking FLOPs for LLM-based Rerankers

Efficiency-Effectiveness Reranking FLOPs for LLM-based Rerankers

243

0

0

08 Jul 2025

Page 1 of 1