Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2506.22200
Cited By

EFRame: Deeper Reasoning via Exploration-Filter-Replay Reinforcement Learning Framework

v1v2v3v4v5 (latest)

EFRame: Deeper Reasoning via Exploration-Filter-Replay Reinforcement Learning Framework

27 June 2025

ArXiv (abs)PDF HTML Github (738★)

Papers citing "EFRame: Deeper Reasoning via Exploration-Filter-Replay Reinforcement Learning Framework"

1 / 1 papers shown

Arbitrary Entropy Policy Optimization Breaks The Exploration Bottleneck of Reinforcement Learning

Arbitrary Entropy Policy Optimization Breaks The Exploration Bottleneck of Reinforcement Learning

380

0

0

09 Oct 2025

Page 1 of 1