LongR: Unleashing Long-Context Reasoning via Reinforcement Learning with Dense Utility Rewards

LongR: Unleashing Long-Context Reasoning via Reinforcement Learning with Dense Utility Rewards

5 February 2026

Bowen Ping

Zijun Chen

Yiyao Yu

Tingfeng Hui

Junchi Yan

Baobao Chang

ArXiv (abs)PDF HTML Github (66960★)

Papers citing "LongR: Unleashing Long-Context Reasoning via Reinforcement Learning with Dense Utility Rewards"

0 / 0 papers shown

No papers found