Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2506.14731
Cited By

Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs

v1v2 (latest)

Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs

17 June 2025

ArXiv (abs)PDF HTML HuggingFace (9 upvotes)

Papers citing "Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs"

5 / 5 papers shown

Towards Stable and Effective Reinforcement Learning for Mixture-of-Experts

Towards Stable and Effective Reinforcement Learning for Mixture-of-Experts

Furu Wei

152

0

0

27 Oct 2025

Every Step Evolves: Scaling Reinforcement Learning for Trillion-Scale Thinking Model

Every Step Evolves: Scaling Reinforcement Learning for Trillion-Scale Thinking Model

...

Longxiang Zhang

263

5

0

21 Oct 2025

PromptCoT 2.0: Scaling Prompt Synthesis for Large Language Model Reasoning

PromptCoT 2.0: Scaling Prompt Synthesis for Large Language Model Reasoning

ReLM OffRL LRM AI4TS

176

1

0

24 Sep 2025

Klear-Reasoner: Advancing Reasoning Capability via Gradient-Preserving Clipping Policy Optimization

Klear-Reasoner: Advancing Reasoning Capability via Gradient-Preserving Clipping Policy Optimization

137

14

0

11 Aug 2025

Agentar-Fin-R1: Enhancing Financial Intelligence through Domain Expertise, Training Efficiency, and Advanced Reasoning

Agentar-Fin-R1: Enhancing Financial Intelligence through Domain Expertise, Training Efficiency, and Advanced Reasoning

...

343

0

0

22 Jul 2025