Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2507.05386
Cited By

Reinforcement Fine-Tuning Naturally Mitigates Forgetting in Continual Post-Training

v1v2v3v4v5 (latest)

Reinforcement Fine-Tuning Naturally Mitigates Forgetting in Continual Post-Training

7 July 2025

ArXiv (abs)PDF HTML Github (1★)

Papers citing "Reinforcement Fine-Tuning Naturally Mitigates Forgetting in Continual Post-Training"

9 / 9 papers shown

Learning to Refuse: Refusal-Aware Reinforcement Fine-Tuning for Hard-Irrelevant Queries in Video Temporal Grounding

Learning to Refuse: Refusal-Aware Reinforcement Fine-Tuning for Hard-Irrelevant Queries in Video Temporal Grounding

179

0

0

28 Nov 2025

Retaining by Doing: The Role of On-Policy Data in Mitigating Forgetting

Retaining by Doing: The Role of On-Policy Data in Mitigating Forgetting

Karthik Narasimhan

397

12

0

21 Oct 2025

Continual Learning via Sparse Memory Finetuning

Continual Learning via Sparse Memory Finetuning

Luke Zettlemoyer

Aram H. Markosyan

Vincent-Pierre Berges

155

0

0

16 Oct 2025

Deterministic algorithms for inhomogeneous Bernoulli trials: Shapley value of network devices

Deterministic algorithms for inhomogeneous Bernoulli trials: Shapley value of network devices

227

0

0

08 Oct 2025

Beyond English-Centric Training: How Reinforcement Learning Improves Cross-Lingual Reasoning in LLMs

Beyond English-Centric Training: How Reinforcement Learning Improves Cross-Lingual Reasoning in LLMs

130

2

0

28 Sep 2025

RL Squeezes, SFT Expands: A Comparative Study of Reasoning LLMs

RL Squeezes, SFT Expands: A Comparative Study of Reasoning LLMs

Kohsei Matsutani

Shota Takashiro

Gouki Minegishi

208

6

0

25 Sep 2025

Reinforcement Learning on Pre-Training Data

Reinforcement Learning on Pre-Training Data

...

184

4

0

23 Sep 2025

RL's Razor: Why Online Reinforcement Learning Forgets Less

RL's Razor: Why Online Reinforcement Learning Forgets Less

194

43

0

04 Sep 2025

EFRame: Deeper Reasoning via Exploration-Filter-Replay Reinforcement Learning Framework

EFRame: Deeper Reasoning via Exploration-Filter-Replay Reinforcement Learning Framework

382

2

0

27 Jun 2025

Page 1 of 1