RL Fine-Tuning Heals OOD Forgetting in SFT

8 September 2025

Papers citing "RL Fine-Tuning Heals OOD Forgetting in SFT"

2 / 2 papers shown

Title
Debunk the Myth of SFT Generalization Xiaofeng Lin Hejian Sang Zhipeng Wang Xuezhou Zhang OffRL LRM 21 0 0 30 Sep 2025
How LLMs Learn to Reason: A Complex Network Perspective Sihan Hu X-D Cai Yuan Huang Zhiyuan Yao Linfeng Zhang Pan Zhang Youjin Deng Kun Chen LRM 77 0 0 28 Sep 2025