Learning to Reason via Self-Iterative Process Feedback for Small Language Models

11 December 2024

Papers citing "Learning to Reason via Self-Iterative Process Feedback for Small Language Models"

1 / 1 papers shown

Title
Training Small Reasoning LLMs with Cognitive Preference Alignment Wenrui Cai Chengyu Wang Junbing Yan Jun Huang Xiangzhong Fang LRM 26 0 0 14 Apr 2025