AURORA:Automated Training Framework of Universal Process Reward Models via Ensemble Prompting and Reverse Verification

AURORA:Automated Training Framework of Universal Process Reward Models via Ensemble Prompting and Reverse Verification

17 February 2025

Papers citing "AURORA:Automated Training Framework of Universal Process Reward Models via Ensemble Prompting and Reverse Verification"

1 / 1 papers shown

Title
Efficient Process Reward Model Training via Active Learning Keyu Duan Zichen Liu Xin Mao Tianyu Pang Changyu Chen Qiguang Chen Michael Shieh Longxu Dou LRM 20 1 0 14 Apr 2025