Semi-Supervised Reward Modeling via Iterative Self-Training

10 September 2024

Han Zhao

Papers citing "Semi-Supervised Reward Modeling via Iterative Self-Training"

1 / 1 papers shown

Title
Revisiting Self-Training for Neural Sequence Generation Junxian He Jiatao Gu Jiajun Shen MarcÁurelio Ranzato SSL LRM 236 252 0 30 Sep 2019