Self-training Language Models for Arithmetic Reasoning

11 July 2024

Papers citing "Self-training Language Models for Arithmetic Reasoning"

1 / 1 papers shown

Title
KTO: Model Alignment as Prospect Theoretic Optimization Kawin Ethayarajh Winnie Xu Niklas Muennighoff Dan Jurafsky Douwe Kiela 153 437 0 02 Feb 2024