Language Imbalance Driven Rewarding for Multilingual Self-improving

11 October 2024

Papers citing "Language Imbalance Driven Rewarding for Multilingual Self-improving"

4 / 4 papers shown

Title
Crosslingual Reasoning through Test-Time Scaling Zheng-Xin Yong Muhammad Farid Adilazuarda Jonibek Mansurov Ruochen Zhang Niklas Muennighoff Carsten Eickhoff Genta Indra Winata Julia Kreutzer Stephen H. Bach Alham Fikri Aji LRM ELM 46 0 0 08 May 2025
Could Thinking Multilingually Empower LLM Reasoning? Changjiang Gao Xu Huang Wenhao Zhu Shujian Huang Lei Li Fei Yuan LRM 22 0 0 16 Apr 2025
CONGRAD:Conflicting Gradient Filtering for Multilingual Preference Alignment Jiangnan Li Thuy-Trang Vu Christian Herold Amirhossein Tebbifakhr Shahram Khadivi Gholamreza Haffari 31 0 0 31 Mar 2025
Implicit Cross-Lingual Rewarding for Efficient Multilingual Preference Alignment Wen Yang Junhong Wu Chen Wang Chengqing Zong J. Zhang 61 1 0 06 Mar 2025