Low-Redundant Optimization for Large Language Model Alignment

Low-Redundant Optimization for Large Language Model Alignment

Conference on Empirical Methods in Natural Language Processing (EMNLP), 2024

18 June 2024

Zhipeng Chen

Kun Zhou

Wayne Xin Zhao

Ji-Rong Wen

ArXiv (abs)PDF HTML Github (9★)

Papers citing "Low-Redundant Optimization for Large Language Model Alignment"

4 / 4 papers shown

Title
Extracting and Combining Abilities For Building Multi-lingual Ability-enhanced Large Language Models Zhipeng Chen Liang Song K. Zhou Wayne Xin Zhao Binghai Wang Weipeng Chen Ji-Rong Wen 362 0 0 10 Oct 2024
Selective Preference Optimization via Token-Level Reward Function Estimation Kailai Yang Shanshan Yang Qianqian Xie Jimin Huang Erxue Min Sophia Ananiadou 327 16 0 24 Aug 2024
Bridging and Modeling Correlations in Pairwise Data for Direct Preference OptimizationInternational Conference on Learning Representations (ICLR), 2024 Yuxin Jiang Bo Huang Yufei Wang Xingshan Zeng Liangyou Li Yasheng Wang Xin Jiang Lifeng Shang Ruiming Tang Wei Wang 280 4 0 14 Aug 2024
WizardMath: Empowering Mathematical Reasoning for Large Language Models via Reinforced Evol-InstructInternational Conference on Learning Representations (ICLR), 2023 Haipeng Luo Qingfeng Sun Can Xu Lu Wang Jian-Guang Lou ... Xiubo Geng Qingwei Lin Shifeng Chen Yansong Tang Dongmei Zhang LRM OSLM 788 621 0 18 Aug 2023