Improving Large Language Model Fine-tuning for Solving Math Problems

16 October 2023

Papers citing "Improving Large Language Model Fine-tuning for Solving Math Problems"

36 / 36 papers shown

Title
A Survey on Mathematical Reasoning and Optimization with Large Language Models Ali Forootani OffRL LRM AI4CE 40 0 0 22 Mar 2025
Probabilistic Reasoning with LLMs for k-anonymity Estimation Jonathan Zheng Sauvik Das Alan Ritter Wei-ping Xu 45 0 0 12 Mar 2025
Performance Comparison of Large Language Models on Advanced Calculus Problems In Hak Moon LRM ELM 51 0 0 05 Mar 2025
Constraining Sequential Model Editing with Editing Anchor Compression Hao-Xiang Xu Jun-Yu Ma Zhen-Hua Ling Ningyu Zhang Jia-Chen Gu KELM 38 1 0 25 Feb 2025
SafeInt: Shielding Large Language Models from Jailbreak Attacks via Safety-Aware Representation Intervention Jiaqi Wu Chen Chen Chunyan Hou Xiaojie Yuan AAML 51 0 0 24 Feb 2025
Stepwise Perplexity-Guided Refinement for Efficient Chain-of-Thought Reasoning in Large Language Models Yingqian Cui Pengfei He Jingying Zeng Hui Liu X. Tang ... Zhen Li Suhang Wang Yue Xing Jiliang Tang Qi He LRM 34 6 0 18 Feb 2025
Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models Junyu Chen Han Cai Junsong Chen E. Xie Shang Yang Haotian Tang Muyang Li Y. Lu Song Han DiffM 54 35 0 20 Jan 2025
Mathematical Language Models: A Survey W. Liu Hanglei Hu Jie Zhou Yuyang Ding Junsong Li ... Mengliang He Qin Chen Bo Jiang Aimin Zhou Liang He LRM 65 12 0 03 Jan 2025
LLM Reasoning Engine: Specialized Training for Enhanced Mathematical Reasoning Shuguang Chen Guang Lin LRM 30 0 0 28 Dec 2024
Inference Scaling fLaws: The Limits of LLM Resampling with Imperfect Verifiers Benedikt Stroebl Sayash Kapoor Arvind Narayanan LRM 80 6 0 26 Nov 2024
Unraveling Arithmetic in Large Language Models: The Role of Algebraic Structures Fu-Chieh Chang Pei-Yuan Wu Pei-Yuan Wu LRM 84 1 0 25 Nov 2024
Fourier Head: Helping Large Language Models Learn Complex Probability Distributions Nate Gillman Daksh Aggarwal Michael Freeman Saurabh Singh Chen Sun AI4TS 29 3 0 29 Oct 2024
Language Models are Symbolic Learners in Arithmetic Chunyuan Deng Zhiqi Li Roy Xie Ruidi Chang Hanjie Chen 14 3 0 21 Oct 2024
When Not to Answer: Evaluating Prompts on GPT Models for Effective Abstention in Unanswerable Math Word Problems Asir Saadat Tasmia Binte Sogir Md Taukir Azam Chowdhury Syem Aziz 68 1 0 16 Oct 2024
Enhancing LLM-based Autonomous Driving Agents to Mitigate Perception Attacks Ruoyu Song Muslum Ozgur Ozmen Hyungsub Kim Antonio Bianchi Z. Berkay Celik AAML 19 5 0 22 Sep 2024
Critic-CoT: Boosting the reasoning abilities of large language model via Chain-of-thoughts Critic Xin Zheng Jie Lou Boxi Cao Xueru Wen Yuqiu Ji Hongyu Lin Y. Lu Xianpei Han Debing Zhang Le Sun LLMAG OffRL LRM ReLM KELM 20 8 1 29 Aug 2024
Visual Agents as Fast and Slow Thinkers Guangyan Sun Mingyu Jin Zhenting Wang Cheng-Long Wang Siqi Ma Qifan Wang Ying Nian Wu Ying Nian Wu Dongfang Liu Dongfang Liu LLMAG LRM 63 11 0 16 Aug 2024
Step-DPO: Step-wise Preference Optimization for Long-chain Reasoning of LLMs Xin Lai Zhuotao Tian Yukang Chen Senqiao Yang Xiangru Peng Jiaya Jia LRM 41 89 0 26 Jun 2024
When Reasoning Meets Information Aggregation: A Case Study with Sports Narratives Yebowen Hu Kaiqiang Song Sangwoo Cho Xiaoyang Wang Wenlin Yao H. Foroosh Dong Yu Fei Liu 22 6 0 17 Jun 2024
More Than Catastrophic Forgetting: Integrating General Capabilities For Domain-Specific LLMs Chengyuan Liu Shihang Wang Yangyang Kang Lizhi Qing Fubang Zhao Changlong Sun Kun Kuang Fei Wu ELM AILaw CLL 14 6 0 28 May 2024
DOP: Diagnostic-Oriented Prompting for Large Language Models in Mathematical Correction Hao Chen Biaojie Zeng Xin Lin Liang He Aimin Zhou LRM 33 0 0 20 May 2024
Position: Understanding LLMs Requires More Than Statistical Generalization Patrik Reizinger Szilvia Ujváry Anna Mészáros A. Kerekes Wieland Brendel Ferenc Huszár 26 12 0 03 May 2024
Knowledgeable Agents by Offline Reinforcement Learning from Large Language Model Rollouts Jing-Cheng Pang Si-Hang Yang Kaiyuan Li Jiaji Zhang Xiong-Hui Chen Nan Tang Yang Yu OffRL KELM LLMAG 31 4 0 14 Apr 2024
SportsMetrics: Blending Text and Numerical Data to Understand Information Fusion in LLMs Yebowen Hu Kaiqiang Song Sangwoo Cho Xiaoyang Wang H. Foroosh Dong Yu Fei Liu 8 8 0 15 Feb 2024
V-STaR: Training Verifiers for Self-Taught Reasoners Arian Hosseini Xingdi Yuan Nikolay Malkin Aaron C. Courville Alessandro Sordoni Rishabh Agarwal ReLM LRM 27 24 0 09 Feb 2024
Fight Back Against Jailbreaking via Prompt Adversarial Tuning Yichuan Mo Yuji Wang Zeming Wei Yisen Wang AAML SILM 44 11 0 09 Feb 2024
Large Language Models for Mathematical Reasoning: Progresses and Challenges Janice Ahn Rishu Verma Renze Lou Di Liu Rui Zhang Wenpeng Yin LRM 25 63 0 31 Jan 2024
SwarmBrain: Embodied agent for real-time strategy game StarCraft II via large language models Xiao Shao Weifu Jiang Fei Zuo Mengqing Liu LLMAG 15 6 0 31 Jan 2024
From Google Gemini to OpenAI Q* (Q-Star): A Survey of Reshaping the Generative Artificial Intelligence (AI) Research Landscape Timothy R. McIntosh Teo Susnjak Tong Liu Paul Watters Malka N. Halgamuge 79 46 0 18 Dec 2023
Safe-CLIP: Removing NSFW Concepts from Vision-and-Language Models Samuele Poppi Tobia Poppi Federico Cocchi Marcella Cornia Lorenzo Baraldi Rita Cucchiara VLM 11 8 0 27 Nov 2023
Predicting Text Preference Via Structured Comparative Reasoning Jing Nathan Yan Tianqi Liu Justin T Chiu Jiaming Shen Zhen Qin ... Charumathi Lakshmanan Y. Kurzion Alexander M. Rush Jialu Liu Michael Bendersky LRM 25 7 0 14 Nov 2023
Learning From Mistakes Makes LLM Better Reasoner Shengnan An Zexiong Ma Zeqi Lin Nanning Zheng Jian-Guang Lou Weizhu Chen LRM 16 73 0 31 Oct 2023
Large Language Models are Zero-Shot Reasoners Takeshi Kojima S. Gu Machel Reid Yutaka Matsuo Yusuke Iwasawa ReLM LRM 291 2,712 0 24 May 2022
Self-Consistency Improves Chain of Thought Reasoning in Language Models Xuezhi Wang Jason W. Wei Dale Schuurmans Quoc Le Ed H. Chi Sharan Narang Aakanksha Chowdhery Denny Zhou ReLM BDL LRM AI4CE 297 3,163 0 21 Mar 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 315 8,261 0 28 Jan 2022
Classical Structured Prediction Losses for Sequence to Sequence Learning Sergey Edunov Myle Ott Michael Auli David Grangier MarcÁurelio Ranzato AIMat 40 185 0 14 Nov 2017