MAmmoTH: Building Math Generalist Models through Hybrid Instruction Tuning

11 September 2023

Ge Zhang

Papers citing "MAmmoTH: Building Math Generalist Models through Hybrid Instruction Tuning"

50 / 305 papers shown

Title
Distilling Mathematical Reasoning Capabilities into Small Language Models Xunyu Zhu Jian Li Yong Liu Can Ma Weiping Wang LRM 29 2 0 22 Jan 2024
Augmenting Math Word Problems via Iterative Question Composing Haoxiong Liu Yifan Zhang Yifan Luo Andrew Chi-Chih Yao SyDa LRM 22 34 0 17 Jan 2024
ReFT: Reasoning with Reinforced Fine-Tuning Trung Quoc Luong Xinbo Zhang Zhanming Jie Peng Sun Xiaoran Jin Hang Li OffRL LRM ReLM 32 79 0 17 Jan 2024
MARIO: MAth Reasoning with code Interpreter Output -- A Reproducible Pipeline Minpeng Liao Wei Luo Chengxi Li Jing Wu Kai Fan LRM 32 37 0 16 Jan 2024
Question Translation Training for Better Multilingual Reasoning Wenhao Zhu Shujian Huang Fei Yuan Shuaijie She Jiajun Chen Alexandra Birch LRM 16 27 0 15 Jan 2024
xCoT: Cross-lingual Instruction Tuning for Cross-lingual Chain-of-Thought Reasoning Linzheng Chai Jian Yang Tao Sun Hongcheng Guo Jiaheng Liu ... Xiannian Liang Jiaqi Bai Tongliang Li Qiyao Peng Zhoujun Li LRM 29 48 0 13 Jan 2024
MAPO: Advancing Multilingual Reasoning through Multilingual Alignment-as-Preference Optimization Shuaijie She Wei Zou Shujian Huang Wenhao Zhu Xiang Liu Xiang Geng Jiajun Chen LRM 49 13 0 12 Jan 2024
Kun: Answer Polishment for Chinese Self-Alignment with Instruction Back-Translation Tianyu Zheng Shuyue Guo Xingwei Qu Jiawei Guo Weixu Zhang ... Chenghua Lin Wenhao Huang Wenhu Chen Jie Fu Ge Zhang ALM 23 4 0 12 Jan 2024
Improving Large Language Models via Fine-grained Reinforcement Learning with Minimum Editing Constraint Zhipeng Chen Kun Zhou Wayne Xin Zhao Junchen Wan Fuzheng Zhang Di Zhang Ji-Rong Wen KELM 31 32 0 11 Jan 2024
Self-Contrast: Better Reflection Through Inconsistent Solving Perspectives Wenqi Zhang Yongliang Shen Linjuan Wu Qiuying Peng Jun Wang Y. Zhuang Weiming Lu LRM LLMAG 22 37 0 04 Jan 2024
MR-GSM8K: A Meta-Reasoning Benchmark for Large Language Model Evaluation Zhongshen Zeng Pengguang Chen Shu Liu Haiyun Jiang Jiaya Jia ReLM ELM LRM 22 18 0 28 Dec 2023
G-LLaVA: Solving Geometric Problem with Multi-Modal Large Language Model Jiahui Gao Renjie Pi Jipeng Zhang Jiacheng Ye Wanjun Zhong ... Lanqing Hong Jianhua Han Hang Xu Zhenguo Li Lingpeng Kong SyDa ReLM LRM 44 84 0 18 Dec 2023
Demystifying Instruction Mixing for Fine-tuning Large Language Models Renxi Wang Haonan Li Minghao Wu Yuxia Wang Xudong Han Chiyu Zhang Timothy Baldwin 17 0 0 17 Dec 2023
A Survey of Reasoning with Foundation Models Jiankai Sun Chuanyang Zheng E. Xie Zhengying Liu Ruihang Chu ... Xipeng Qiu Yi-Chen Guo Hui Xiong Qun Liu Zhenguo Li ReLM LRM AI4CE 19 74 0 17 Dec 2023
Mixed Distillation Helps Smaller Language Model Better Reasoning Chenglin Li Qianglong Chen Liangyue Li Wang Caiyu Yicheng Li Zhang Yin Yin Zhang LRM 21 11 0 17 Dec 2023
TinyGSM: achieving >80% on GSM8k with small language models Bingbin Liu Sébastien Bubeck Ronen Eldan Janardhan Kulkarni Yuanzhi Li Anh Nguyen Rachel A. Ward Yi Zhang ALM 19 47 0 14 Dec 2023
Math-Shepherd: Verify and Reinforce LLMs Step-by-step without Human Annotations Peiyi Wang Lei Li Zhihong Shao R. X. Xu Damai Dai Yifei Li Deli Chen Y.Wu Zhifang Sui AIMat LRM ALM 25 91 0 14 Dec 2023
Modeling Complex Mathematical Reasoning via Large Language Model based MathAgent Haoran Liao Qinyi Du Shaohua Hu Hao He Yanyan Xu Jidong Tian Yaohui Jin LRM AI4CE 19 1 0 14 Dec 2023
Visual Program Distillation: Distilling Tools and Programmatic Reasoning into Vision-Language Models Yushi Hu Otilia Stretcu Chun-Ta Lu Krishnamurthy Viswanathan Kenji Hata Enming Luo Ranjay Krishna Ariel Fuxman VLM LRM MLLM 27 26 0 05 Dec 2023
The Unlocking Spell on Base LLMs: Rethinking Alignment via In-Context Learning Bill Yuchen Lin Abhilasha Ravichander Ximing Lu Nouha Dziri Melanie Sclar Khyathi Raghavi Chandu Chandra Bhagavatula Yejin Choi 17 163 0 04 Dec 2023
LLM-Assisted Code Cleaning For Training Accurate Code Generators Naman Jain Tianjun Zhang Wei-Lin Chiang Joseph E. Gonzalez Koushik Sen Ion Stoica 28 20 0 25 Nov 2023
Igniting Language Intelligence: The Hitchhiker's Guide From Chain-of-Thought Reasoning to Language Agents Zhuosheng Zhang Yao Yao Aston Zhang Xiangru Tang Xinbei Ma ... Yiming Wang Mark B. Gerstein Rui Wang Gongshen Liu Hai Zhao LLMAG LM&Ro LRM 23 51 0 20 Nov 2023
Symbol-LLM: Towards Foundational Symbol-centric Interface For Large Language Models Fangzhi Xu Zhiyong Wu Qiushi Sun Siyu Ren Fei Yuan Shuai Yuan Qika Lin Yu Qiao Jun Liu LLMAG 8 32 0 15 Nov 2023
TableLlama: Towards Open Large Generalist Models for Tables Tianshu Zhang Xiang Yue Yifei Li Huan Sun LMTD ALM 4 79 0 15 Nov 2023
Towards A Unified View of Answer Calibration for Multi-Step Reasoning Shumin Deng Ningyu Zhang Nay Oo Bryan Hooi LRM 25 1 0 15 Nov 2023
When does In-context Learning Fall Short and Why? A Study on Specification-Heavy Tasks Hao Peng Xiaozhi Wang Jianhui Chen Weikai Li Y. Qi ... Zhili Wu Kaisheng Zeng Bin Xu Lei Hou Juanzi Li 16 27 0 15 Nov 2023
Just Ask One More Time! Self-Agreement Improves Reasoning of Language Models in (Almost) All Scenarios Lei Lin Jiayi Fu Pengli Liu Qingyang Li Yan Gong Junchen Wan Fuzheng Zhang Zhongyuan Wang Di Zhang Kun Gai LRM 14 7 0 14 Nov 2023
Language Models can be Logical Solvers Jiazhan Feng Ruochen Xu Junheng Hao Hiteshi Sharma Yelong Shen Dongyan Zhao Weizhu Chen ReLM LRM ELM 28 22 0 10 Nov 2023
SEGO: Sequential Subgoal Optimization for Mathematical Problem-Solving Xueliang Zhao Xinting Huang Wei Bi Lingpeng Kong LRM 39 0 0 19 Oct 2023
Llemma: An Open Language Model For Mathematics Zhangir Azerbayev Hailey Schoelkopf Keiran Paster Marco Dos Santos Stephen Marcus McAleer Albert Q. Jiang Jia Deng Stella Biderman Sean Welleck CLL 24 204 0 16 Oct 2023
Improving Large Language Model Fine-tuning for Solving Math Problems Yixin Liu Avi Singh C. D. Freeman John D. Co-Reyes Peter J. Liu LRM ReLM 35 45 0 16 Oct 2023
Exploration with Principles for Diverse AI Supervision Hao Liu Matei A. Zaharia Pieter Abbeel 36 2 0 13 Oct 2023
Guiding Language Model Math Reasoning with Planning Tokens Xinyi Wang Lucas Page-Caccia O. Ostapenko Xingdi Yuan William Yang Wang Alessandro Sordoni LRM 29 2 0 09 Oct 2023
MuggleMath: Assessing the Impact of Query and Response Augmentation on Math Reasoning Chengpeng Li Zheng Yuan Hongyi Yuan Guanting Dong Keming Lu Jiancan Wu Chuanqi Tan Xiang Wang Chang Zhou LRM 10 21 0 09 Oct 2023
How Abilities in Large Language Models are Affected by Supervised Fine-tuning Data Composition Guanting Dong Hongyi Yuan Keming Lu Chengpeng Li Mingfeng Xue Dayiheng Liu Wei Wang Zheng Yuan Chang Zhou Jingren Zhou LRM CLL 29 118 0 09 Oct 2023
MathCoder: Seamless Code Integration in LLMs for Enhanced Mathematical Reasoning Ke Wang Houxing Ren Aojun Zhou Zimu Lu Sichun Luo Weikang Shi Renrui Zhang Linqi Song Mingjie Zhan Hongsheng Li ReLM LRM SyDa 22 92 0 05 Oct 2023
Large Language Model Cascades with Mixture of Thoughts Representations for Cost-efficient Reasoning Murong Yue Jie Zhao Min Zhang Liang Du Ziyu Yao LRM 22 54 0 04 Oct 2023
ToRA: A Tool-Integrated Reasoning Agent for Mathematical Problem Solving Zhibin Gou Zhihong Shao Yeyun Gong Yelong Shen Yujiu Yang Minlie Huang Nan Duan Weizhu Chen LRM AI4CE LLMAG 36 140 0 29 Sep 2023
Qwen Technical Report Jinze Bai Shuai Bai Yunfei Chu Zeyu Cui Kai Dang ... Zhenru Zhang Chang Zhou Jingren Zhou Xiaohuan Zhou Tianhang Zhu OSLM 29 1,559 0 28 Sep 2023
ReConcile: Round-Table Conference Improves Reasoning via Consensus among Diverse LLMs Justin Chih-Yao Chen Swarnadeep Saha Mohit Bansal LLMAG LRM 27 111 0 22 Sep 2023
MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models L. Yu Weisen Jiang Han Shi Jincheng Yu Zhengying Liu Yu Zhang James T. Kwok Zheng Li Adrian Weller Weiyang Liu OSLM LRM 32 317 0 21 Sep 2023
MinT: Boosting Generalization in Mathematical Reasoning via Multi-View Fine-Tuning Zhenwen Liang Dian Yu Xiaoman Pan Wenlin Yao Qingkai Zeng Xiangliang Zhang Dong Yu ALM LRM 25 13 0 16 Jul 2023
Meta-Reasoning: Semantics-Symbol Deconstruction for Large Language Models Yiming Wang Zhuosheng Zhang Pei Zhang Baosong Yang Rui Wang ReLM LRM 21 6 0 30 Jun 2023
LMFlow: An Extensible Toolkit for Finetuning and Inference of Large Foundation Models Shizhe Diao Rui Pan Hanze Dong Kashun Shum Jipeng Zhang Wei Xiong Tong Zhang ALM 12 63 0 21 Jun 2023
The CoT Collection: Improving Zero-shot and Few-shot Learning of Language Models via Chain-of-Thought Fine-Tuning Seungone Kim Se June Joo Doyoung Kim Joel Jang Seonghyeon Ye Jamin Shin Minjoon Seo ALM RALM LRM 8 55 0 23 May 2023
Can ChatGPT Defend its Belief in Truth? Evaluating LLM Reasoning via Debate Boshi Wang Xiang Yue Huan Sun ELM LRM 8 58 0 22 May 2023
Doc2SoarGraph: Discrete Reasoning over Visually-Rich Table-Text Documents via Semantic-Oriented Hierarchical Graphs Fengbin Zhu Chao Wang Fuli Feng Zifeng Ren Moxin Li Tat-Seng Chua 32 3 0 03 May 2023
Instruction Tuning with GPT-4 Baolin Peng Chunyuan Li Pengcheng He Michel Galley Jianfeng Gao SyDa ALM LM&MA 154 576 0 06 Apr 2023
ReAct: Synergizing Reasoning and Acting in Language Models Shunyu Yao Jeffrey Zhao Dian Yu Nan Du Izhak Shafran Karthik Narasimhan Yuan Cao LLMAG ReLM LRM 208 2,413 0 06 Oct 2022
Compositional Semantic Parsing with Large Language Models Andrew Drozdov Nathanael Scharli Ekin Akyuurek Nathan Scales Xinying Song Xinyun Chen Olivier Bousquet Denny Zhou ReLM LRM 187 91 0 29 Sep 2022