MAmmoTH: Building Math Generalist Models through Hybrid Instruction Tuning

11 September 2023

Ge Zhang

Papers citing "MAmmoTH: Building Math Generalist Models through Hybrid Instruction Tuning"

50 / 305 papers shown

Title
MathVerse: Does Your Multi-modal LLM Truly See the Diagrams in Visual Math Problems? Renrui Zhang Dongzhi Jiang Yichi Zhang Haokun Lin Ziyu Guo ... Aojun Zhou Pan Lu Kai-Wei Chang Peng Gao Hongsheng Li 24 165 0 21 Mar 2024
Easy-to-Hard Generalization: Scalable Alignment Beyond Human Supervision Zhiqing Sun Longhui Yu Yikang Shen Weiyang Liu Yiming Yang Sean Welleck Chuang Gan 23 50 0 14 Mar 2024
SMART: Submodular Data Mixture Strategy for Instruction Tuning Kowndinya Renduchintala S. Bhatia Ganesh Ramakrishnan 22 3 0 13 Mar 2024
Mastering Text, Code and Math Simultaneously via Fusing Highly Specialized Language Models Ning Ding Yulin Chen Ganqu Cui Xingtai Lv Weilin Zhao Ruobing Xie Bowen Zhou Zhiyuan Liu Maosong Sun ALM MoMe AI4CE 33 7 0 13 Mar 2024
SmallToLarge (S2L): Scalable Data Selection for Fine-tuning Large Language Models by Summarizing Training Trajectories of Small Models Yu Yang Siddhartha Mishra Jeffrey N Chiang Baharan Mirzasoleiman 32 17 0 12 Mar 2024
Common 7B Language Models Already Possess Strong Math Capabilities Chen Li Weiqi Wang Jingcheng Hu Yixuan Wei Nanning Zheng Han Hu Zheng-Wei Zhang Houwen Peng ALM LRM 40 74 0 07 Mar 2024
Apollo: A Lightweight Multilingual Medical LLM towards Democratizing Medical AI to 6B People Xidong Wang Nuo Chen Junying Chen Yan Hu Yidong Wang Xiangbo Wu Anningzhe Gao Xiang Wan Haizhou Li Benyou Wang LM&MA 22 25 0 06 Mar 2024
MathScale: Scaling Instruction Tuning for Mathematical Reasoning Zhengyang Tang Xingxing Zhang Benyou Wang Furu Wei ALM LRM 24 26 0 05 Mar 2024
DPPA: Pruning Method for Large Language Model to Model Merging Yaochen Zhu Rui Xia Jiajun Zhang MoMe 25 4 0 05 Mar 2024
Key-Point-Driven Data Synthesis with its Enhancement on Mathematical Reasoning Yiming Huang Xiao Liu Yeyun Gong Zhibin Gou Yelong Shen Nan Duan Weizhu Chen AIMat LRM 50 35 0 04 Mar 2024
Birbal: An efficient 7B instruct-model fine-tuned with curated datasets Ashvini Jindal P. Rajpoot Ankur P. Parikh 22 6 0 04 Mar 2024
Masked Thought: Simply Masking Partial Reasoning Steps Can Improve Mathematical Reasoning Learning of Language Models Changyu Chen Xiting Wang Ting-En Lin Ang Lv Yuchuan Wu Xin Gao Ji-Rong Wen Rui Yan Yongbin Li ReLM LRM 21 8 0 04 Mar 2024
LAB: Large-Scale Alignment for ChatBots Shivchander Sudalairaj Abhishek Bhandwaldar Aldo Pareja Kai Xu David D. Cox Akash Srivastava OSLM 20 28 0 02 Mar 2024
GSM-Plus: A Comprehensive Benchmark for Evaluating the Robustness of LLMs as Mathematical Problem Solvers Qintong Li Leyang Cui Xueliang Zhao Lingpeng Kong Wei Bi LRM 35 35 0 29 Feb 2024
Tower: An Open Multilingual Large Language Model for Translation-Related Tasks Duarte M. Alves José P. Pombal Nuno M. Guerreiro Pedro H. Martins Joao Alves ... Patrick Fernandes Sweta Agrawal Pierre Colombo José G. C. de Souza André F.T. Martins LRM 31 128 0 27 Feb 2024
Are LLMs Capable of Data-based Statistical and Causal Reasoning? Benchmarking Advanced Quantitative Reasoning with Data Xiao Liu Zirui Wu Xueqing Wu Pan Lu Kai-Wei Chang Yansong Feng ELM LRM 24 25 0 27 Feb 2024
MathGenie: Generating Synthetic Data with Question Back-translation for Enhancing Mathematical Reasoning of LLMs Zimu Lu Aojun Zhou Houxing Ren Ke Wang Weikang Shi Junting Pan Mingjie Zhan Hongsheng Li SyDa LRM 45 42 0 26 Feb 2024
ChatMusician: Understanding and Generating Music Intrinsically with LLM Ti-Fen Pan Hanfeng Lin Yi Wang Zeyue Tian Shangda Wu ... Gus Xia Roger Dannenberg Wei Xue Shiyin Kang Yike Guo 99 34 0 25 Feb 2024
GraphWiz: An Instruction-Following Language Model for Graph Problems Nuo Chen Yuhan Li Jianheng Tang Jia Li 21 13 0 25 Feb 2024
How Do Humans Write Code? Large Models Do It the Same Way Too Long Li Xuzheng He LRM 27 0 0 24 Feb 2024
Brain-Inspired Two-Stage Approach: Enhancing Mathematical Reasoning by Imitating Human Thought Processes Yezeng Chen Zui Chen Yi Zhou LRM 18 2 0 23 Feb 2024
An Empirical Study of Data Ability Boundary in LLMs' Math Reasoning Zui Chen Yezeng Chen Jiaqi Han Zhijie Huang Ji Qi Yi Zhou LRM 27 6 0 23 Feb 2024
Unintended Impacts of LLM Alignment on Global Representation Michael Joseph Ryan William B. Held Diyi Yang 27 39 0 22 Feb 2024
Divide-or-Conquer? Which Part Should You Distill Your LLM? Zhuofeng Wu Richard He Bai Aonan Zhang Jiatao Gu V. Vydiswaran Navdeep Jaitly Yizhe Zhang LRM 19 6 0 22 Feb 2024
Not All Experts are Equal: Efficient Expert Pruning and Skipping for Mixture-of-Experts Large Language Models Xudong Lu Qi Liu Yuhui Xu Aojun Zhou Siyuan Huang Bo-Wen Zhang Junchi Yan Hongsheng Li MoE 19 25 0 22 Feb 2024
ConceptMath: A Bilingual Concept-wise Benchmark for Measuring Mathematical Reasoning of Large Language Models Yanan Wu Jie Liu Xingyuan Bu Jiaheng Liu Zhanhui Zhou ... Haibin Chen Tiezheng Ge Wanli Ouyang Wenbo Su Bo Zheng LRM 27 6 0 22 Feb 2024
Hint-before-Solving Prompting: Guiding LLMs to Effectively Utilize Encoded Knowledge Jinlan Fu Shenzhen Huangfu Hang Yan See-Kiong Ng Xipeng Qiu LRM 33 7 0 22 Feb 2024
CMDAG: A Chinese Metaphor Dataset with Annotated Grounds as CoT for Boosting Metaphor Generation Yujie Shao Xinrong Yao Xingwei Qu Chenghua Lin Shi Wang Stephen W. Huang Ge Zhang Jie Fu 19 5 0 20 Feb 2024
A Survey on Knowledge Distillation of Large Language Models Xiaohan Xu Ming Li Chongyang Tao Tao Shen Reynold Cheng Jinyang Li Can Xu Dacheng Tao Tianyi Zhou KELM VLM 34 94 0 20 Feb 2024
Large Language Model-based Human-Agent Collaboration for Complex Task Solving Xueyang Feng Zhiyuan Chen Yujia Qin Yankai Lin Xu Chen Zhiyuan Liu Ji-Rong Wen LLMAG 38 16 0 20 Feb 2024
SciAgent: Tool-augmented Language Models for Scientific Reasoning Yubo Ma Zhibin Gou Junheng Hao Ruochen Xu Shuohang Wang ... Yujiu Yang Yixin Cao Aixin Sun Hany Awadalla Weizhu Chen RALM LRM LLMAG 38 1 0 18 Feb 2024
MoRAL: MoE Augmented LoRA for LLMs' Lifelong Learning Shu Yang Muhammad Asif Ali Cheng-Long Wang Lijie Hu Di Wang CLL MoE 32 36 0 17 Feb 2024
Evaluating LLMs' Mathematical Reasoning in Financial Document Question Answering Pragya Srivastava Manuj Malik Vivek Gupta T. Ganu Dan Roth 8 14 0 17 Feb 2024
Orca-Math: Unlocking the potential of SLMs in Grade School Math Arindam Mitra Hamed Khanpour Corby Rosset Ahmed Hassan Awadallah ALM MoE LRM 28 62 0 16 Feb 2024
Language Models as Science Tutors Alexis Chevalier Jiayi Geng Alexander Wettig Howard Chen Sebastian Mizera ... Jiatong Yu Jun-Jie Zhu Z. Ren Sanjeev Arora Danqi Chen ELM 17 11 0 16 Feb 2024
OpenMathInstruct-1: A 1.8 Million Math Instruction Tuning Dataset Shubham Toshniwal Ivan Moshkov Sean Narenthiran Daria Gitman Fei Jia Igor Gitman 23 75 0 15 Feb 2024
LlaSMol: Advancing Large Language Models for Chemistry with a Large-Scale, Comprehensive, High-Quality Instruction Tuning Dataset Botao Yu Frazier N. Baker Ziqi Chen Xia Ning Huan Sun LM&MA 39 15 0 14 Feb 2024
DolphCoder: Echo-Locating Code Large Language Models with Diverse and Multi-Objective Instruction Tuning Yejie Wang Keqing He Guanting Dong Pei Wang Weihao Zeng ... Yutao Mou Mengdi Zhang Jingang Wang Xunliang Cai Weiran Xu ALM 21 8 0 14 Feb 2024
eCeLLM: Generalizing Large Language Models for E-commerce from Large-scale, High-quality Instruction Data B. Peng Xinyi Ling Ziru Chen Huan Sun Xia Ning ELM 11 16 0 13 Feb 2024
OpenFedLLM: Training Large Language Models on Decentralized Private Data via Federated Learning Rui Ye Wenhao Wang Jingyi Chai Dihan Li Zexi Li Yinda Xu Yaxin Du Yanfeng Wang Siheng Chen ALM FedML AIFin 4 76 0 10 Feb 2024
InternLM-Math: Open Math Large Language Models Toward Verifiable Reasoning Huaiyuan Ying Shuo Zhang Linyang Li Zhejian Zhou Yunfan Shao ... Hang Yan Xipeng Qiu Jiayu Wang Kai-xiang Chen Dahua Lin ReLM LRM 17 68 0 09 Feb 2024
Training Large Language Models for Reasoning through Reverse Curriculum Reinforcement Learning Zhiheng Xi Wenxiang Chen Boyang Hong Senjie Jin Rui Zheng ... Xinbo Zhang Peng Sun Tao Gui Qi Zhang Xuanjing Huang LRM 27 20 0 08 Feb 2024
SPHINX-X: Scaling Data and Parameters for a Family of Multi-modal Large Language Models Chris Liu Renrui Zhang Longtian Qiu Siyuan Huang Weifeng Lin ... Hao Shao Pan Lu Hongsheng Li Yu Qiao Peng Gao MLLM 118 106 0 08 Feb 2024
SceMQA: A Scientific College Entrance Level Multimodal Question Answering Benchmark Zhenwen Liang Kehan Guo Gang Liu Taicheng Guo Yujun Zhou Tianyu Yang Jiajun Jiao Renjie Pi Jipeng Zhang Xiangliang Zhang ELM 23 5 0 06 Feb 2024
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models Zhihong Shao Peiyi Wang Qihao Zhu Runxin Xu Jun-Mei Song ... Haowei Zhang Mingchuan Zhang Y. K. Li Yu-Huan Wu Daya Guo ReLM LRM 26 620 0 05 Feb 2024
Learning from Teaching Regularization: Generalizable Correlations Should be Easy to Imitate Can Jin Tong Che Hongwu Peng Yiyuan Li Dimitris N. Metaxas Marco Pavone 42 26 0 05 Feb 2024
Learning Planning-based Reasoning by Trajectories Collection and Process Reward Synthesizing Fangkai Jiao Chengwei Qin Zhengyuan Liu Nancy F. Chen Shafiq R. Joty LRM 16 26 0 01 Feb 2024
Large Language Models for Mathematical Reasoning: Progresses and Challenges Janice Ahn Rishu Verma Renze Lou Di Liu Rui Zhang Wenpeng Yin LRM 30 113 0 31 Jan 2024
YODA: Teacher-Student Progressive Learning for Language Models Jianqiao Lu Wanjun Zhong Yufei Wang Zhijiang Guo Qi Zhu ... Baojun Wang Yasheng Wang Lifeng Shang Xin Jiang Qun Liu LRM 14 6 0 28 Jan 2024
TAT-LLM: A Specialized Language Model for Discrete Reasoning over Tabular and Textual Data Fengbin Zhu Ziyang Liu Fuli Feng Chao Wang Moxin Li Tat-Seng Chua LMTD LRM 14 13 0 24 Jan 2024