Title
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models Zhihong Shao Peiyi Wang Qihao Zhu Runxin Xu Jun-Mei Song ... Haowei Zhang Mingchuan Zhang Y. K. Li Yu-Huan Wu Daya Guo ReLM LRM 26 620 0 05 Feb 2024
Understanding Reasoning Ability of Language Models From the Perspective of Reasoning Paths Aggregation Xinyi Wang Alfonso Amayuelas Kexun Zhang Liangming Pan Wenhu Chen W. Wang LRM 32 11 0 05 Feb 2024
Diversity Measurement and Subset Selection for Instruction Tuning Datasets Peiqi Wang Yikang Shen Zhen Guo Matt Stallone Yoon Kim Polina Golland Rameswar Panda 15 8 0 04 Feb 2024
Are Large Language Models Good Prompt Optimizers? Ruotian Ma Xiaolei Wang Xin Zhou Jian Li Nan Du Tao Gui Qi Zhang Xuanjing Huang LLMAG LRM 28 27 0 03 Feb 2024
Fractal Patterns May Illuminate the Success of Next-Token Prediction Ibrahim M. Alabdulmohsin Vinh Q. Tran Mostafa Dehghani 21 2 0 02 Feb 2024
When Benchmarks are Targets: Revealing the Sensitivity of Large Language Model Leaderboards Norah A. Alzahrani H. A. Alyahya Sultan Yazeed Alnumay Muhtasim Tahmid Shaykhah Alsubaie ... Saleh Soltan Nathan Scales Marie-Anne Lachaux Samuel R. Bowman Haidar Khan ELM 15 69 0 01 Feb 2024
LLMs learn governing principles of dynamical systems, revealing an in-context neural scaling law Toni J. B. Liu Nicolas Boullé Raphael Sarfati Christopher Earls AI4TS 25 11 0 01 Feb 2024
Conditional and Modal Reasoning in Large Language Models Wesley H. Holliday M. Mandelkern Cedegao E. Zhang LRM 21 5 0 30 Jan 2024
ReGAL: Refactoring Programs to Discover Generalizable Abstractions Elias Stengel-Eskin Archiki Prasad Mohit Bansal 18 13 0 29 Jan 2024
Learning to Trust Your Feelings: Leveraging Self-awareness in LLMs for Hallucination Mitigation Yuxin Liang Zhuoyang Song Hao Wang Jiaxing Zhang HILM 31 28 0 27 Jan 2024
Query of CC: Unearthing Large Scale Domain-Specific Knowledge from Public Corpora Zhaoye Fei Yunfan Shao Linyang Li Zhiyuan Zeng Conghui He Hang Yan Dahua Lin Xipeng Qiu 20 7 0 26 Jan 2024
DeepSeek-Coder: When the Large Language Model Meets Programming -- The Rise of Code Intelligence Daya Guo Qihao Zhu Dejian Yang Zhenda Xie Kai Dong ... Yu-Huan Wu Y. K. Li Fuli Luo Yingfei Xiong W. Liang ELM 48 624 0 25 Jan 2024
Meta-Prompting: Enhancing Language Models with Task-Agnostic Scaffolding Mirac Suzgun Adam Tauman Kalai KELM LRM LLMAG ReLM 38 63 0 23 Jan 2024
In-context Learning with Retrieved Demonstrations for Language Models: A Survey an Luo Xin Xu Yue Liu Panupong Pasupat Mehran Kazemi RALM 24 54 0 21 Jan 2024
Training microrobots to swim by a large language model Zhuoqun Xu Lailai Zhu 28 3 0 21 Jan 2024
Orion-14B: Open-source Multilingual Large Language Models Du Chen Yi Huang Xiaopu Li Yongqiang Li Yongqiang Liu Haihui Pan Leichao Xu Dacheng Zhang Zhipeng Zhang Kun Han 16 4 0 20 Jan 2024
LangBridge: Multilingual Reasoning Without Multilingual Supervision Dongkeun Yoon Joel Jang Sungdong Kim Seungone Kim Sheikh Shafayat Minjoon Seo LRM 22 14 0 19 Jan 2024
Knowledge Fusion of Large Language Models Fanqi Wan Xinting Huang Deng Cai Xiaojun Quan Wei Bi Shuming Shi MoMe 22 61 0 19 Jan 2024
Code Prompting Elicits Conditional Reasoning Abilities in Text+Code LLMs Haritz Puerto Martin Tutek Somak Aditya Xiaodan Zhu Iryna Gurevych ReCod ReLM LRM 43 9 0 18 Jan 2024
Understanding User Experience in Large Language Model Interactions Jiayin Wang Weizhi Ma Peijie Sun Min Zhang Jian-yun Nie 22 31 0 16 Jan 2024
Self-Imagine: Effective Unimodal Reasoning with Multimodal Models using Self-Imagination Syeda Nahida Akter Aman Madaan Sangwu Lee Yiming Yang Eric Nyberg ReLM VLM LRM 31 2 0 16 Jan 2024
Small Language Model Can Self-correct Haixia Han Jiaqing Liang Jie Shi Qi He Yanghua Xiao LRM SyDa ReLM KELM 26 11 0 14 Jan 2024
Health-LLM: Large Language Models for Health Prediction via Wearable Sensor Data Y. Kim X. Xu Daniel J. McDuff C. Breazeal Hae Won Park AI4MH LM&MA 29 59 0 12 Jan 2024
Relying on the Unreliable: The Impact of Language Models' Reluctance to Express Uncertainty Kaitlyn Zhou Jena D. Hwang Xiang Ren Maarten Sap 15 54 0 12 Jan 2024
An Experimental Design Framework for Label-Efficient Supervised Finetuning of Large Language Models Gantavya Bhatt Yifang Chen Arnav M. Das Jifan Zhang Sang T. Truong ... Jeff Bilmes S. Du Kevin G. Jamieson Jordan T. Ash Robert D. Nowak 23 14 0 12 Jan 2024
DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models Damai Dai Chengqi Deng Chenggang Zhao R. X. Xu Huazuo Gao ... Panpan Huang Fuli Luo Chong Ruan Zhifang Sui W. Liang MoE 23 238 0 11 Jan 2024
Exploring the Reasoning Abilities of Multimodal Large Language Models (MLLMs): A Comprehensive Survey on Emerging Trends in Multimodal Reasoning Yiqi Wang Wentao Chen Xiaotian Han Xudong Lin Haiteng Zhao Yongfei Liu Bohan Zhai Jianbo Yuan Quanzeng You Hongxia Yang LRM 33 66 0 10 Jan 2024
How predictable is language model benchmark performance? David Owen ELM LRM 20 19 0 09 Jan 2024
Mixtral of Experts Albert Q. Jiang Alexandre Sablayrolles Antoine Roux A. Mensch Blanche Savary ... Théophile Gervet Thibaut Lavril Thomas Wang Timothée Lacroix William El Sayed MoE LLMAG 16 971 0 08 Jan 2024
AI and Generative AI for Research Discovery and Summarization Mark Glickman Yi Zhang 17 14 0 08 Jan 2024
DeepSeek LLM: Scaling Open-Source Language Models with Longtermism DeepSeek-AI Xiao Bi : Xiao Bi Deli Chen Guanting Chen ... Yao Zhao Shangyan Zhou Shunfeng Zhou Qihao Zhu Yuheng Zou LRM ALM 139 298 0 05 Jan 2024
TinyLlama: An Open-Source Small Language Model Peiyuan Zhang Guangtao Zeng Tianduo Wang Wei Lu ALM LRM 20 349 0 04 Jan 2024
A Comprehensive Study of Knowledge Editing for Large Language Models Ningyu Zhang Yunzhi Yao Bo Tian Peng Wang Shumin Deng ... Lei Liang Zhiqiang Zhang Xiao-Jun Zhu Jun Zhou Huajun Chen KELM 26 76 0 02 Jan 2024
State of What Art? A Call for Multi-Prompt LLM Evaluation Moran Mizrahi Guy Kaplan Daniel Malkin Rotem Dror Dafna Shahaf Gabriel Stanovsky ELM 13 123 0 31 Dec 2023
Improving In-context Learning via Bidirectional Alignment Chengwei Qin Wenhan Xia Fangkai Jiao Chen Chen Yuchen Hu Bosheng Ding Shafiq R. Joty 35 7 0 28 Dec 2023
NPHardEval: Dynamic Benchmark on Reasoning Ability of Large Language Models via Complexity Classes Lizhou Fan Wenyue Hua Lingyao Li Haoyang Ling Yongfeng Zhang LRM 23 46 0 22 Dec 2023
YAYI 2: Multilingual Open-Source Large Language Models Yin Luo Qingchao Kong Nan Xu Jia Cao Bao Hao ... Zhaoxin Yu Zhengda Luo Wenji Mao Lei Wang Dajun Zeng ALM OSLM 32 6 0 22 Dec 2023
GeomVerse: A Systematic Evaluation of Large Models for Geometric Reasoning Mehran Kazemi Hamidreza Alvari Ankit Anand Jialin Wu Xi Chen Radu Soricut LRM ReLM 12 53 0 19 Dec 2023
An In-depth Look at Gemini's Language Abilities Syeda Nahida Akter Zichun Yu Aashiq Muhamed Tianyue Ou Alex Bäuerle Ángel Alexander Cabrera Krish Dholakia Chenyan Xiong Graham Neubig LRM ELM 17 34 0 18 Dec 2023
The Good, The Bad, and Why: Unveiling Emotions in Generative AI Cheng-rong Li Jindong Wang Yixuan Zhang Kaijie Zhu Xinyi Wang Wenxin Hou Jianxun Lian Fang Luo Qiang Yang Xing Xie LLMAG 16 14 0 18 Dec 2023
A Survey of Reasoning with Foundation Models Jiankai Sun Chuanyang Zheng E. Xie Zhengying Liu Ruihang Chu ... Xipeng Qiu Yi-Chen Guo Hui Xiong Qun Liu Zhenguo Li ReLM LRM AI4CE 22 74 0 17 Dec 2023
Modeling Complex Mathematical Reasoning via Large Language Model based MathAgent Haoran Liao Qinyi Du Shaohua Hu Hao He Yanyan Xu Jidong Tian Yaohui Jin LRM AI4CE 27 1 0 14 Dec 2023
VILA: On Pre-training for Visual Language Models Ji Lin Hongxu Yin Wei Ping Yao Lu Pavlo Molchanov Andrew Tao Huizi Mao Jan Kautz M. Shoeybi Song Han MLLM VLM 15 344 0 12 Dec 2023
Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models Avi Singh John D. Co-Reyes Rishabh Agarwal Ankesh Anand Piyush Patil ... Yamini Bansal Ethan Dyer Behnam Neyshabur Jascha Narain Sohl-Dickstein Noah Fiedel ALM LRM ReLM SyDa 147 143 0 11 Dec 2023
Large Scale Foundation Models for Intelligent Manufacturing Applications: A Survey Haotian Zhang S. D. Semujju Zhicheng Wang Xianwei Lv Kang Xu ... Jing Wu Zhuo Long Wensheng Liang Xiaoguang Ma Ruiyan Zhuang UQCV AI4TS AI4CE 27 4 0 11 Dec 2023
Latent Skill Discovery for Chain-of-Thought Reasoning Zifan Xu Haozhu Wang Dmitriy Bespalov Peter Stone Yanjun Qi ReLM LRM 46 2 0 07 Dec 2023
Chain of Code: Reasoning with a Language Model-Augmented Code Emulator Chengshu Li Jacky Liang Andy Zeng Xinyun Chen Karol Hausman Dorsa Sadigh Sergey Levine Fei-Fei Li Fei Xia Brian Ichter LLMAG LRM 31 70 0 07 Dec 2023
Prompt Optimization via Adversarial In-Context Learning Do Xuan Long Yiran Zhao Hannah Brown Yuxi Xie James Xu Zhao Nancy F. Chen Kenji Kawaguchi Michael Qizhe Xie Junxian He 32 11 0 05 Dec 2023
MUFFIN: Curating Multi-Faceted Instructions for Improving Instruction-Following Renze Lou Kai Zhang Jian Xie Yuxuan Sun Janice Ahn Hanzi Xu Yu Su Wenpeng Yin 29 26 0 05 Dec 2023
Recursive Visual Programming Jiaxin Ge Sanjay Subramanian Baifeng Shi Roei Herzig Trevor Darrell 27 4 0 04 Dec 2023