Position: Multimodal Large Language Models Can Significantly Advance Scientific Reasoning

5 February 2025

Papers citing "Position: Multimodal Large Language Models Can Significantly Advance Scientific Reasoning"

50 / 168 papers shown

Parameter Importance-Driven Continual Learning for Foundation Models

483

19 Nov 2025

Beyond Seeing: Evaluating Multimodal LLMs on Tool-Enabled Image Perception, Transformation, and Reasoning

Ernesto Gabriel Hernández Montoya

...

325

14 Oct 2025

DocPruner: A Storage-Efficient Framework for Multi-Vector Visual Document Retrieval via Adaptive Patch-Level Embedding Pruning

190

28 Sep 2025

AIssistant: An Agentic Approach for Human--AI Collaborative Scientific Work on Reviews and Perspectives in Machine Learning

109

14 Sep 2025

Implicit Reasoning in Large Language Models: A Comprehensive Survey

218

02 Sep 2025

Robust Diagram Reasoning: A Framework for Enhancing LVLM Performance on Visually Perturbed Scientific Diagrams

102

23 Aug 2025

GM-PRM: A Generative Multimodal Process Reward Model for Multimodal Mathematical Reasoning

274

06 Aug 2025

DrVD-Bench: Do Vision-Language Models Reason Like Human Doctors in Medical Image Diagnosis?

212

30 May 2025

Unveiling Instruction-Specific Neurons & Experts: An Analytical Framework for LLM's Instruction-Following Capabilities

...

212

27 May 2025

NeSyGeo: A Neuro-Symbolic Framework for Multimodal Geometric Reasoning Data Generation

288

21 May 2025

PhysicsArena: The First Multimodal Physics Reasoning Benchmark Exploring Variable, Process, and Solution Dimensions

...

286

21 May 2025

Pierce the Mists, Greet the Sky: Decipher Knowledge Overshadowing via Knowledge Circuit Analysis

582

20 May 2025

CAFES: A Collaborative Multi-Agent Framework for Multi-Granular Multimodal Essay Scoring

327

20 May 2025

Reimagining Urban Science: Scaling Causal Inference with Large Language Models

...

953

15 Apr 2025

DeepSound-V1: Start to Think Step-by-Step in the Audio Generation from Videos

373

28 Mar 2025

MathAgent: Leveraging a Mixture-of-Math-Agent Framework for Real-World Multimodal Mathematical Error Detection

713

23 Mar 2025

Rolling Forward: Enhancing LightGCN with Causal Graph Convolution for Credit Bond RecommendationInternational Conference on AI in Finance (ICAF), 2024

Ashraf Ghiye

Baptiste Barreau

Laurent Carlier

Michalis Vazirgiannis

260

18 Mar 2025

EscapeCraft: A 3D Room Escape Environment for Benchmarking Complex Multimodal Reasoning Ability

626

13 Mar 2025

Corrections Meet Explanations: A Unified Framework for Explainable Grammatical Error Correction

270

24 Feb 2025

SafeEraser: Enhancing Safety in Multimodal Large Language Models through Multimodal Machine UnlearningAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

538

18 Feb 2025

Large Physics Models: Towards a collaborative approach with Large Language Models and Foundation Models

Kristian González Barman

...

212

10 Jan 2025

Can MLLMs Reason in Multimodality? EMMA: An Enhanced MultiModal ReAsoning Benchmark

350

10 Jan 2025

Large language models for artificial general intelligence (AGI): A survey of foundational principles and approaches

A. Mumuni

F. Mumuni

AI4CE LRM ELM

237

06 Jan 2025

PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

655

06 Jan 2025

ChemDFM-X: Towards Large Multimodal Model for ChemistryScience China Information Sciences (Sci. China Inf. Sci.), 2024

...

496

03 Jan 2025

Survey of Large Multimodal Model Datasets, Application Categories and Taxonomy

Priyaranjan Pattnayak

Hitesh Laxmichand Patel

170

23 Dec 2024

Ask-Before-Detection: Identifying and Mitigating Conformity Bias in LLM-Powered Error Detector for Math Word Problem SolutionsAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

279

22 Dec 2024

Towards Scientific Discovery with Generative AI: Progress, Opportunities, and ChallengesAAAI Conference on Artificial Intelligence (AAAI), 2024

Chandan K. Reddy

Parshin Shojaee

327

16 Dec 2024

ProcessBench: Identifying Process Errors in Mathematical ReasoningAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

664

159

09 Dec 2024

Explainable and Interpretable Multimodal Large Language Models: A Comprehensive Survey

...

426

03 Dec 2024

Improving Physics Reasoning in Large Language Models Using Mixture of Refinement Agents

Abhishek Dharmadhikari

Atharva Marathe

R. Shah

LRM AI4CE

289

01 Dec 2024

Multimodal Alignment and Fusion: A Survey

Songtao Li

Hao Tang

OffRL

227

26 Nov 2024

MolMetaLM: a Physicochemical Knowledge-Guided Molecular Meta Language Model

362

23 Nov 2024

Evaluating the Robustness of Analogical Reasoning in Large Language Models

Martha Lewis

Melanie Mitchell

ELM

237

21 Nov 2024

Exploring Response Uncertainty in MLLMs: An Empirical Evaluation under Misleading Scenarios

...

351

05 Nov 2024

Improving Scientific Hypothesis Generation with Knowledge Grounded Large Language Models

Guangzhi Xiong

Eric Xie

Amir Hassan Shariatmadari

202

04 Nov 2024

MOOSE-Chem: Large Language Models for Rediscovering Unseen Chemistry Scientific HypothesesInternational Conference on Learning Representations (ICLR), 2024

565

09 Oct 2024

Mitigating Modality Prior-Induced Hallucinations in Multimodal Large Language Models via Deciphering Attention CausalityInternational Conference on Learning Representations (ICLR), 2024

Guanyu Zhou

Yibo Yan

Xin Zou

Kun Wang

Aiwei Liu

Xuming Hu

230

07 Oct 2024

GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language ModelsInternational Conference on Learning Representations (ICLR), 2024

496

415

07 Oct 2024

Look Twice Before You Answer: Memory-Space Visual Retracing for Hallucination Mitigation in Multimodal Large Language Models

...

461

04 Oct 2024

LLaMA-Berry: Pairwise Optimization for O1-like Olympiad-Level Mathematical Reasoning

...

Marco Pavone

Yuqiang Li

Wanli Ouyang

Dongzhan Zhou

LRM

260

03 Oct 2024

A Survey on Multimodal Benchmarks: In the Era of Large AI Models

Lin Li

Guikun Chen

Hanrong Shi

Jun Xiao

Long Chen

346

21 Sep 2024

Qwen2.5-Coder Technical Report

Binyuan Hui

Jian Yang

Zeyu Cui

Jiaxi Yang

Dayiheng Liu

...

Fei Huang

Xingzhang Ren

Xuancheng Ren

Jingren Zhou

Junyang Lin

OSLM

335

828

18 Sep 2024

Qwen2.5-Math Technical Report: Toward Mathematical Expert Model via Self-Improvement

Bowen Yu

...

Mingfeng Xue

Runji Lin

Tianyu Liu

Xingzhang Ren

Zhenru Zhang

OSLM LRM

463

689

18 Sep 2024

AI-Driven Virtual Teacher for Enhanced Educational Efficiency: Leveraging Large Pretrain Models for Autonomous Error Analysis and CorrectionAAAI Conference on Artificial Intelligence (AAAI), 2024

Tianlong Xu

Yi-Fan Zhang

Zhendong Chu

Shen Wang

Qingsong Wen

170

14 Sep 2024

Language agents achieve superhuman synthesis of scientific knowledge

Michael D. Skarlinski

443

10 Sep 2024

MathGLM-Vision: Solving Mathematical Problems with Multi-Modal Large Language Model

Zhen Yang

Jinhao Chen

Bin Xu

Yuxiao Dong

Jie Tang

VLM LRM

189

10 Sep 2024

An Investigation of Warning Erroneous Chat Translations in Cross-lingual CommunicationInternational Joint Conference on Natural Language Processing (IJCNLP), 2024

Yunmeng Li

Jun Suzuki

Makoto Morishita

Kaori Abe

Kentaro Inui

259

28 Aug 2024

GeoReasoner: Reasoning On Geospatially Grounded Context For Natural Language UnderstandingInternational Conference on Information and Knowledge Management (CIKM), 2024

Yibo Yan

Joey Lee

LRM

263

21 Aug 2024

BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction

Zuchao Li

Yang Yang

Hai Zhao

250

19 Aug 2024