Exploring the Design Space of 3D MLLMs for CT Report GenerationInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025

Mohammed Baharoon

Jun Ma

Congyu Fang

Augustin Toma

Bo Wang

234

26 Jun 2025

Chiron-o1: Igniting Multimodal Large Language Models towards Generalizable Medical Reasoning via Mentor-Intern Collaborative Search

393

20 Jun 2025

CAPO: Reinforcing Consistent Reasoning in Medical Decision-Making

...

252

15 Jun 2025

3D-RAD: A Comprehensive 3D Radiology Med-VQA Dataset with Multi-Temporal Analysis and Diverse Diagnostic Tasks

516

11 Jun 2025

HSENet: Hybrid Spatial Encoding Network for 3D Medical Vision-Language Understanding

289

11 Jun 2025

Foundation Models in Medical Imaging: A Review and Outlook

Vivien van Veldhuizen

...

547

10 Jun 2025

SurgVLM: A Large Vision-Language Model and Systematic Evaluation Benchmark for Surgical Intelligence

...

536

03 Jun 2025

DrVD-Bench: Do Vision-Language Models Reason Like Human Doctors in Medical Image Diagnosis?

289

30 May 2025

Interpreting Chest X-rays Like a Radiologist: A Benchmark with Clinical Reasoning

224

29 May 2025

Look & Mark: Leveraging Radiologist Eye Fixations and Bounding boxes in Multimodal Large Language Models for Chest X-ray Report GenerationAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

225

28 May 2025

Medical Large Vision Language Models with Multi-Image Visual AbilityInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025

277

25 May 2025

Are Vision Language Models Ready for Clinical Diagnosis? A 3D Medical Benchmark for Tumor-centric Visual Question Answering

Ibrahim Ethem Hamamci

Zongwei Zhou

Yaoyao Liu

ELM

322

25 May 2025

Improving Medical Reasoning with Curriculum-Aware Reinforcement Learning

236

25 May 2025

U2-BENCH: Benchmarking Large Vision-Language Models on Ultrasound Understanding

...

428

23 May 2025

Specialized Foundation Models for Intelligent Operating Rooms

295

19 May 2025

Patho-R1: A Multimodal Reinforcement Learning-Based Pathology Expert Reasoner

479

16 May 2025

Multi-Modal Explainable Medical AI Assistant for Trustworthy Human-AI Collaboration

290

11 May 2025

Structure Causal Models and LLMs Integration in Medical Visual Question AnsweringIEEE Transactions on Medical Imaging (IEEE TMI), 2025

382

05 May 2025

UniBiomed: A Universal Foundation Model for Grounded Biomedical Image Interpretation

...

Ronald Cheong Kin Chan

Yifan Peng

Pranav Rajpurkar

Hao Chen

LM&MA MedIm

756

30 Apr 2025

Localizing Before Answering: A Hallucination Evaluation Benchmark for Grounded Medical Multimodal LLMs

...

659

30 Apr 2025

Multimodal Large Language Models for Medicine: A Comprehensive Survey

Jiarui Ye

Hao Tang

LM&MA

645

29 Apr 2025

SilVar-Med: A Speech-Driven Visual Language Model for Explainable Abnormality Detection in Medical Imaging

413

14 Apr 2025

MedM-VL: What Makes a Good Medical LVLM?

545

06 Apr 2025

UMIT: Unifying Medical Imaging Tasks via Vision-Language Models

288

20 Mar 2025

Med-R1: Reinforcement Learning for Generalizable Medical Reasoning in Vision-Language Models

789

112

18 Mar 2025

Towards All-in-One Medical Image Re-IdentificationComputer Vision and Pattern Recognition (CVPR), 2025

422

11 Mar 2025

GEMA-Score: Granular Explainable Multi-Agent Scoring Framework for Radiology Report Evaluation

...

309

07 Mar 2025

Enhancing SAM with Efficient Prompting and Preference Optimization for Semi-supervised Medical Image SegmentationComputer Vision and Pattern Recognition (CVPR), 2025

424

06 Mar 2025

BioD2C: A Dual-level Semantic Consistency Constraint Framework for Biomedical VQAInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025

287

04 Mar 2025

MedHallTune: An Instruction-Tuning Benchmark for Mitigating Medical Hallucination in Vision-Language Models

321

28 Feb 2025

MedVLM-R1: Incentivizing Medical Reasoning Capability of Vision-Language Models (VLMs) via Reinforcement LearningInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025

628

155

26 Feb 2025

Vision Language Models in Medicine

Beria Chingnabe Kalpelbe

Angel Gabriel Adaambiik

Wei Peng

VLM LM&MA

446

24 Feb 2025

Reducing Hallucinations of Medical Multimodal Large Language Models with Visual Retrieval-Augmented Generation

208

20 Feb 2025

From large language models to multimodal AI: A scoping review on the potential of generative AI in medicineBiomedical Engineering Letters (Biomed Eng Lett), 2025

Soroosh Tayebi Arasteh

LM&MA

1.1K

13 Feb 2025

RadGPT: Constructing 3D Image-Text Tumor Datasets

530

08 Jan 2025

A Comprehensive Survey of Large Language Models and Multimodal Large Language Models in MedicineInformation Fusion (Inf. Fusion), 2024

545

107

31 Dec 2024

Read Like a Radiologist: Efficient Vision-Language Model for 3D Medical Imaging Interpretation

477

18 Dec 2024

MMedPO: Aligning Medical Vision-Language Models with Clinical-Aware Multimodal Preference Optimization

714

09 Dec 2024