OmniMedVQA: A New Large-Scale Comprehensive Evaluation Benchmark for Medical LVLM

14 February 2024

Yu Qiao

Ping Luo

ELM

LM&MA

ArXiv PDF HTML

Papers citing "OmniMedVQA: A New Large-Scale Comprehensive Evaluation Benchmark for Medical LVLM"

45 / 45 papers shown

Title
Multi-Modal Explainable Medical AI Assistant for Trustworthy Human-AI Collaboration Honglong Yang Shanshan Song Yi Qin Lehan Wang Haonan Wang Xinpeng Ding Qixiang Zhang Bodong Du X. Li LM&MA 19 0 0 11 May 2025
X-Reasoner: Towards Generalizable Reasoning Across Modalities and Domains Qianchu Liu Sheng Zhang Guanghui Qin Timothy Ossowski Yu Gu ... Sam Preston Mu-Hsin Wei Paul Vozila Tristan Naumann Hoifung Poon OOD LRM VLM 47 0 0 06 May 2025
Black-Box Visual Prompt Engineering for Mitigating Object Hallucination in Large Vision Language Models Sangmin Woo Kang Zhou Yun Zhou Shuai Wang Sheng Guan Haibo Ding Lin Lee Cheong VPVLM 81 0 0 30 Apr 2025
Localizing Before Answering: A Hallucination Evaluation Benchmark for Grounded Medical Multimodal LLMs Dung Tien Nguyen Minh Khoi Ho Huy Ta T. Nguyen Qi Chen ... Zhibin Liao Minh Nguyen Nhat To Johan W. Verjans Phi Le Nguyen Vu Minh Hieu Phan 29 0 0 30 Apr 2025
Multimodal Large Language Models for Medicine: A Comprehensive Survey Jiarui Ye Hao Tang LM&MA 76 0 0 29 Apr 2025
V $^2$ R-Bench: Holistically Evaluating LVLM Robustness to Fundamental Visual Variations Zhiyuan Fan Yumeng Wang Sandeep Polisetty Yi Ren Fung 43 0 0 23 Apr 2025
SilVar-Med: A Speech-Driven Visual Language Model for Explainable Abnormality Detection in Medical Imaging Tan-Hanh Pham Chris Ngo Trong-Duong Bui Minh Luu Quang Tan-Huong Pham Truong Son-Hy 27 0 0 14 Apr 2025
PathVLM-R1: A Reinforcement Learning-Driven Reasoning Model for Pathology Visual-Language Tasks J. Wu Hao Yang Xinhua Zeng Guibing He Z. Chen Z. Li X. Zhang Yangyang Ma Run Fang Yang Liu LRM 55 0 0 12 Apr 2025
A Lightweight Large Vision-language Model for Multimodal Medical Images Belal Alsinglawi Chris McCarthy Sara Webb Christopher Fluke Navid Toosy Saidy LM&MA 42 0 0 08 Apr 2025
FaceBench: A Multi-View Multi-Level Facial Attribute VQA Dataset for Benchmarking Face Perception MLLMs Xiaoqin Wang Xusen Ma Xianxu Hou Meidan Ding Yudong Li Junliang Chen Wenting Chen Xiaoyang Peng LinLin Shen CVBM 71 0 0 27 Mar 2025
Med-R1: Reinforcement Learning for Generalizable Medical Reasoning in Vision-Language Models Yuxiang Lai Jike Zhong Ming Li Shitian Zhao Xiaofeng Yang OffRL LRM LM&MA VLM 68 5 0 18 Mar 2025
SAM2 for Image and Video Segmentation: A Comprehensive Survey Zhang Jiaxing Tang Hao VLM 50 0 0 17 Mar 2025
Exploring Typographic Visual Prompts Injection Threats in Cross-Modality Generation Models Hao-Ran Cheng Erjia Xiao Yichi Wang Kaidi Xu Mengshu Sun Jindong Gu Renjing Xu 36 0 0 14 Mar 2025
LLM Agents for Education: Advances and Applications Zhendong Chu Shen Wang Jian Xie Tinghui Zhu Yibo Yan ... Aoxiao Zhong Xuming Hu Jing Liang Philip S. Yu Qingsong Wen LLMAG ELM 114 1 0 14 Mar 2025
FCaS: Fine-grained Cardiac Image Synthesis based on 3D Template Conditional Diffusion Model Jiahao Xia Yutao Hu Yaolei Qi Z. Li Wenqi Shao Junjun He Ying Fu Longjiang Zhang Guanyu Yang DiffM MedIm 44 0 0 12 Mar 2025
FunBench: Benchmarking Fundus Reading Skills of MLLMs Qijie Wei Kaiheng Qian Xirong Li 34 1 0 02 Mar 2025
MedHallTune: An Instruction-Tuning Benchmark for Mitigating Medical Hallucination in Vision-Language Models Qiao Yan Yuchen Yuan Xiaowei Hu Yihan Wang Jiaqi Xu Jinpeng Li Chi-Wing Fu Pheng Ann Heng MLLM VLM LM&MA 48 0 0 28 Feb 2025
MedVLM-R1: Incentivizing Medical Reasoning Capability of Vision-Language Models (VLMs) via Reinforcement Learning Jiazhen Pan Che Liu Junde Wu Fenglin Liu Jiayuan Zhu Hongwei Bran Li Chen Chen C. Ouyang Daniel Rueckert LRM LM&MA VLM 65 10 0 26 Feb 2025
Vision Language Models in Medicine Beria Chingnabe Kalpelbe Angel Gabriel Adaambiik Wei Peng VLM LM&MA 86 2 0 24 Feb 2025
MMXU: A Multi-Modal and Multi-X-ray Understanding Dataset for Disease Progression Linjie Mu Zhongzhen Huang Shengqian Qin Yakun Zhu S. Zhang Xiaofan Zhang 38 0 0 17 Feb 2025
From large language models to multimodal AI: A scoping review on the potential of generative AI in medicine Lukas Buess Matthias Keicher Nassir Navab Andreas K. Maier Soroosh Tayebi Arasteh LM&MA 110 0 0 13 Feb 2025
GEMeX: A Large-Scale, Groundable, and Explainable Medical VQA Benchmark for Chest X-ray Diagnosis Bo Liu K. Zou Liming Zhan Zexin Lu Xiaoyu Dong Yidi Chen Chengqiang Xie Jiannong Cao Xiao-Ming Wu Huazhu Fu 118 0 0 25 Nov 2024
VILA-M3: Enhancing Vision-Language Models with Medical Expert Knowledge Vishwesh Nath Wenqi Li Dong Yang Andriy Myronenko Mingxin Zheng ... Holger Roth Daguang Xu Baris Turkbey Holger Roth Daguang Xu VLM 90 4 0 19 Nov 2024
MMAU: A Massive Multi-Task Audio Understanding and Reasoning Benchmark S. Sakshi Utkarsh Tyagi Sonal Kumar Ashish Seth Ramaneswaran Selvakumar Oriol Nieto R. Duraiswami Sreyan Ghosh Dinesh Manocha AuLLM ELM 65 19 0 24 Oct 2024
LoGra-Med: Long Context Multi-Graph Alignment for Medical Vision-Language Model Duy M. H. Nguyen N. T. Diep Trung Q. Nguyen Hoang-Bao Le Tai Nguyen ... Pengtao Xie Roger Wattenhofer James Zhou Daniel Sonntag Mathias Niepert VLM 52 1 0 03 Oct 2024
FMBench: Benchmarking Fairness in Multimodal Large Language Models on Medical Tasks Peiran Wu Che Liu C. L. P. Chen Jun Li Cosmin I. Bercea Rossella Arcucci 27 3 0 01 Oct 2024
MediConfusion: Can you trust your AI radiologist? Probing the reliability of multimodal medical foundation models Mohammad Shahab Sepehri Zalan Fabian Maryam Soltanolkotabi Mahdi Soltanolkotabi MedIm 32 3 0 23 Sep 2024
From Text to Multimodality: Exploring the Evolution and Impact of Large Language Models in Medical Practice Qian Niu Keyu Chen Ming Li Pohsun Feng Ziqian Bi ... Junyu Liu Benji Peng Tianyang Wang Yunze Wang Silin Chen LM&MA 22 5 0 14 Sep 2024
Has Multimodal Learning Delivered Universal Intelligence in Healthcare? A Comprehensive Survey Qika Lin Yifan Zhu Xin Mei Ling Huang Jingying Ma Kai He Zhen Peng Erik Cambria Mengling Feng 32 16 0 23 Aug 2024
Beyond the Hype: A dispassionate look at vision-language models in medical scenario Yang Nan Huichi Zhou Xiaodan Xing Guang Yang 46 3 0 16 Aug 2024
STLLaVA-Med: Self-Training Large Language and Vision Assistant for Medical Guohao Sun Can Qin Huazhu Fu Linwei Wang Zhiqiang Tao LM&MA 32 3 0 28 Jun 2024
HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale Junying Chen Ruyi Ouyang Anningzhe Gao Shunian Chen Guiming Hardy Chen ... Zhenyang Cai Ke Ji Guangjun Yu Xiang Wan Benyou Wang MedIm LM&MA 43 29 0 27 Jun 2024
MedBench: A Comprehensive, Standardized, and Reliable Benchmarking System for Evaluating Chinese Medical Large Language Models Mianxin Liu Jinru Ding Jie Xu Weiguo Hu Xiaoyang Li ... Haofen Wang Tong Ruan Xuanjing Huang Xin Sun Shaoting Zhang ELM AI4MH LM&MA 25 9 0 24 Jun 2024
INS-MMBench: A Comprehensive Benchmark for Evaluating LVLMs' Performance in Insurance Chenwei Lin Hanjia Lyu Xian Xu Jiebo Luo 27 1 0 13 Jun 2024
CARES: A Comprehensive Benchmark of Trustworthiness in Medical Vision Language Models Peng Xia Ze Chen Juanxi Tian Yangrui Gong Ruibo Hou ... Jimeng Sun Zongyuan Ge Gang Li James Zou Huaxiu Yao MU VLM 61 30 0 10 Jun 2024
Investigating the Quality of DermaMNIST and Fitzpatrick17k Dermatological Image Datasets Kumar Abhishek Aditi Jain Ghassan Hamarneh 31 2 0 25 Jan 2024
Can GPT-4V(ision) Serve Medical Applications? Case Studies on GPT-4V for Multimodal Medical Diagnosis Chaoyi Wu Jiayu Lei Qiaoyu Zheng Weike Zhao Weixiong Lin ... Xiao Zhou Ziheng Zhao Ya-Qin Zhang Yanfeng Wang Weidi Xie LM&MA 88 73 0 15 Oct 2023
PMC-VQA: Visual Instruction Tuning for Medical Visual Question Answering Xiaoman Zhang Chaoyi Wu Ziheng Zhao Weixiong Lin Ya-Qin Zhang Yanfeng Wang Weidi Xie LM&MA 27 151 0 17 May 2023
mPLUG-Owl: Modularization Empowers Large Language Models with Multimodality Qinghao Ye Haiyang Xu Guohai Xu Jiabo Ye Ming Yan ... Junfeng Tian Qiang Qi Ji Zhang Feiyan Huang Jingren Zhou VLM MLLM 203 883 0 27 Apr 2023
Instruction Tuning with GPT-4 Baolin Peng Chunyuan Li Pengcheng He Michel Galley Jianfeng Gao SyDa ALM LM&MA 157 576 0 06 Apr 2023
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 244 4,186 0 30 Jan 2023
OLIVES Dataset: Ophthalmic Labels for Investigating Visual Eye Semantics M. Prabhushankar Kiran Kokilepersaud Yash-yee Logan Stephanie Trejo Corona Ghassan AlRegib C. Wykoff 42 28 0 22 Sep 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 301 11,730 0 04 Mar 2022
Evaluating Deep Neural Networks Trained on Clinical Images in Dermatology with the Fitzpatrick 17k Dataset Matthew Groh Caleb Harris L. Soenksen Felix Lau Rachel Han Aerin Kim A. Koochek Omar Badri 102 178 0 20 Apr 2021
Conceptual 12M: Pushing Web-Scale Image-Text Pre-Training To Recognize Long-Tail Visual Concepts Soravit Changpinyo P. Sharma Nan Ding Radu Soricut VLM 273 1,077 0 17 Feb 2021