v1v2 (latest)

Hallucination of Multimodal Large Language Models: A Survey

29 April 2024

Tianjun Xiao

Zheng Zhang

Papers citing "Hallucination of Multimodal Large Language Models: A Survey"

50 / 334 papers shown

Measuring and Enhancing Trustworthiness of LLMs in RAG through Grounded Attributions and Learning to RefuseInternational Conference on Learning Representations (ICLR), 2024

Soujanya Poria

562

17 Sep 2024

Surveying the MLLM Landscape: A Meta-Review of Current Surveys

Ming Li

Keyu Chen

Ziqian Bi

Ming Liu

Xinyuan Song

...

Jinlang Wang

Sen Zhang

Xuanhe Pan

Jiawei Xu

Pohsun Feng

OffRL

277

17 Sep 2024

When Context Leads but Parametric Memory Follows in Large Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

355

13 Sep 2024

LaMsS: When Large Language Models Meet Self-Skepticism

145

10 Sep 2024

Visual Prompting in Multimodal Large Language Models: A Survey

...

Lina Yao

314

05 Sep 2024

Understanding Multimodal Hallucination with Parameter-Free Representation Alignment

Yueqian Wang

Jianxin Liang

Yuxuan Wang

Huishuai Zhang

Dongyan Zhao

237

02 Sep 2024

Look, Compare, Decide: Alleviating Hallucination in Large Vision-Language Models via Multi-View Multi-Path ReasoningInternational Conference on Computational Linguistics (COLING), 2024

Xiaoye Qu

Jiashuo Sun

Wei Wei

Yu Cheng

MLLM LRM

277

30 Aug 2024

Has Multimodal Learning Delivered Universal Intelligence in Healthcare? A Comprehensive SurveyInformation Fusion (Inf. Fusion), 2024

Ling Huang

Mengling Feng

292

23 Aug 2024

Show-o: One Single Transformer to Unify Multimodal Understanding and GenerationInternational Conference on Learning Representations (ICLR), 2024

Weihao Wang

Kevin Qinghong Lin

Yuchao Gu

Zhijie Chen

Zhenheng Yang

Mike Zheng Shou

401

441

22 Aug 2024

Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model

Lili Yu

265

294

20 Aug 2024

CLIP-DPO: Vision-Language Models as a Source of Preference for Fixing Hallucinations in LVLMsEuropean Conference on Computer Vision (ECCV), 2024

Yassine Ouali

Adrian Bulat

Brais Martínez

Georgios Tzimiropoulos

VLM MLLM

298

19 Aug 2024

CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous DrivingIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024

350

19 Aug 2024

Reefknot: A Comprehensive Benchmark for Relation Hallucination Evaluation, Analysis and Mitigation in Multimodal Large Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

698

18 Aug 2024

VideoQA in the Era of LLMs: An Empirical StudyInternational Journal of Computer Vision (IJCV), 2024

...

352

08 Aug 2024

LLaVA-OneVision: Easy Visual Task Transfer

Bo Li

Yuanhan Zhang

Dong Guo

Renrui Zhang

Feng Li

Hao Zhang

Kaichen Zhang

Yanwei Li

Ziwei Liu

Chunyuan Li

MLLM SyDa VLM

570

1,767

06 Aug 2024

Alleviating Hallucination in Large Vision-Language Models with Active Retrieval Augmentation

230

01 Aug 2024

Paying More Attention to Image: A Training-Free Method for Alleviating Hallucination in LVLMs

254

121

31 Jul 2024

Generalized Out-of-Distribution Detection and Beyond in Vision Language Model Era: A Survey

...

371

31 Jul 2024

Interpreting and Mitigating Hallucination in MLLMs through Multi-agent Debate

203

30 Jul 2024

CoMMIT: Coordinated Multimodal Instruction Tuning

170

29 Jul 2024

INF-LLaVA: Dual-perspective Perception for High-Resolution Multimodal Large Language Model

Jiayi Ji

241

23 Jul 2024

The Synergy between Data and Multi-Modal Large Language Models: A Survey from Co-Development Perspective

Bolin Ding

Yaliang Li

Shuiguang Deng

350

11 Jul 2024

Merge, Ensemble, and Cooperate! A Survey on Collaborative Strategies in the Era of Large Language Models

Jiajun Zhang

393

08 Jul 2024

Pelican: Correcting Hallucination in Vision-LLMs via Claim Decomposition and Program of Thought Verification

220

02 Jul 2024

Certainly Uncertain: A Benchmark and Metric for Multimodal Epistemic and Aleatoric Awareness

Jae Sung Park

Yejin Choi

322

02 Jul 2024

Investigating and Mitigating the Multimodal Hallucination Snowballing in Large Vision-Language Models

Bing Qin

517

30 Jun 2024

MLLM as Video Narrator: Mitigating Modality Imbalance in Video Moment Retrieval

Shaogang Gong

229

25 Jun 2024

Evaluating the Quality of Hallucination Benchmarks for Large Vision-Language Models

Bei Yan

Jie Zhang

Zheng Yuan

Shiguang Shan

Xilin Chen

VLM

161

24 Jun 2024

CoMT: Chain-of-Medical-Thought Reduces Hallucination in Medical Report Generation

Yue Jiang

Jiawei Chen

Dingkang Yang

Mingcheng Li

Shunli Wang

Tong Wu

Ke Li

Lihua Zhang

MLLM LM&MA MedIm LRM

152

17 Jun 2024

SPA-VL: A Comprehensive Safety Preference Alignment Dataset for Vision Language Model

...

518

17 Jun 2024

Detecting and Evaluating Medical Hallucinations in Large Vision Language Models

Jiawei Chen

Dingkang Yang

Tong Wu

Yue Jiang

Xiaolu Hou

Mingcheng Li

Shunli Wang

Dongling Xiao

Ke Li

Lihua Zhang

LM&MA VLM

241

14 Jun 2024

ClimateIQA: A New Dataset and Benchmark to Advance Vision-Language Models in Meteorology Anomalies Analysis

458

14 Jun 2024

Robustness of Structured Data Extraction from In-plane Rotated Documents using Multi-Modal Large Language Models (LLM)

Anjanava Biswas

Wrick Talukdar

157

13 Jun 2024

CODE: Contrasting Self-generated Description to Combat Hallucination in Large Multi-modal Models

Junho Kim

Hyunjun Kim

Yeonju Kim

Yong Man Ro

MLLM

222

04 Jun 2024

CheckEmbed: Effective Verification of LLM Solutions to Open-Ended Tasks

...

690

04 Jun 2024

RITUAL: Random Image Transformations as a Universal Anti-hallucination Lever in LVLMs

249

28 May 2024

Alleviating Hallucinations in Large Vision-Language Models through Hallucination-Induced Optimization

Beitao Chen

Xinyu Lyu

Lianli Gao

Jingkuan Song

Hengtao Shen

MLLM

528

24 May 2024

Visual Fact Checker: Enabling High-Fidelity Detailed Caption Generation

201

30 Apr 2024

List Items One by One: A New Data Source and Learning Paradigm for Multimodal LLMs

Jianwei Yang

...

Julian McAuley

302

25 Apr 2024

Detecting and Mitigating Hallucination in Large Vision Language Models via Fine-Grained AI Feedback

Wanggui He

357

22 Apr 2024

FGAIF: Aligning Large Vision-Language Models with Fine-grained AI Feedback

Liqiang Jing

Xinya Du

392

07 Apr 2024

Mitigating Hallucinations in Large Vision-Language Models with Instruction Contrastive Decoding

Liang Ding

325

145

27 Mar 2024

Multi-Modal Hallucination Control by Visual Information Grounding

Matthew Trager

244

148

20 Mar 2024

What if...?: Thinking Counterfactual Keywords Helps to Mitigate Hallucination in Large Multi-modal Models

211

20 Mar 2024

Mitigating Dialogue Hallucination for Large Vision Language Models via Adversarial Instruction Tuning

Ser-Nam Lim

261

15 Mar 2024

HALC: Object Hallucination Reduction via Adaptive Focal-Contrast Decoding

Zhaorun Chen

264

132

01 Mar 2024

IBD: Alleviating Hallucinations in Large Vision-Language Models via Image-Biased Decoding

Jun Liu

263

28 Feb 2024

Aligning Modalities in Vision Large Language Models via Preference Fine-tuning

268

165

18 Feb 2024

EFUF: Efficient Fine-grained Unlearning Framework for Mitigating Hallucinations in Multimodal Large Language Models

283

15 Feb 2024

Mitigating Object Hallucination in Large Vision-Language Models via Image-Grounded Guidance

315

13 Feb 2024