v1v2v3v4 (latest)

Investigating and Mitigating the Multimodal Hallucination Snowballing in Large Vision-Language Models

30 June 2024

Bing Qin

ArXiv (abs)PDF HTML Github

Papers citing "Investigating and Mitigating the Multimodal Hallucination Snowballing in Large Vision-Language Models"

15 / 15 papers shown

Suppressing VLM Hallucinations with Spectral Representation Filtering

Ameen Ali

Tamim Zoabi

Lior Wolf

177

15 Nov 2025

ImaGGen: Zero-Shot Generation of Co-Speech Semantic Gestures Grounded in Language and Image Input

Hendric Voss

Stefan Kopp

SLR

330

20 Oct 2025

MedMMV: A Controllable Multimodal Multi-Agent Framework for Reliable and Verifiable Clinical Reasoning

228

29 Sep 2025

Visual Multi-Agent System: Mitigating Hallucination Snowballing via Visual Flow

...

315

26 Sep 2025

Look Again, Think Slowly: Enhancing Visual Reflection in Vision-Language Models

173

15 Sep 2025

OmniDPO: A Preference Optimization Framework to Address Omni-Modal Hallucination

225

31 Aug 2025

Empowering Multimodal LLMs with External Tools: A Comprehensive Survey

252

14 Aug 2025

Seeing Far and Clearly: Mitigating Hallucinations in MLLMs with Attention Causal DecodingComputer Vision and Pattern Recognition (CVPR), 2025

...

423

22 May 2025

TARAC: Mitigating Hallucination in LVLMs via Temporal Attention Real-time Accumulative Connection

280

05 Apr 2025

TPC: Cross-Temporal Prediction Connection for Vision-Language Model Hallucination Reduction

449

06 Mar 2025

Exploring Causes and Mitigation of Hallucinations in Large Vision Language Models

250

24 Feb 2025

Visual Attention Never Fades: Selective Progressive Attention ReCalibration for Detailed Image Captioning in Multimodal Large Language Models

1.1K

03 Feb 2025

TEOChat: A Large Vision-Language Assistant for Temporal Earth Observation DataInternational Conference on Learning Representations (ICLR), 2024

486

28 Jan 2025

ICT: Image-Object Cross-Level Trusted Intervention for Mitigating Object Hallucination in Large Vision-Language ModelsComputer Vision and Pattern Recognition (CVPR), 2024

1.1K

22 Nov 2024

Hallucination of Multimodal Large Language Models: A Survey

Tianjun Xiao

Zheng Zhang

805

351

29 Apr 2024