v1v2v3 (latest)

OPERA: Alleviating Hallucination in Multi-Modal Large Language Models via Over-Trust Penalty and Retrospection-Allocation

Computer Vision and Pattern Recognition (CVPR), 2023

29 November 2023

Conghui He

Dahua Lin

ArXiv (abs)PDF HTML HuggingFace (2 upvotes)Github (341★)

Papers citing "OPERA: Alleviating Hallucination in Multi-Modal Large Language Models via Over-Trust Penalty and Retrospection-Allocation"

50 / 238 papers shown

Looking Beyond Text: Reducing Language bias in Large Vision-Language Models via Multimodal Dual-Attention and Soft-Image Guidance

185

21 Nov 2024

Mitigating Hallucination in Multimodal Large Language Model via Hallucination-targeted Direct Preference OptimizationAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

236

15 Nov 2024

DDFAV: Remote Sensing Large Vision Language Models Dataset and Evaluation Benchmark

Haodong Li

Haicheng Qu

Xiaofeng Zhang

182

05 Nov 2024

V-DPO: Mitigating Hallucination in Large Vision Language Models via Vision-Guided Direct Preference OptimizationConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

213

05 Nov 2024

Unified Triplet-Level Hallucination Evaluation for Large Vision-Language Models

721

30 Oct 2024

Are LLM-Judges Robust to Expressions of Uncertainty? Investigating the effect of Epistemic Markers on LLM-based EvaluationNorth American Chapter of the Association for Computational Linguistics (NAACL), 2024

412

28 Oct 2024

LLMScan: Causal Scan for LLM Misbehavior Detection

627

22 Oct 2024

PyramidDrop: Accelerating Your Large Vision-Language Models via Pyramid Visual Redundancy Reduction

...

Yuhang Cao

Jiaqi Wang

334

133

22 Oct 2024

Mitigating Object Hallucination via Concentric Causal AttentionNeural Information Processing Systems (NeurIPS), 2024

277

21 Oct 2024

Reducing Hallucinations in Vision-Language Models via Latent Space Steering

379

21 Oct 2024

A Survey of Hallucination in Large Visual Language Models

Qingfeng Chen

315

20 Oct 2024

Modality-Fair Preference Optimization for Trustworthy MLLM AlignmentInternational Joint Conference on Artificial Intelligence (IJCAI), 2024

316

20 Oct 2024

Trust but Verify: Programmatic VLM Evaluation in the Wild

163

17 Oct 2024

The Curse of Multi-Modalities: Evaluating Hallucinations of Large Multimodal Models across Language, Visual, and Audio

324

16 Oct 2024

A Theoretical Survey on Foundation Models

Shi Fu

Yuzhu Chen

Yingjie Wang

Dacheng Tao

304

15 Oct 2024

MLLM can see? Dynamic Correction Decoding for Hallucination MitigationInternational Conference on Learning Representations (ICLR), 2024

788

15 Oct 2024

LongHalQA: Long-Context Hallucination Evaluation for MultiModal Large Language Models

291

13 Oct 2024

Insight Over Sight: Exploring the Vision-Knowledge Conflicts in Multimodal LLMsAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

951

10 Oct 2024

From Pixels to Tokens: Revisiting Object Hallucinations in Large Vision-Language Models

818

09 Oct 2024

Mitigating Modality Prior-Induced Hallucinations in Multimodal Large Language Models via Deciphering Attention CausalityInternational Conference on Learning Representations (ICLR), 2024

Guanyu Zhou

Yibo Yan

Xin Zou

Kun Wang

Aiwei Liu

Xuming Hu

230

07 Oct 2024

Differential TransformerInternational Conference on Learning Representations (ICLR), 2024

Yi Zhu

1.2K

07 Oct 2024

DAMRO: Dive into the Attention Mechanism of LVLM to Reduce Object HallucinationConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

398

06 Oct 2024

SELU: Self-Learning Embodied MLLMs in Unknown Environments

Boyu Li

Haoran Li

Zongqing Lu

188

04 Oct 2024

Look Twice Before You Answer: Memory-Space Visual Retracing for Hallucination Mitigation in Multimodal Large Language Models

...

461

04 Oct 2024

Interpreting and Editing Vision-Language Representations to Mitigate HallucinationsInternational Conference on Learning Representations (ICLR), 2024

412

03 Oct 2024

HELPD: Mitigating Hallucination of LVLMs by Hierarchical Feedback Learning with Vision-enhanced Penalty DecodingConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

162

30 Sep 2024

A Unified Hallucination Mitigation Framework for Large Vision-Language Models

Xiaopeng Zhang

223

24 Sep 2024

Mitigating Hallucination in Visual-Language Models via Re-Balancing Contrastive DecodingChinese Conference on Pattern Recognition and Computer Vision (CPRCV), 2024

Yuchen Yang

Jian Chen

135

10 Sep 2024

Understanding Multimodal Hallucination with Parameter-Free Representation Alignment

Yueqian Wang

Jianxin Liang

Yuxuan Wang

Huishuai Zhang

Dongyan Zhao

237

02 Sep 2024

Pre-Training Multimodal Hallucination Detectors with Corrupted Grounding Data

Spencer Whitehead

Jacob Phillips

Sean Hendryx

183

30 Aug 2024

Look, Compare, Decide: Alleviating Hallucination in Large Vision-Language Models via Multi-View Multi-Path ReasoningInternational Conference on Computational Linguistics (COLING), 2024

Xiaoye Qu

Jiashuo Sun

Wei Wei

Yu Cheng

MLLM LRM

277

30 Aug 2024

LLaVA-MoD: Making LLaVA Tiny via MoE Knowledge DistillationInternational Conference on Learning Representations (ICLR), 2024

Fangxun Shu

Yue Liao

...

Si Liu

Hongsheng Li

Hao Jiang

VLM MoE

210

28 Aug 2024

ConVis: Contrastive Decoding with Hallucination Visualization for Mitigating Hallucinations in Multimodal Large Language ModelsAAAI Conference on Artificial Intelligence (AAAI), 2024

240

25 Aug 2024

RoVRM: A Robust Visual Reward Model Optimized via Auxiliary Textual Preference Data

...

Jingbo Zhu

414

22 Aug 2024

Sycophancy in Vision-Language Models: A Systematic Analysis and an Inference-Time Mitigation Framework

237

21 Aug 2024

Reefknot: A Comprehensive Benchmark for Relation Hallucination Evaluation, Analysis and Mitigation in Multimodal Large Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

693

18 Aug 2024

Reference-free Hallucination Detection for Large Vision-Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Qing Li

Chenyang Lyu

175

11 Aug 2024

Self-Introspective Decoding: Alleviating Hallucinations for Large Vision-Language ModelsInternational Conference on Learning Representations (ICLR), 2024

580

04 Aug 2024

Hallu-PI: Evaluating Hallucination in Multi-modal Large Language Models within Perturbed InputsACM Multimedia (MM), 2024

206

02 Aug 2024

Alleviating Hallucination in Large Vision-Language Models with Active Retrieval Augmentation

230

01 Aug 2024

Mitigating Multilingual Hallucination in Large Vision-Language Models

267

01 Aug 2024

Paying More Attention to Image: A Training-Free Method for Alleviating Hallucination in LVLMs

253

121

31 Jul 2024

DOPRA: Decoding Over-accumulation Penalization and Re-allocation in Specific Weighting Layer

Jinfeng Wei

Xiaofeng Zhang

365

21 Jul 2024

The Synergy between Data and Multi-Modal Large Language Models: A Survey from Co-Development Perspective

Bolin Ding

Yaliang Li

Shuiguang Deng

347

11 Jul 2024

Multi-Object Hallucination in Vision-Language Models

Joyce Chai

304

08 Jul 2024

RULE: Reliable Multimodal RAG for Factuality in Medical Vision Language Models

Hongtu Zhu

Linjun Zhang

Huaxiu Yao

MedIm

219

06 Jul 2024

MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge for Text-to-Image Generation?

...

Chelsea Finn

Huaxiu Yao

EGVM MLLM

327

05 Jul 2024

MM-SpuBench: Towards Better Understanding of Spurious Biases in Multimodal LLMs

Wenqian Ye

Bohan Liu

Bolin Lai

James M. Rehg

Aidong Zhang

199

24 Jun 2024

Does Object Grounding Really Reduce Hallucination of Large Vision-Language Models?

Gregor Geigle

Radu Timofte

Goran Glavaš

260

20 Jun 2024

Do More Details Always Introduce More Hallucinations in LVLM-based Image Captioning?

228

18 Jun 2024