v1v2v3 (latest)

OPERA: Alleviating Hallucination in Multi-Modal Large Language Models via Over-Trust Penalty and Retrospection-Allocation

Computer Vision and Pattern Recognition (CVPR), 2023

29 November 2023

Conghui He

Dahua Lin

ArXiv (abs)PDF HTML HuggingFace (2 upvotes)Github (341★)

Papers citing "OPERA: Alleviating Hallucination in Multi-Modal Large Language Models via Over-Trust Penalty and Retrospection-Allocation"

50 / 238 papers shown

AdaViP: Aligning Multi-modal LLMs via Adaptive Vision-enhanced Preference Optimization

883

22 Apr 2025

Low-hallucination Synthetic Captions for Large-Scale Vision-Language Model Pre-training

498

17 Apr 2025

LSR-MCTS: Alleviating Long Range Dependency in Code Generation

...

309

10 Apr 2025

Perception in Reflection

...

333

09 Apr 2025

Video-Bench: Human-Aligned Video Generation BenchmarkComputer Vision and Pattern Recognition (CVPR), 2025

...

586

07 Apr 2025

POPEN: Preference-Based Optimization and Ensemble for LVLM-Based Reasoning SegmentationComputer Vision and Pattern Recognition (CVPR), 2025

286

01 Apr 2025

Towards Trustworthy GUI Agents: A Survey

273

30 Mar 2025

Learning to Instruct for Visual Instruction Tuning

420

28 Mar 2025

Mitigating Low-Level Visual Hallucinations Requires Self-Awareness: Database, Model and Training Strategy

298

26 Mar 2025

Mind with Eyes: from Language Reasoning to Multimodal Reasoning

320

23 Mar 2025

Debiasing Multimodal Large Language Models via Noise-Aware Preference OptimizationComputer Vision and Pattern Recognition (CVPR), 2025

292

23 Mar 2025

Mitigating Object Hallucinations in MLLMs via Multi-Frequency Perturbations

...

363

19 Mar 2025

Where do Large Vision-Language Models Look at when Answering Questions?

284

18 Mar 2025

ClearSight: Visual Signal Enhancement for Object Hallucination Mitigation in Multimodal Large language ModelsComputer Vision and Pattern Recognition (CVPR), 2025

Hao Yin

Guangzong Si

Zilei Wang

924

17 Mar 2025

Through the Magnifying Glass: Adaptive Perception Magnification for Hallucination-Free VLM Decoding

1.1K

13 Mar 2025

TruthPrInt: Mitigating LVLM Object Hallucination Via Latent Truthful-Guided Pre-Intervention

981

13 Mar 2025

Attention Reallocation: Towards Zero-cost and Controllable Hallucination Mitigation of MLLMs

288

13 Mar 2025

TIME: Temporal-Sensitive Multi-Dimensional Instruction Tuning and Robust Benchmarking for Video-LLMs

241

13 Mar 2025

Attention Hijackers: Detect and Disentangle Attention Hijacking in LVLMs for Hallucination Mitigation

520

11 Mar 2025

Hallucinatory Image Tokens: A Training-free EAZY Approach on Detecting and Mitigating Object Hallucinations in LVLMs

399

10 Mar 2025

PerturboLLaVA: Reducing Multimodal Hallucinations with Perturbative Visual TrainingInternational Conference on Learning Representations (ICLR), 2025

282

09 Mar 2025

Treble Counterfactual VLMs: A Causal Approach to Hallucination

387

08 Mar 2025

TPC: Cross-Temporal Prediction Connection for Vision-Language Model Hallucination Reduction

345

06 Mar 2025

MedHEval: Benchmarking Hallucinations and Mitigation Strategies in Medical Large Vision-Language Models

244

04 Mar 2025

Octopus: Alleviating Hallucination via Dynamic Contrastive DecodingComputer Vision and Pattern Recognition (CVPR), 2025

293

01 Mar 2025

Mitigating Hallucinations in Large Vision-Language Models by Adaptively Constraining Information FlowAAAI Conference on Artificial Intelligence (AAAI), 2025

247

28 Feb 2025

Exploring Causes and Mitigation of Hallucinations in Large Vision Language Models

203

24 Feb 2025

Magnifier Prompt: Tackling Multimodal Hallucination via Extremely Simple Instructions

304

24 Feb 2025

Can Hallucination Correction Improve Video-Language Alignment?Annual Meeting of the Association for Computational Linguistics (ACL), 2025

Lingjun Zhao

Mingyang Xie

Paola Cascante-Bonilla

Hal Daumé III

Kwonjoon Lee

HILM VLM

331

20 Feb 2025

Mitigating Hallucinations in Large Vision-Language Models via Summary-Guided DecodingNorth American Chapter of the Association for Computational Linguistics (NAACL), 2024

453

20 Feb 2025

CutPaste&Find: Efficient Multimodal Hallucination Detector with Visual-aid Knowledge Base

239

18 Feb 2025

The Hidden Life of Tokens: Reducing Hallucination of Large Vision-Language Models via Visual Information Steering

259

05 Feb 2025

Visual Attention Never Fades: Selective Progressive Attention ReCalibration for Detailed Image Captioning in Multimodal Large Language Models

996

03 Feb 2025

Mirage in the Eyes: Hallucination Attack on Multi-modal Large Language Models with Only Attention Sink

245

28 Jan 2025

PAINT: Paying Attention to INformed Tokens to Mitigate Hallucination in Large Vision-Language Model

377

21 Jan 2025

Mitigating Hallucinations on Object Attributes using Multiview Images and Negative InstructionsIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2025

107

20 Jan 2025

Advancing General Multimodal Capability of Vision-language Models with Pyramid-descent Visual Position EncodingAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

359

19 Jan 2025

Visual Large Language Models for Generalized and Specialized Applications

461

06 Jan 2025

Towards a Systematic Evaluation of Hallucinations in Large-Vision Language Models

118

29 Dec 2024

Cracking the Code of Hallucination in LVLMs with Vision-aware Head DivergenceAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

376

18 Dec 2024

Nullu: Mitigating Object Hallucinations in Large Vision-Language Models via HalluSpace ProjectionComputer Vision and Pattern Recognition (CVPR), 2024

577

18 Dec 2024

Attention with Dependency Parsing Augmentation for Fine-Grained AttributionAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

289

16 Dec 2024

Who Brings the Frisbee: Probing Hidden Hallucination Factors in Large Vision-Language Model via Causality AnalysisIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024

297

04 Dec 2024

Explainable and Interpretable Multimodal Large Language Models: A Comprehensive Survey

...

425

03 Dec 2024

Beyond Text-Visual Attention: Exploiting Visual Cues for Effective Token Pruning in VLMs

247

02 Dec 2024

Critic-V: VLM Critics Help Catch VLM Errors in Multimodal ReasoningComputer Vision and Pattern Recognition (CVPR), 2024

...

599

27 Nov 2024

Efficient Self-Improvement in Multimodal Large Language Models: A Model-Level Judge-Free Approach

314

26 Nov 2024

VaLiD: Mitigating the Hallucination of Large Vision Language Models by Visual Layer Fusion Contrastive Decoding

478

24 Nov 2024

Devils in Middle Layers of Large Vision-Language Models: Interpreting, Detecting and Mitigating Object Hallucinations via Attention LensComputer Vision and Pattern Recognition (CVPR), 2024

521

23 Nov 2024

ICT: Image-Object Cross-Level Trusted Intervention for Mitigating Object Hallucination in Large Vision-Language ModelsComputer Vision and Pattern Recognition (CVPR), 2024

1.0K

22 Nov 2024