v1v2 (latest)

ReForm-Eval: Evaluating Large Vision Language Models via Unified Re-Formulation of Task-Oriented Benchmarks

ACM Multimedia (ACM MM), 2023

4 October 2023

Xuanjing Huang

Papers citing "ReForm-Eval: Evaluating Large Vision Language Models via Unified Re-Formulation of Task-Oriented Benchmarks"

12 / 12 papers shown

MINT: Multimodal Instruction Tuning with Multimodal Interaction Grouping

280

02 Jun 2025

AutoJudger: An Agent-Driven Framework for Efficient Benchmarking of MLLMs

249

27 May 2025

Unleashing the Potentials of Likelihood Composition for Multi-modal Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Shitian Zhao

Renrui Zhang

Xu Luo

Yan Wang

Shanghang Zhang

Peng Gao

223

01 Oct 2024

HEMM: Holistic Evaluation of Multimodal Foundation Models

Paul Pu Liang

Louis-Philippe Morency

330

03 Jul 2024

EmbSpatial-Bench: Benchmarking Spatial Understanding for Embodied Tasks with Large Vision-Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

Xuanjing Huang

265

09 Jun 2024

VoCoT: Unleashing Visually Grounded Multi-Step Reasoning in Large Multi-Modal Models

686

27 May 2024

What Are We Measuring When We Evaluate Large Vision-Language Models? An Analysis of Latent Factors and BiasesNorth American Chapter of the Association for Computational Linguistics (NAACL), 2024

255

03 Apr 2024

SoMeLVLM: A Large Vision Language Model for Social Media Processing

Xuanjing Huang

217

20 Feb 2024

Causal-CoG: A Causal-Effect Look at Context Generation for Boosting Multi-modal Language ModelsComputer Vision and Pattern Recognition (CVPR), 2023

187

09 Dec 2023

CLEAN-EVAL: Clean Evaluation on Contaminated Large Language Models

Rui Wang

196

15 Nov 2023

What Makes for Good Visual Instructions? Synthesizing Complex Visual Reasoning Instructions for Visual Instruction TuningInternational Conference on Computational Linguistics (COLING), 2023

507

02 Nov 2023

An Examination of the Compositionality of Large Generative Vision-Language ModelsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2023

233

21 Aug 2023