Revisit Large-Scale Image-Caption Data in Pre-training Multimodal
Foundation Models

Revisit Large-Scale Image-Caption Data in Pre-training Multimodal Foundation Models

3 October 2024

Zhengfeng Lai

Vasileios Saveris

Hong-You Chen

Haotian Zhang

Meng Cao

Yinfei Yang

Papers citing "Revisit Large-Scale Image-Caption Data in Pre-training Multimodal Foundation Models"

1 / 1 papers shown

Title
MM1.5: Methods, Analysis & Insights from Multimodal LLM Fine-tuning Haotian Zhang Mingfei Gao Zhe Gan Philipp Dufter Nina Wenzel ... Haoxuan You Zirui Wang Afshin Dehghan Peter Grasch Yinfei Yang VLM MLLM 36 32 1 30 Sep 2024