v1v2 (latest)

Sieve: Multimodal Dataset Pruning Using Image Captioning Models

Computer Vision and Pattern Recognition (CVPR), 2023

3 October 2023

ArXiv (abs)PDF HTML Github

Papers citing "Sieve: Multimodal Dataset Pruning Using Image Captioning Models"

10 / 10 papers shown

CoIDO: Efficient Data Selection for Visual Instruction Tuning via Coupled Importance-Diversity Optimization

170

11 Oct 2025

SynC: Synthetic Image Caption Dataset Refinement with One-to-many Mapping for Zero-shot Image Captioning

243

24 Jul 2025

Data Pruning by Information MaximizationInternational Conference on Learning Representations (ICLR), 2025

377

02 Jun 2025

Filter Like You Test: Data-Driven Data Filtering for CLIP Pretraining

Mikey Shechter

Yair Carmon

CLIP

456

11 Mar 2025

ELIP: Enhanced Visual-Language Foundation Models for Image Retrieval

1.2K

21 Feb 2025

Paint Outside the Box: Synthesizing and Selecting Training Data for Visual Grounding

1.4K

01 Dec 2024

MMIE: Massive Multimodal Interleaved Comprehension Benchmark for Large Vision-Language ModelsInternational Conference on Learning Representations (ICLR), 2024

Zhaoyang Wang

...

Huaxiu Yao

444

14 Oct 2024

A Survey of Multimodal Large Language Model from A Data-centric Perspective

...

Conghui He

517

26 May 2024

Scaling Laws for Data Filtering -- Data Curation cannot be Compute AgnosticComputer Vision and Pattern Recognition (CVPR), 2024

J. Zico Kolter

343

10 Apr 2024

Billion-scale similarity search with GPUsIEEE Transactions on Big Data (TBD), 2017

Jeff Johnson

Matthijs Douze

Edouard Grave

1.3K

5,019

28 Feb 2017