FAME-ViL: Multi-Tasking Vision-Language Model for Heterogeneous Fashion Tasks

Computer Vision and Pattern Recognition (CVPR), 2023

4 March 2023

Li Zhang

ArXiv (abs)PDF HTML Github (53★)

Papers citing "FAME-ViL: Multi-Tasking Vision-Language Model for Heterogeneous Fashion Tasks"

11 / 11 papers shown

DAFM: Dynamic Adaptive Fusion for Multi-Model Collaboration in Composed Image Retrieval

332

07 Nov 2025

CIR-CoT: Towards Interpretable Composed Image Retrieval via End-to-End Chain-of-Thought Reasoning

197

09 Oct 2025

FLUID: Flow-Latent Unified Integration via Token Distillation for Expert Specialization in Multimodal Learning

168

10 Aug 2025

DetailFusion: A Dual-branch Framework with Detail Enhancement for Composed Image Retrieval

...

509

23 May 2025

NCL-CIR: Noise-aware Contrastive Learning for Composed Image RetrievalIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2025

344

06 Apr 2025

Fine-grained Textual Inversion Network for Zero-Shot Composed Image RetrievalAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2024

477

25 Mar 2025

Data-Efficient Generalization for Zero-shot Composed Image Retrieval

472

07 Mar 2025

Composed Multi-modal Retrieval: A Survey of Approaches and Applications

...

487

03 Mar 2025

A Comprehensive Survey on Composed Image Retrieval

586

19 Feb 2025

VQA4CIR: Boosting Composed Image Retrieval with Visual Question Answering

Wangmeng Zuo

312

19 Dec 2023

Bi-directional Training for Composed Image Retrieval via Text Prompt LearningIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

376

29 Mar 2023