Sentence-level Prompts Benefit Composed Image Retrieval

9 October 2023

Yang Bai

Xinxing Xu

Yong-Jin Liu

Salman Khan

Fahad Khan

Wangmeng Zuo

Rick Siow Mong Goh

Chun-Mei Feng

ArXiv PDF HTML

Papers citing "Sentence-level Prompts Benefit Composed Image Retrieval"

22 / 22 papers shown

Title
TMCIR: Token Merge Benefits Composed Image Retrieval Chaoyang Wang Zeyu Zhang Long Teng Zijun Li Shichao Kan 18 0 0 15 Apr 2025
IDMR: Towards Instance-Driven Precise Visual Correspondence in Multimodal Retrieval Bangwei Liu Yicheng Bao Shaohui Lin Xuhong Wang Xin Tan Y. Wang Yuan Xie Chaochao Lu 53 0 0 01 Apr 2025
FineCIR: Explicit Parsing of Fine-Grained Modification Semantics for Composed Image Retrieval Zixu Li Zhiheng Fu Yupeng Hu Zhiwei Chen Haokun Wen Liqiang Nie 26 0 0 27 Mar 2025
Composed Multi-modal Retrieval: A Survey of Approaches and Applications Kun Zhang Jingyu Li Z. Li Jingjing Zhang 36 0 0 03 Mar 2025
A Comprehensive Survey on Composed Image Retrieval Xuemeng Song Haoqiang Lin Haokun Wen Bohan Hou Mingzhu Xu Liqiang Nie 42 1 0 19 Feb 2025
Composed Image Retrieval for Training-Free Domain Conversion Nikos Efthymiadis Bill Psomas Zakaria Laskar Konstantinos Karantzalos Yannis Avrithis Ondřej Chum Giorgos Tolias 65 0 0 04 Dec 2024
UniFashion: A Unified Vision-Language Model for Multimodal Fashion Retrieval and Generation Xiangyu Zhao Yuehan Zhang Wenlong Zhang X. Wu 31 4 0 21 Aug 2024
EgoCVR: An Egocentric Benchmark for Fine-Grained Composed Video Retrieval Thomas Hummel Shyamgopal Karthik Mariana-Iuliana Georgescu Zeynep Akata EgoV 34 4 0 23 Jul 2024
Aligning Sight and Sound: Advanced Sound Source Localization Through Audio-Visual Alignment Arda Senocak H. Ryu Junsik Kim Tae-Hyun Oh Hanspeter Pfister Joon Son Chung 24 3 0 18 Jul 2024
Pseudo-triplet Guided Few-shot Composed Image Retrieval Bohan Hou Haoqiang Lin Haokun Wen Meng Liu Xuemeng Song 24 3 0 08 Jul 2024
HyCIR: Boosting Zero-Shot Composed Image Retrieval with Synthetic Labels Yingying Jiang Hanchao Jia Xiaobing Wang Peng Hao VLM 19 4 0 08 Jul 2024
CaLa: Complementary Association Learning for Augmenting Composed Image Retrieval Xintong Jiang Yaxiong Wang Mengjian Li Yujiao Wu Bingwen Hu Xueming Qian CoGe 24 4 0 29 May 2024
Improving Composed Image Retrieval via Contrastive Learning with Scaling Positives and Negatives Zhangchi Feng Richong Zhang Zhijie Nie 29 7 0 17 Apr 2024
Reconstruct before Query: Continual Missing Modality Learning with Decomposed Prompt Collaboration Shu Zhao Xiaohan Zou Tan Yu Huijuan Xu 25 1 0 17 Mar 2024
VQA4CIR: Boosting Composed Image Retrieval with Visual Question Answering Chun-Mei Feng Yang Bai Tao Luo Zhen Li Salman Khan Wangmeng Zuo Xinxing Xu Rick Siow Mong Goh Yong-Jin Liu 21 5 0 19 Dec 2023
Vision-by-Language for Training-Free Compositional Image Retrieval Shyamgopal Karthik Karsten Roth Massimiliano Mancini Zeynep Akata CoGe 15 17 0 13 Oct 2023
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 244 4,186 0 30 Jan 2023
MaPLe: Multi-modal Prompt Learning Muhammad Uzair Khattak H. Rasheed Muhammad Maaz Salman Khan F. Khan VPVLM VLM 186 521 0 06 Oct 2022
LPT: Long-tailed Prompt Tuning for Image Classification Bowen Dong Pan Zhou Shuicheng Yan W. Zuo VPVLM VLM 41 52 0 03 Oct 2022
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation Junnan Li Dongxu Li Caiming Xiong S. Hoi MLLM BDL VLM CLIP 382 4,010 0 28 Jan 2022
Learning to Prompt for Vision-Language Models Kaiyang Zhou Jingkang Yang Chen Change Loy Ziwei Liu VPVLM CLIP VLM 322 2,108 0 02 Sep 2021
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 293 2,875 0 11 Feb 2021