Composing Text and Image for Image Retrieval - An Empirical Odyssey

18 December 2018

Li Fei-Fei

Papers citing "Composing Text and Image for Image Retrieval - An Empirical Odyssey"

41 / 41 papers shown

Title
From Mapping to Composing: A Two-Stage Framework for Zero-shot Composed Image Retrieval Yabing Wang Zhuotao Tian Qingpei Guo Zheng Qin Sanping Zhou Ming Yang Le Wang 82 0 0 25 Apr 2025
NCL-CIR: Noise-aware Contrastive Learning for Composed Image Retrieval Peng Gao Yujian Lee Zailong Chen Hui Zhang Xubo Liu Yiyang Hu Guquang Jing 35 0 0 06 Apr 2025
Fine-grained Textual Inversion Network for Zero-Shot Composed Image Retrieval Haoqiang Lin Haokun Wen Xuemeng Song Meng Liu Yupeng Hu Liqiang Nie 52 14 0 25 Mar 2025
GOAL: Global-local Object Alignment Learning Hyungyu Choi Young Kyun Jang Chanho Eom VLM 101 0 0 22 Mar 2025
Missing Target-Relevant Information Prediction with World Model for Accurate Zero-Shot Composed Image Retrieval Yuanmin Tang Jing Yu Keke Gai Jiamin Zhuang Gang Xiong Gaopeng Gou Qi Wu VGen 42 1 0 21 Mar 2025
PinLanding: Content-First Keyword Landing Page Generation via Multi-Modal AI for Web-Scale Discovery Faye Zhang Jasmine Wan Qianyu Cheng Jinfeng Rao 33 0 0 01 Mar 2025
Composite Sketch+Text Queries for Retrieving Objects with Elusive Names and Complex Interactions Prajwal Gatti Kshitij Parikh Dhriti Prasanna Paul Manish Gupta Anand Mishra 110 2 0 12 Feb 2025
Composed Image Retrieval for Remote Sensing Bill Psomas Ioannis Kakogeorgiou Nikos Efthymiadis Giorgos Tolias Ondřej Chum Yannis Avrithis Konstantinos Karantzalos 41 4 0 24 May 2024
Learning-To-Rank Approach for Identifying Everyday Objects Using a Physical-World Search Engine Kanta Kaneda Shunya Nagashima Ryosuke Korekata Motonari Kambara Komei Sugiura 25 6 0 26 Dec 2023
Pretrain like Your Inference: Masked Tuning Improves Zero-Shot Composed Image Retrieval Junyang Chen Hanjiang Lai VLM 34 15 0 13 Nov 2023
Image Clustering Conditioned on Text Criteria Sehyun Kwon Jaeseung Park Minkyu Kim Jaewoong Cho Ernest K. Ryu Kangwook Lee VLM 34 11 0 27 Oct 2023
Sentence-level Prompts Benefit Composed Image Retrieval Yang Bai Xinxing Xu Yong-Jin Liu Salman Khan Fahad Khan Wangmeng Zuo Rick Siow Mong Goh Chun-Mei Feng 30 26 0 09 Oct 2023
Multi-View Fusion and Distillation for Subgrade Distresses Detection based on 3D-GPR Chunpeng Zhou Kang Ning Haishuai Wang Zhi Yu Sheng Zhou Jiajun Bu 16 1 0 09 Aug 2023
LRVS-Fashion: Extending Visual Search with Referring Instructions Simon Lepage Jérémie Mary David Picard 23 1 0 05 Jun 2023
Data Roaming and Quality Assessment for Composed Image Retrieval Matan Levy Rami Ben-Ari N. Darshan Dani Lischinski 35 23 0 16 Mar 2023
Effective Multimodal Reinforcement Learning with Modality Alignment and Importance Enhancement Jinming Ma Feng Wu Yingfeng Chen Xianpeng Ji Yu-qiong Ding OffRL 20 4 0 18 Feb 2023
Learning Action-Effect Dynamics from Pairs of Scene-graphs Shailaja Keyur Sampat Pratyay Banerjee Yezhou Yang Chitta Baral GNN 18 0 0 07 Dec 2022
Target-Free Text-guided Image Manipulation Wanshu Fan Cheng Yang Chiao-An Yang Yu-Chiang Frank Wang DiffM 18 2 0 26 Nov 2022
Navigating Connected Memories with a Task-oriented Dialog System Seungwhan Moon Satwik Kottur A. Geramifard Babak Damavandi 35 2 0 15 Nov 2022
Composed Image Retrieval with Text Feedback via Multi-grained Uncertainty Regularization Yiyang Chen Zhedong Zheng Wei Ji Leigang Qu Tat-Seng Chua 24 37 0 14 Nov 2022
Reasoning about Actions over Visual and Linguistic Modalities: A Survey Shailaja Keyur Sampat Maitreya Patel Subhasish Das Yezhou Yang Chitta Baral ReLM LM&Ro LRM 19 12 0 15 Jul 2022
BOSS: Bottom-up Cross-modal Semantic Composition with Hybrid Counterfactual Training for Robust Content-based Image Retrieval Wenqiao Zhang Jiannan Guo Meng Li Haochen Shi Shengyu Zhang Juncheng Li Siliang Tang Yueting Zhuang 44 6 0 09 Jul 2022
Training and challenging models for text-guided fashion image retrieval Eric Dodds Jack Culpepper Gaurav Srivastava 14 8 0 23 Apr 2022
UIGR: Unified Interactive Garment Retrieval Xiaoping Han Sen He Li Zhang Yi-Zhe Song Tao Xiang 19 7 0 06 Apr 2022
LatteGAN: Visually Guided Language Attention for Multi-Turn Text-Conditioned Image Manipulation Shoya Matsumori Yukikoko Abe Kosuke Shingyouchi K. Sugiura M. Imai 34 9 0 28 Dec 2021
Extending CLIP for Category-to-image Retrieval in E-commerce Mariya Hendriksen Maurits J. R. Bleeker Svitlana Vakulenko N. V. Noord E. Kuiper Maarten de Rijke VLM 11 30 0 21 Dec 2021
Embedding Arithmetic of Multimodal Queries for Image Retrieval Guillaume Couairon Matthieu Cord Matthijs Douze Holger Schwenk 27 23 0 06 Dec 2021
Discrete Representations Strengthen Vision Transformer Robustness Chengzhi Mao Lu Jiang Mostafa Dehghani Carl Vondrick Rahul Sukthankar Irfan Essa ViT 25 43 0 20 Nov 2021
ZFlow: Gated Appearance Flow-based Virtual Try-on with 3D Priors Ayush Chopra Rishabh Jain Mayur Hemani Balaji Krishnamurthy 3DH 75 55 0 14 Sep 2021
Image Retrieval on Real-life Images with Pre-trained Vision-and-Language Models Zheyuan Liu Cristian Rodriguez-Opazo Damien Teney Stephen Gould VLM 17 192 0 09 Aug 2021
Learning to Predict Visual Attributes in the Wild Khoi Pham Kushal Kafle Zhe-nan Lin Zhi Ding Scott D. Cohen Q. Tran Abhinav Shrivastava 16 107 0 17 Jun 2021
Assessing Multilingual Fairness in Pre-trained Multimodal Representations Jialu Wang Yang Liu X. Wang EGVM 11 35 0 12 Jun 2021
Analogous to Evolutionary Algorithm: Designing a Unified Sequence Model Jiangning Zhang Chao Xu Jian Li Wenzhou Chen Yabiao Wang Ying Tai Shuo Chen Chengjie Wang Feiyue Huang Yong Liu 27 22 0 31 May 2021
Co-Grounding Networks with Semantic Attention for Referring Expression Comprehension in Videos Sijie Song Xudong Lin Jiaying Liu Zongming Guo Shih-Fu Chang ObjD 11 16 0 23 Mar 2021
Ask&Confirm: Active Detail Enriching for Cross-Modal Retrieval with Partial Query Guanyu Cai Jun Zhang Xinyang Jiang Yifei Gong Lianghua He Fufu Yu Pai Peng Xiaowei Guo Feiyue Huang Xing Sun 21 13 0 02 Mar 2021
Image-to-Image Retrieval by Learning Similarity between Scene Graphs Sangwoong Yoon Woo-Young Kang Sungwook Jeon SeongEun Lee C. Han Jonghun Park Eun-Sol Kim 3DH 16 39 0 29 Dec 2020
Scene Graph based Image Retrieval -- A case study on the CLEVR Dataset Sahana Ramnath Amrita Saha Soumen Chakrabarti Mitesh M. Khapra 3DV 12 14 0 03 Nov 2019
Designovel's system description for Fashion-IQ challenge 2019 Jianri Li Xieyuanli Chen Zongtan Zhou Ki-young Shin Huimin Lu 9 6 0 21 Oct 2019
Fashion IQ: A New Dataset Towards Retrieving Images by Natural Language Feedback Hui Wu Yupeng Gao Xiaoxiao Guo Ziad Al-Halah Steven J. Rennie Kristen Grauman Rogerio Feris EgoV 6 63 0 30 May 2019
Dialog-based Interactive Image Retrieval Xiaoxiao Guo Hui Wu Yu Cheng Steven J. Rennie Gerald Tesauro Rogerio Feris 48 204 0 01 May 2018
Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding Akira Fukui Dong Huk Park Daylen Yang Anna Rohrbach Trevor Darrell Marcus Rohrbach 144 1,465 0 06 Jun 2016