Towards Zero-shot Cross-lingual Image Retrieval

24 November 2020

Pranav Aggarwal

Ajinkya Kale

VLM

ArXiv (abs)PDF HTML Github (14★)

Papers citing "Towards Zero-shot Cross-lingual Image Retrieval"

14 / 14 papers shown

Multilingual Text-to-Image Person Retrieval via Bidirectional Relation Reasoning and AligningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

235

20 Oct 2025

Multilingual Vision-Language Models, A Survey

Andrei-Alexandru Manea

Jindřich Libovický

VLM

210

26 Sep 2025

Meta CLIP 2: A Worldwide Scaling Recipe

...

477

29 Jul 2025

jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images

951

11 Dec 2024

Do Vision and Language Encoders Represent the World Similarly?Computer Vision and Pattern Recognition (CVPR), 2024

Sanath Narayan

354

10 Jan 2024

Dual-view Curricular Optimal Transport for Cross-lingual Cross-modal RetrievalIEEE Transactions on Image Processing (IEEE TIP), 2023

Meng Han

Meng Wang

243

11 Sep 2023

AltDiffusion: A Multilingual Text-to-Image Diffusion ModelAAAI Conference on Artificial Intelligence (AAAI), 2023

413

19 Aug 2023

Translation-Enhanced Multilingual Text-to-Image GenerationAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

280

30 May 2023

AltCLIP: Altering the Language Encoder in CLIP for Extended Language CapabilitiesAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

447

110

12 Nov 2022

MaXM: Towards Multilingual Visual Question AnsweringConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

318

12 Sep 2022

Cross-Lingual Cross-Modal Retrieval with Noise-Robust LearningACM Multimedia (ACM MM), 2022

315

26 Aug 2022

Generalizing Multimodal Pre-training into Multilingual via Language Acquisition

Liang Zhang

Anwen Hu

Qin Jin

VLM

176

29 May 2022

Towards Zero-shot Cross-lingual Image Retrieval and Tagging

290

15 Sep 2021

MURAL: Multimodal, Multitask Retrieval Across Languages

390

10 Sep 2021