v1v2 (latest)

TEACHTEXT: CrossModal Generalized Distillation for Text-Video Retrieval

IEEE International Conference on Computer Vision (ICCV), 2021

16 April 2021

Yang Liu

Papers citing "TEACHTEXT: CrossModal Generalized Distillation for Text-Video Retrieval"

27 / 77 papers shown

PRVR: Partially Relevant Video RetrievalIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

241

26 Aug 2022

CrossA11y: Identifying Video Accessibility Issues via Cross-modal GroundingACM Symposium on User Interface Software and Technology (UIST), 2022

Ruolin Wang

148

23 Aug 2022

M2HF: Multi-level Multi-modal Hybrid Fusion for Text-Video Retrieval

Weize Quan

Dong-Ming Yan

139

16 Aug 2022

Boosting Video-Text Retrieval with Explicit High-Level SemanticsACM Multimedia (ACM MM), 2022

Jungong Han

Errui Ding

223

08 Aug 2022

A Feature-space Multimodal Data Augmentation Technique for Text-video RetrievalACM Multimedia (ACM MM), 2022

203

03 Aug 2022

TS2-Net: Token Shift and Selection Transformer for Text-Video RetrievalEuropean Conference on Computer Vision (ECCV), 2022

Qin Jin

265

170

16 Jul 2022

X-CLIP: End-to-End Multi-grained Contrastive Learning for Video-Text RetrievalACM Multimedia (ACM MM), 2022

Ji Zhang

267

400

15 Jul 2022

RoME: Role-aware Mixture-of-Expert Transformer for Text-to-Video Retrieval

173

26 Jun 2022

A CLIP-Hitchhiker's Guide to Long Video Retrieval

419

17 May 2022

Learning to Retrieve Videos by Asking QuestionsACM Multimedia (ACM MM), 2022

Avinash Madasu

Junier Oliva

Gedas Bertasius

VGen

317

11 May 2022

CenterCLIP: Token Clustering for Efficient Text-Video RetrievalAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2022

195

152

02 May 2022

Relevance-based Margin for Contrastively-trained Video Retrieval ModelsInternational Conference on Multimedia Retrieval (ICMR), 2022

Alex Falcon

Swathikiran Sudhakaran

G. Serra

Sergio Escalera

Oswald Lanz

365

27 Apr 2022

Tencent Text-Video Retrieval: Hierarchical Cross-Modal Interactions with Multi-Level RepresentationsIEEE Access (IEEE Access), 2022

Shaobo Min

Hongfa Wang

Wei Liu

343

07 Apr 2022

ECLIPSE: Efficient Long-range Video Retrieval using Sight and SoundEuropean Conference on Computer Vision (ECCV), 2022

Yan-Bo Lin

Jie Lei

Joey Tianyi Zhou

Gedas Bertasius

391

06 Apr 2022

X-Pool: Cross-Modal Language-Video Attention for Text-Video RetrievalComputer Vision and Pattern Recognition (CVPR), 2022

303

226

28 Mar 2022

Learning video retrieval models with relevance-aware online miningInternational Conference on Image Analysis and Processing (ICIAP), 2022

134

16 Mar 2022

Disentangled Representation Learning for Text-Video Retrieval

215

14 Mar 2022

Multi-Query Video RetrievalEuropean Conference on Computer Vision (ECCV), 2022

285

10 Jan 2022

Sign Language Video Retrieval with Free-Form Textual QueriesComputer Vision and Pattern Recognition (CVPR), 2022

222

07 Jan 2022

Cross Modal Retrieval with Querybank NormalisationComputer Vision and Pattern Recognition (CVPR), 2021

Yang Liu

293

115

23 Dec 2021

Align and Prompt: Video-and-Language Pre-training with Entity PromptsComputer Vision and Pattern Recognition (CVPR), 2021

361

214

17 Dec 2021

Audio Retrieval with Natural Language Queries: A Benchmark Study

A. Sophia Koepke

Andreea-Maria Oncescu

João F. Henriques

Zeynep Akata

Samuel Albanie

207

118

17 Dec 2021

Prompting Visual-Language Models for Efficient Video Understanding

374

460

08 Dec 2021

Lightweight Attentional Feature Fusion: A New Baseline for Text-to-Video Retrieval

212

03 Dec 2021

Object-aware Video-language Pre-training for Retrieval

Rui Yan

Ying Shan

280

01 Dec 2021

Cross-Modal Discrete Representation LearningAnnual Meeting of the Association for Computational Linguistics (ACL), 2021

140

10 Jun 2021

CLIP4Clip: An Empirical Study of CLIP for End to End Video Clip Retrieval

Tianrui Li

1.5K

1,001

18 Apr 2021