CUPID: Adaptive Curation of Pre-training Data for Video-and-Language
Representation Learning

CUPID: Adaptive Curation of Pre-training Data for Video-and-Language Representation Learning

1 April 2021

Lei Zhang

Papers citing "CUPID: Adaptive Curation of Pre-training Data for Video-and-Language Representation Learning"

9 / 9 papers shown

Title
Modal-specific Pseudo Query Generation for Video Corpus Moment Retrieval Minjoon Jung Seongho Choi Joo-Kyung Kim Jin-Hwa Kim Byoung-Tak Zhang 29 7 0 23 Oct 2022
Relevance-based Margin for Contrastively-trained Video Retrieval Models Alex Falcon Swathikiran Sudhakaran G. Serra Sergio Escalera O. Lanz 32 7 0 27 Apr 2022
Survey: Transformer based Video-Language Pre-training Ludan Ruan Qin Jin VLM ViT 64 44 0 21 Sep 2021
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 295 3,693 0 11 Feb 2021
Self-supervised Co-training for Video Representation Learning Tengda Han Weidi Xie Andrew Zisserman SSL 206 308 0 19 Oct 2020
TVR: A Large-Scale Dataset for Video-Subtitle Moment Retrieval Jie Lei Licheng Yu Tamara L. Berg Mohit Bansal 108 275 0 24 Jan 2020
Unified Vision-Language Pre-Training for Image Captioning and VQA Luowei Zhou Hamid Palangi Lei Zhang Houdong Hu Jason J. Corso Jianfeng Gao MLLM VLM 252 927 0 24 Sep 2019
EndoNet: A Deep Architecture for Recognition Tasks on Laparoscopic Videos A. P. Twinanda S. Shehata Didier Mutter J. Marescaux M. de Mathelin N. Padoy 170 840 0 09 Feb 2016
Convolutional Neural Networks for Sentence Classification Yoon Kim AILaw VLM 252 13,364 0 25 Aug 2014