3MASSIV: Multilingual, Multimodal and Multi-Aspect dataset of Social Media Short Videos

28 March 2022

Papers citing "3MASSIV: Multilingual, Multimodal and Multi-Aspect dataset of Social Media Short Videos"

7 / 7 papers shown

Title
Video Recognition in Portrait Mode Mingfei Han Linjie Yang Xiaojie Jin Jiashi Feng Xiaojun Chang Heng Wang 30 3 0 21 Dec 2023
C2KD: Cross-Lingual Cross-Modal Knowledge Distillation for Multilingual Text-Video Retrieval Andrew Rouditchenko Yung-Sung Chuang Nina Shvetsova Samuel Thomas Rogerio Feris Brian Kingsbury Leonid Karlinsky David F. Harwath Hilde Kuehne James R. Glass VLM 26 4 0 07 Oct 2022
Cascaded Multilingual Audio-Visual Learning from Videos Andrew Rouditchenko Angie Boggust David F. Harwath Samuel Thomas Hilde Kuehne ... Rameswar Panda Rogerio Feris Brian Kingsbury M. Picheny James R. Glass 65 8 0 08 Nov 2021
CLSRIL-23: Cross Lingual Speech Representations for Indic Languages Anirudh Gupta Harveen Singh Chadha Priyanshi Shah Neeraj Chimmwal Ankur Dhuriya Rishabh Gaur Vivek Raghavan 31 37 0 15 Jul 2021
TVR: A Large-Scale Dataset for Video-Subtitle Moment Retrieval Jie Lei Licheng Yu Tamara L. Berg Mohit Bansal 119 275 0 24 Jan 2020
Aggregated Residual Transformations for Deep Neural Networks Saining Xie Ross B. Girshick Piotr Dollár Z. Tu Kaiming He 297 10,216 0 16 Nov 2016
ImageNet Large Scale Visual Recognition Challenge Olga Russakovsky Jia Deng Hao Su J. Krause S. Satheesh ... A. Karpathy A. Khosla Michael S. Bernstein Alexander C. Berg Li Fei-Fei VLM ObjD 296 39,194 0 01 Sep 2014