The MSR-Video to Text Dataset with Clean Annotations

The MSR-Video to Text Dataset with Clean Annotations

12 February 2021

Simone Frintrop

Papers citing "The MSR-Video to Text Dataset with Clean Annotations"

13 / 13 papers shown

Title
Video-ColBERT: Contextualized Late Interaction for Text-to-Video Retrieval Arun V. Reddy Alexander Martin Eugene Yang Andrew Yates Kate Sanders Kenton W. Murray Reno Kriz Celso M. De Melo Benjamin Van Durme Rama Chellappa 46 1 0 24 Mar 2025
ETVA: Evaluation of Text-to-Video Alignment via Fine-grained Question Generation and Answering Kaisi Guan Zhengfeng Lai Y. Sun Peng Zhang Wei Liu Kieran Liu Meng Cao Ruihua Song VGen 54 0 0 21 Mar 2025
VideoA11y: Method and Dataset for Accessible Video Description Chaoyu Li Sid Padmanabhuni Maryam Cheema H. Seifi Pooyan Fazli VGen 59 0 0 27 Feb 2025
MotionAura: Generating High-Quality and Motion Consistent Videos using Discrete Diffusion Onkar Susladkar Jishu Sen Gupta Chirag Sehgal Sparsh Mittal Rekha Singhal DiffM VGen 33 0 0 10 Oct 2024
Vlogger: Make Your Dream A Vlog Shaobin Zhuang Kunchang Li Xinyuan Chen Yaohui Wang Ziwei Liu Yu Qiao Yali Wang VGen DiffM 17 34 0 17 Jan 2024
Encoding and Decoding Narratives: Datafication and Alternative Access Models for Audiovisual Archives Yuchen Yang 24 1 0 10 Oct 2023
Latent Wander: an Alternative Interface for Interactive and Serendipitous Discovery of Large AV Archives Yuchen Yang Linyida Zhang 14 2 0 09 Oct 2023
Write What You Want: Applying Text-to-video Retrieval to Audiovisual Archives Yuchen Yang VGen 16 7 0 09 Oct 2023
LAVIE: High-Quality Video Generation with Cascaded Latent Diffusion Models Yaohui Wang Xinyuan Chen Xin Ma Shangchen Zhou Ziqi Huang ... Chen Change Loy Bo Dai Dahua Lin Yu Qiao Ziwei Liu VGen DiffM 26 220 0 26 Sep 2023
Is Space-Time Attention All You Need for Video Understanding? Gedas Bertasius Heng Wang Lorenzo Torresani ViT 278 1,978 0 09 Feb 2021
Multi-modal Transformer for Video Retrieval Valentin Gabeur Chen Sun Alahari Karteek Cordelia Schmid ViT 410 594 0 21 Jul 2020
Controllable Video Captioning with POS Sequence Guidance Based on Gated Fusion Network Bairui Wang Lin Ma Wei Zhang Wenhao Jiang Jingwen Wang Wei Liu 66 162 0 27 Aug 2019
ECO: Efficient Convolutional Network for Online Video Understanding Mohammadreza Zolfaghari Kamaljeet Singh Thomas Brox 119 496 0 24 Apr 2018