Multi-Task Learning of Object State Changes from Uncurated Videos

Multi-Task Learning of Object State Changes from Uncurated Videos

24 November 2022

Tomávs Souvcek

Jean-Baptiste Alayrac

Papers citing "Multi-Task Learning of Object State Changes from Uncurated Videos"

8 / 8 papers shown

Title
Active Object Detection with Knowledge Aggregation and Distillation from Large Models Dejie Yang Yang Liu 32 3 0 21 May 2024
Spacewalk-18: A Benchmark for Multimodal and Long-form Procedural Video Understanding in Novel Domains Rohan Myer Krishnan Zitian Tang Zhiqiu Yu Chen Sun 33 1 0 30 Nov 2023
Learning State-Aware Visual Representations from Audible Interactions Himangi Mittal Pedro Morgado Unnat Jain Abhinav Gupta 55 20 0 27 Sep 2022
Disentangling Visual Embeddings for Attributes and Objects Nirat Saini Khoi Pham Abhinav Shrivastava OCL BDL CoGe 58 59 0 17 May 2022
Ego4D: Around the World in 3,000 Hours of Egocentric Video Kristen Grauman Andrew Westbury Eugene Byrne Zachary Chavis Antonino Furnari ... Mike Zheng Shou Antonio Torralba Lorenzo Torresani Mingfei Yan Jitendra Malik EgoV 218 1,017 0 13 Oct 2021
VideoCLIP: Contrastive Pre-training for Zero-shot Video-Text Understanding Hu Xu Gargi Ghosh Po-Yao (Bernie) Huang Dmytro Okhonko Armen Aghajanyan Florian Metze Luke Zettlemoyer Florian Metze Luke Zettlemoyer Christoph Feichtenhofer CLIP VLM 245 554 0 28 Sep 2021
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 293 3,683 0 11 Feb 2021
Learning Temporal Dynamics from Cycles in Narrated Video Dave Epstein Jiajun Wu Cordelia Schmid Chen Sun AI4TS 20 14 0 07 Jan 2021