Meta-Personalizing Vision-Language Models to Find Named Instances in Video

16 June 2023

Papers citing "Meta-Personalizing Vision-Language Models to Find Named Instances in Video"

7 / 7 papers shown

Title
PGA: Personalizing Grasping Agents with Single Human-Robot Interaction Junghyun Kim Gi-Cheon Kang Jaein Kim Seoyun Yang Minjoon Jung Byoung-Tak Zhang 21 0 0 19 Oct 2023
VideoCLIP: Contrastive Pre-training for Zero-shot Video-Text Understanding Hu Xu Gargi Ghosh Po-Yao (Bernie) Huang Dmytro Okhonko Armen Aghajanyan Florian Metze Luke Zettlemoyer Florian Metze Luke Zettlemoyer Christoph Feichtenhofer CLIP VLM 245 554 0 28 Sep 2021
Instance-Conditioned GAN Arantxa Casanova Marlene Careil Jakob Verbeek M. Drozdzal Adriana Romero Soriano GAN 193 132 0 10 Sep 2021
CLIP4Clip: An Empirical Study of CLIP for End to End Video Clip Retrieval Huaishao Luo Lei Ji Ming Zhong Yang Chen Wen Lei Nan Duan Tianrui Li CLIP VLM 303 771 0 18 Apr 2021
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 253 4,735 0 24 Feb 2021
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 293 3,683 0 11 Feb 2021
Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks Chelsea Finn Pieter Abbeel Sergey Levine OOD 243 11,568 0 09 Mar 2017