Title
LLMs Meet Long Video: Advancing Long Video Comprehension with An Interactive Visual Adapter in LLMs Yunxin Li Xinyu Chen Baotain Hu Min Zhang 223 9 0 21 Feb 2024
VideoPrism: A Foundational Visual Encoder for Video Understanding Long Zhao N. B. Gundavarapu Liangzhe Yuan Hao Zhou Shen Yan ... Huisheng Wang Hartwig Adam Mikhail Sirotenko Ting Liu Boqing Gong VGen 337 62 0 20 Feb 2024
$Tri$^{2}$-plane: Thinking Head Avatar via Feature Pyramid$ Tri $^{2}$ -plane: Thinking Head Avatar via Feature PyramidEuropean Conference on Computer Vision (ECCV), 2024 Luchuan Song Pinxin Liu Lele Chen Guojun Yin Chenliang Xu 3DH 232 14 0 17 Jan 2024
Valley: Video Assistant with Large Language model Enhanced abilitY Ruipu Luo Ziwang Zhao Min Yang Junwei Dong Da Li Pengcheng Lu Tao Wang Linmei Hu Ming-Hui Qiu MLLM 423 247 0 12 Jun 2023