LLMs Meet Long Video: Advancing Long Video Comprehension with An Interactive Visual Adapter in LLMs

21 February 2024

Papers citing "LLMs Meet Long Video: Advancing Long Video Comprehension with An Interactive Visual Adapter in LLMs"

4 / 4 papers shown

Title
VideoCogQA: A Controllable Benchmark for Evaluating Cognitive Abilities in Video-Language Models Chenglin Li Qianglong Chen Zhi Li Feng Tao Yin Zhang 354 0 0 14 Nov 2024
VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos Ziyang Wang Shoubin Yu Elias Stengel-Eskin Jaehong Yoon Feng Cheng Gedas Bertasius Mohit Bansal 392 137 0 29 May 2024
Video Understanding with Large Language Models: A Survey Yunlong Tang Jing Bi Siting Xu Luchuan Song Susan Liang ... Feng Zheng Jianguo Zhang Chenliang Xu Jiebo Luo Chenliang Xu VLM 579 152 0 29 Dec 2023
Valley: Video Assistant with Large Language model Enhanced abilitY Ruipu Luo Ziwang Zhao Min Yang Junwei Dong Da Li Pengcheng Lu Tao Wang Linmei Hu Ming-Hui Qiu MLLM 419 247 0 12 Jun 2023