Towards Multimodal Video Paragraph Captioning Models Robust to Missing Modality

28 March 2024

Lei Li

Papers citing "Towards Multimodal Video Paragraph Captioning Models Robust to Missing Modality"

2 / 2 papers shown

Title
Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis Chaoyou Fu Yuhan Dai Yondong Luo Lei Li Shuhuai Ren ... Tong Bill Xu Xiawu Zheng Enhong Chen Rongrong Ji Xing Sun VLM MLLM 41 216 0 31 May 2024
A Comprehensive Review of Knowledge Distillation in Computer Vision Sheikh Musa Kaleem Tufail Rouf Gousia Habib Tausifa Jan Saleem Brejesh Lall VLM 17 12 0 01 Apr 2024