Constructing Holistic Spatio-Temporal Scene Graph for Video Semantic
Role Labeling

v1v2 (latest)

Constructing Holistic Spatio-Temporal Scene Graph for Video Semantic Role Labeling

ACM Multimedia (ACM MM), 2023

9 August 2023

Hao Fei

ArXiv (abs)PDF HTML

Papers citing "Constructing Holistic Spatio-Temporal Scene Graph for Video Semantic Role Labeling"

6 / 6 papers shown

Title
METOR: A Unified Framework for Mutual Enhancement of Objects and Relationships in Open-vocabulary Video Visual Relationship DetectionInternational Joint Conference on Artificial Intelligence (IJCAI), 2025 Yongqi Wang Xinxiao Wu Shuo Yang ObjD 160 0 0 10 May 2025
Learning 4D Panoptic Scene Graph Generation from Rich 2D Visual SceneComputer Vision and Pattern Recognition (CVPR), 2025 Shengqiong Wu Hao Fei Jingkang Yang Xiaochen Li Juncheng Li Hao Zhang Tat-Seng Chua 261 4 0 19 Mar 2025
Video-of-Thought: Step-by-Step Video Reasoning from Perception to CognitionInternational Conference on Machine Learning (ICML), 2024 Hao Fei Shengqiong Wu Wei Ji Hao Zhang Hao Fei Yang Deng Wynne Hsu LRM VGen 365 142 0 08 Jan 2025
Graph-Based Multimodal and Multi-view Alignment for Keystep Recognition Julia Lee Romero Kyle Min Subarna Tripathi Morteza Karimzadeh 225 0 0 07 Jan 2025
Synergistic Dual Spatial-aware Generation of Image-to-Text and Text-to-ImageNeural Information Processing Systems (NeurIPS), 2024 Yu Zhao Hao Fei Xiangtai Li L. Qin Jiayi Ji Erik Cambria Meishan Zhang Hao Fei Jianguo Wei DiffM 234 2 0 20 Oct 2024
Effectively Leveraging CLIP for Generating Situational Summaries of Images and VideosInternational Journal of Computer Vision (IJCV), 2024 Dhruv Verma Debaditya Roy Basura Fernando 246 3 0 30 Jul 2024