A Local-to-Global Approach to Multi-modal Movie Scene Segmentation

6 April 2020

Linning Xu

Papers citing "A Local-to-Global Approach to Multi-modal Movie Scene Segmentation"

50 / 52 papers shown

Title
Generative AI for Film Creation: A Survey of Recent Advances Ruihan Zhang Borou Yu Jiajian Min Yetong Xin Zheng Wei ... Sijia Jiang Peiwen Huang Na Chen Xuanxuan Liu Anyi Rao VGen 59 0 0 11 Apr 2025
Chapter-Llama: Efficient Chaptering in Hour-Long Videos with LLMs Lucas Ventura Antoine Yang Cordelia Schmid Gül Varol 34 0 0 31 Mar 2025
Long Context Tuning for Video Generation Yuwei Guo Ceyuan Yang Ziyan Yang Zhibei Ma Zhijie Lin Zhenheng Yang Dahua Lin Lu Jiang DiffM VGen 72 2 0 13 Mar 2025
Towards Fine-Grained Video Question Answering Wei Dai Alan Luo Zane Durante Debadutta Dash Arnold Milstein Kevin Schulman Ehsan Adeli L. Fei-Fei 63 1 0 10 Mar 2025
Parameter-free Video Segmentation for Vision and Language Understanding Louis Mahon Mirella Lapata VLM 35 1 0 03 Mar 2025
Modality-Aware Shot Relating and Comparing for Video Scene Detection Jiawei Tan Hongxing Wang Kang Dang Jiaxin Li Zhilong Ou 33 0 0 23 Dec 2024
Cinematographic Camera Diffusion Model Hongda Jiang Xi Wang Marc Christie Libin Liu Baoquan Chen DiffM VGen 14 9 0 25 Feb 2024
Multi-Modal Video Topic Segmentation with Dual-Contrastive Domain Adaptation Linzi Xing Quan Tran Fabian Caba Franck Dernoncourt Seunghyun Yoon Zhaowen Wang Trung Bui Giuseppe Carenini 41 1 0 30 Nov 2023
Transformation vs Tradition: Artificial General Intelligence (AGI) for Arts and Humanities Zheng Liu Yiwei Li Qian Cao Junwen Chen Tianze Yang ... John Gibbs Khaled Rasheed Ninghao Liu Gengchen Mai Tianming Liu AI4CE 36 10 0 30 Oct 2023
VidChapters-7M: Video Chapters at Scale Antoine Yang Arsha Nagrani Ivan Laptev Josef Sivic Cordelia Schmid VGen 13 26 0 25 Sep 2023
A multimodal deep learning architecture for smoking detection with a small data approach Róbert Lakatos P. Pollner András Hajdu Tamas Joo 16 7 0 19 Sep 2023
Automated Conversion of Music Videos into Lyric Videos Jia Ma Anyi Rao Li-Yi Wei Rubaiat Habib Kazi Hijung Valentina Shin Maneesh Agrawala 24 5 0 28 Aug 2023
MEGA: Multimodal Alignment Aggregation and Distillation For Cinematic Video Segmentation Najmeh Sadoughi Xinyu Li Avijit Vajpayee D. Fan Bing Shuai H. Santos-Villalobos Vimal Bhat M. Rohith 24 4 0 22 Aug 2023
MMSum: A Dataset for Multimodal Summarization and Thumbnail Generation of Videos Jielin Qiu Jiacheng Zhu William Jongwon Han Aditesh Kumar Karthik Mittal ... Linjie Li Jianfeng Wang Ding Zhao Bo Li Lijuan Wang VGen 14 5 0 07 Jun 2023
MoviePuzzle: Visual Narrative Reasoning through Multimodal Order Learning Jianghui Wang Yuxuan Wang Dongyan Zhao Zilong Zheng 39 1 0 04 Jun 2023
VSTAR: A Video-grounded Dialogue Dataset for Situated Semantic Understanding with Scene and Topic Transitions Yuxuan Wang Zilong Zheng Xueliang Zhao Jinpeng Li Yueqian Wang Dongyan Zhao VGen 24 9 0 30 May 2023
AutoShot: A Short Video Dataset and State-of-the-Art Shot Boundary Detection Wentao Zhu Yufang Huang Xi Xie Wenxian Liu Jincan Deng Debing Zhang Zhangyang Wang Ji Liu 19 15 0 12 Apr 2023
How you feelin'? Learning Emotions and Mental States in Movie Scenes D. Srivastava A. Singh Makarand Tapaswi 32 10 0 12 Apr 2023
Collaborative Noisy Label Cleaner: Learning Scene-aware Trailers for Multi-modal Highlight Detection in Movies Bei Gan Xiujun Shu Ruizhi Qiao Haoqian Wu Keyun Chen Hanjun Li Bohan Ren 26 5 0 26 Mar 2023
TeViS:Translating Text Synopses to Video Storyboards Xu Gu Yuchong Sun Feiyue Ni Shizhe Chen Xihua Wang Ruihua Song B. Li Xiang Cao DiffM 23 4 0 31 Dec 2022
Efficient Movie Scene Detection using State-Space Transformers Md. Mohaiminul Islam Mahmudul Hasan Kishan Athrey Tony Braskich Gedas Bertasius ViT 31 44 0 29 Dec 2022
Tencent AVS: A Holistic Ads Video Dataset for Multi-modal Scene Segmentation Jie Jiang Zhimin Li Jiangfeng Xiong Rongwei Quan Qinglin Lu Wei Liu 16 2 0 09 Dec 2022
Unsupervised Audio-Visual Lecture Segmentation Darshan Singh Anchit Gupta C. V. Jawahar Makarand Tapaswi VOS 16 4 0 29 Oct 2022
LiveSeg: Unsupervised Multimodal Temporal Segmentation of Long Livestream Videos Jielin Qiu Franck Dernoncourt Trung Bui Zhaowen Wang Ding Zhao Hailin Jin AI4TS 12 5 0 12 Oct 2022
Semantics-Consistent Cross-domain Summarization via Optimal Transport Alignment Jielin Qiu Jiacheng Zhu Mengdi Xu Franck Dernoncourt Trung Bui Zhaowen Wang Bo-wen Li Ding Zhao Hailin Jin 41 11 0 10 Oct 2022
Multi-modal Video Chapter Generation Xiao Cao Zitan Chen Canyu Le Lei Meng VGen 29 3 0 26 Sep 2022
OS-MSL: One Stage Multimodal Sequential Link Framework for Scene Segmentation and Classification Ye Liu Lingfeng Qiao Di Yin Zhuoxuan Jiang Xinghua Jiang Deqiang Jiang Bo Ren 21 7 0 04 Jul 2022
AntPivot: Livestream Highlight Detection via Hierarchical Attention Mechanism Yang Zhao Xuan Lin Wenqiang Xu Maozong Zheng Zhengyong Liu Zhou Zhao 14 2 0 10 Jun 2022
Scene Consistency Representation Learning for Video Scene Segmentation Haoqian Wu Keyu Chen Yanan Luo Ruizhi Qiao Bo Ren Haozhe Liu Weicheng Xie Linlin Shen SSL 31 16 0 11 May 2022
MHMS: Multimodal Hierarchical Multimedia Summarization Jielin Qiu Jiacheng Zhu Mengdi Xu Franck Dernoncourt Trung Bui Zhaowen Wang Bo-wen Li Ding Zhao Hailin Jin 19 12 0 07 Apr 2022
Movie Genre Classification by Language Augmentation and Shot Sampling Zhongping Zhang Yiwen Gu Bryan A. Plummer Xin Miao Jiayi Liu Huayan Wang VLM CLIP 16 1 0 24 Mar 2022
Temporal Perceiver: A General Architecture for Arbitrary Boundary Detection Jing Tan Yuhong Wang Gangshan Wu Limin Wang 43 14 0 01 Mar 2022
Movies2Scenes: Using Movie Metadata to Learn Scene Representation Shixing Chen Chundi Liu Xiang Hao Xiaohan Nie Maxim Arap Raffay Hamid 21 17 0 22 Feb 2022
Boundary-aware Self-supervised Learning for Video Scene Segmentation Jonghwan Mun Minchul Shin Gunsoo Han Sangho Lee S. Ha Joonseok Lee Eun-Sol Kim SSL 44 20 0 14 Jan 2022
UnweaveNet: Unweaving Activity Stories Will Price Carl Vondrick Dima Damen EgoV 19 12 0 19 Dec 2021
Overview of Tencent Multi-modal Ads Video Understanding Challenge Zhenzhi Wang Liyu Wu Zhimin Li Jiangfeng Xiong Qinglin Lu 19 4 0 16 Sep 2021
MovieCuts: A New Dataset and Benchmark for Cut Type Recognition Alejandro Pardo Fabian Caba Heilbron Juan Carlos León Alcázar Ali K. Thabet Bernard Ghanem VGen 29 28 0 12 Sep 2021
A Multimodal Framework for Video Ads Understanding Zejia Weng Lingjiang Meng Rui Wang Zuxuan Wu Yu-Gang Jiang 28 1 0 29 Aug 2021
Video Ads Content Structuring by Combining Scene Confidence Prediction and Tagging Tomoyuki Suzuki Antonio Tejero-de-Pablos 20 1 0 20 Aug 2021
Category-Level 6D Object Pose Estimation via Cascaded Relation and Recurrent Reconstruction Networks Jiaze Wang Kai-xiang Chen Qi Dou 3DPC 73 100 0 19 Aug 2021
Learning to Cut by Watching Movies Alejandro Pardo Fabian Caba Heilbron Juan Carlos León Alcázar Ali K. Thabet Bernard Ghanem VGen 43 20 0 09 Aug 2021
Cross-modal Consensus Network for Weakly Supervised Temporal Action Localization Fa-Ting Hong Jialuo Feng Dan Xu Ying Shan Weishi Zheng 11 83 0 27 Jul 2021
Face, Body, Voice: Video Person-Clustering with Multiple Modalities Andrew Brown Vicky Kalogeiton Andrew Zisserman CVBM 20 30 0 20 May 2021
Shot Contrastive Self-Supervised Learning for Scene Boundary Detection Shixing Chen Xiaohan Nie David D. Fan Dongqing Zhang Vimal Bhat Raffay Hamid SSL 16 62 0 28 Apr 2021
Human Mesh Recovery from Multiple Shots Georgios Pavlakos Jitendra Malik Angjoo Kanazawa 3DH 37 57 0 17 Dec 2020
A Unified Framework for Shot Type Classification Based on Subject Centric Lens Anyi Rao Jiaze Wang Linning Xu Xuekun Jiang Qingqiu Huang Bolei Zhou Dahua Lin 18 60 0 08 Aug 2020
Online Multi-modal Person Search in Videos J. Xia Anyi Rao Qingqiu Huang Linning Xu Jiangtao Wen Dahua Lin 23 28 0 08 Aug 2020
MovieNet: A Holistic Dataset for Movie Understanding Qingqiu Huang Yu Xiong Anyi Rao Jiaze Wang Dahua Lin VGen 32 234 0 21 Jul 2020
Sep-Stereo: Visually Guided Stereophonic Audio Generation by Associating Source Separation Hang Zhou Xudong Xu Dahua Lin Xiaogang Wang Ziwei Liu DiffM 19 80 0 20 Jul 2020
Learn to Propagate Reliably on Noisy Affinity Graphs Lei Yang Qingqiu Huang Huaiyi Huang Linning Xu Dahua Lin GNN 30 13 0 17 Jul 2020