MeViS: A Large-scale Benchmark for Video Segmentation with Motion Expressions

16 August 2023

Papers citing "MeViS: A Large-scale Benchmark for Video Segmentation with Motion Expressions"

43 / 93 papers shown

Title
MMIU: Multimodal Multi-image Understanding for Evaluating Large Vision-Language Models Fanqing Meng J. Wang Chuanhao Li Quanfeng Lu Hao Tian ... Jifeng Dai Yu Qiao Ping Luo Kaipeng Zhang Wenqi Shao VLM 50 17 0 05 Aug 2024
RefMask3D: Language-Guided Transformer for 3D Referring Segmentation Shuting He Henghui Ding 44 10 0 25 Jul 2024
SegPoint: Segment Any Point Cloud via Large Language Model Shuting He Henghui Ding Xudong Jiang Bihan Wen 3DV MLLM 3DPC 30 17 0 18 Jul 2024
ViLLa: Video Reasoning Segmentation with Large Language Model Rongkun Zheng Lu Qi Xi Chen Yi Wang Kun Wang Yu Qiao Hengshuang Zhao VOS LRM 45 2 0 18 Jul 2024
VISA: Reasoning Video Object Segmentation via Large Language Models Cilin Yan Haochen Wang Shilin Yan Xiaolong Jiang Yao Hu Guoliang Kang Weidi Xie E. Gavves LRM VLM VOS 32 22 0 16 Jul 2024
Ref-AVS: Refer and Segment Objects in Audio-Visual Scenes Yaoting Wang Peiwen Sun Dongzhan Zhou Guangyao Li Honggang Zhang Di Hu VOS 22 5 0 15 Jul 2024
ActionVOS: Actions as Prompts for Video Object Segmentation Liangyang Ouyang Ruicong Liu Yifei Huang Ryosuke Furuta Yoichi Sato VOS 24 2 0 10 Jul 2024
OMG-LLaVA: Bridging Image-level, Object-level, Pixel-level Reasoning and Understanding Tao Zhang Xiangtai Li Hao Fei Haobo Yuan Shengqiong Wu Shunping Ji Chen Change Loy Shuicheng Yan LRM MLLM VLM 47 44 0 27 Jun 2024
PVUW 2024 Challenge on Complex Video Understanding: Methods and Results Henghui Ding Chang Liu Yunchao Wei Nikhila Ravi Shuting He ... Bo-Lu Zhao Jing Liu Feiyu Pan Hao Fang Xiankai Lu 40 8 0 24 Jun 2024
2nd Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation Bin Cao Yisi Zhang Xuanxu Lin Xingjian He Bo-Lu Zhao Jing Liu 39 2 0 20 Jun 2024
2nd Place Solution for MOSE Track in CVPR 2024 PVUW workshop: Complex Video Object Segmentation Zhensong Xu Jiangtao Yao Chengjing Wu Ting Liu Luoqi Liu 18 1 0 12 Jun 2024
1st Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation Mingqi Gao Jingnan Luo Jinyu Yang Jungong Han Feng Zheng 24 2 0 11 Jun 2024
Bootstrapping Referring Multi-Object Tracking Yani Zhang Dongming Wu Wencheng Han Xingping Dong 31 5 0 07 Jun 2024
3rd Place Solution for MeViS Track in CVPR 2024 PVUW workshop: Motion Expression guided Video Segmentation Feiyu Pan Hao Fang Xiankai Lu 19 3 0 07 Jun 2024
1st Place Solution for MOSE Track in CVPR 2024 PVUW Workshop: Complex Video Object Segmentation Deshui Miao Xin Li Zhenyu He Yaowei Wang Ming-Hsuan Yang 25 1 0 07 Jun 2024
3rd Place Solution for MOSE Track in CVPR 2024 PVUW workshop: Complex Video Object Segmentation Xinyu Liu Jing Zhang Kexin Zhang Yuting Yang Licheng Jiao Shuyuan Yang 17 1 0 06 Jun 2024
Artemis: Towards Referential Understanding in Complex Videos Jihao Qiu Yuan Zhang Xi Tang Lingxi Xie Tianren Ma Pengyu Yan David Doermann Qixiang Ye Yunjie Tian VLM VGen 34 9 0 01 Jun 2024
Mitigating the Curse of Dimensionality for Certified Robustness via Dual Randomized Smoothing Song Xia Yu Yi Xudong Jiang Henghui Ding 21 9 0 15 Apr 2024
Decoupling Static and Hierarchical Motion Perception for Referring Video Segmentation Shuting He Henghui Ding VOS 24 23 0 04 Apr 2024
Explore In-Context Segmentation via Latent Diffusion Models Chaoyang Wang Xiangtai Li Henghui Ding Lu Qi Jiangning Zhang Yunhai Tong Chen Change Loy Shuicheng Yan DiffM 48 6 0 14 Mar 2024
$$\text{R}^2$-Bench: Benchmarking the Robustness of Referring Perception Models under Perturbations$ $\text{R}^2$ -Bench: Benchmarking the Robustness of Referring Perception Models under Perturbations Xiang Li Kai Qiu Jinglu Wang Xiaohao Xu Rita Singh Kashu Yamazaki Hao Chen Xiaonan Huang Bhiksha Raj VOS 27 1 0 07 Mar 2024
Effectiveness Assessment of Recent Large Vision-Language Models Yao Jiang Xinyu Yan Ge-Peng Ji Keren Fu Meijun Sun Huan Xiong Deng-Ping Fan Fahad Shahbaz Khan 21 14 0 07 Mar 2024
Rethinking CLIP-based Video Learners in Cross-Domain Open-Vocabulary Action Recognition Kun-Yu Lin Henghui Ding Jiaming Zhou Yu-Ming Tang Yi-Xing Peng Zhilin Zhao Chen Change Loy Wei-Shi Zheng VLM 22 6 0 03 Mar 2024
EchoTrack: Auditory Referring Multi-Object Tracking for Autonomous Driving Jiacheng Lin Jiajun Chen Kunyu Peng Xuan He Zhiyong Li Rainer Stiefelhagen Kailun Yang 40 6 0 28 Feb 2024
Point-VOS: Pointing Up Video Object Segmentation Idil Esen Zulfikar Sabarinath Mahadevan P. Voigtlaender Bastian Leibe VOS 8 2 0 08 Feb 2024
OMG-Seg: Is One Model Good Enough For All Segmentation? Xiangtai Li Haobo Yuan Wei Li Henghui Ding Size Wu Wenwei Zhang Yining Li Kai Chen Chen Change Loy VLM MLLM ViT 64 48 0 18 Jan 2024
Video Understanding with Large Language Models: A Survey Yunlong Tang Jing Bi Siting Xu Luchuan Song Susan Liang ... Feng Zheng Jianguo Zhang Ping Luo Jiebo Luo Chenliang Xu VLM 47 76 0 29 Dec 2023
SegRefiner: Towards Model-Agnostic Segmentation Refinement with Discrete Diffusion Process Meng Wang Henghui Ding Jun Hao Liew Jiajun Liu Yao-Min Zhao Yunchao Wei DiffM 18 16 0 19 Dec 2023
VIDiff: Translating Videos via Multi-Modal Instructions with Diffusion Models Zhen Xing Qi Dai Zihao Zhang Hui Zhang Hang-Rui Hu Zuxuan Wu Yu-Gang Jiang VGen 25 17 0 30 Nov 2023
Merlin:Empowering Multimodal LLMs with Foresight Minds En Yu Liang Zhao Yana Wei Jinrong Yang Dongming Wu ... Haoran Wei Tiancai Wang Zheng Ge Xiangyu Zhang Wenbing Tao LRM 10 24 0 30 Nov 2023
VGSG: Vision-Guided Semantic-Group Network for Text-based Person Search Shuting He Hao Luo Wei Jiang Xudong Jiang Henghui Ding 9 4 0 13 Nov 2023
QDFormer: Towards Robust Audiovisual Segmentation in Complex Environments with Quantization-based Semantic Decomposition Xiang Li Jinglu Wang Xiaohao Xu Xiulian Peng Rita Singh Yan Lu Bhiksha Raj VOS 28 10 0 29 Sep 2023
PanoVOS: Bridging Non-panoramic and Panoramic Views with Transformer for Video Segmentation Shilin Yan Xiaohao Xu Renrui Zhang Lingyi Hong Wenchao Chen Wenqiang Zhang Wei Zhang VOS 11 5 0 21 Sep 2023
GREC: Generalized Referring Expression Comprehension Shuting He Henghui Ding Chang Liu Xudong Jiang ObjD 11 14 0 30 Aug 2023
Towards Open Vocabulary Learning: A Survey Jianzong Wu Xiangtai Li Shilin Xu Haobo Yuan Henghui Ding ... Jiangning Zhang Yu Tong Xudong Jiang Bernard Ghanem Dacheng Tao ObjD VLM 14 104 0 28 Jun 2023
Transformer-Based Visual Segmentation: A Survey Xiangtai Li Henghui Ding Haobo Yuan Wenwei Zhang Jiangmiao Pang Guangliang Cheng Kai-xiang Chen Ziwei Liu Chen Change Loy ViT MedIm 26 112 0 19 Apr 2023
Tube-Link: A Flexible Cross Tube Framework for Universal Video Segmentation Xiangtai Li Haobo Yuan Wenwei Zhang Guangliang Cheng Jiangmiao Pang Chen Change Loy ViT VOS 21 20 0 22 Mar 2023
Global Knowledge Calibration for Fast Open-Vocabulary Segmentation Kunyang Han Yong-Jin Liu Jun Hao Liew Henghui Ding Yunchao Wei ... Yitong Wang Yansong Tang Yujiu Yang Jiashi Feng Yao-Min Zhao VLM 23 23 0 16 Mar 2023
MOSE: A New Dataset for Video Object Segmentation in Complex Scenes Henghui Ding Chang Liu Shuting He Xudong Jiang Philip H. S. Torr S. Bai VOS 8 131 0 03 Feb 2023
Betrayed by Captions: Joint Caption Grounding and Generation for Open Vocabulary Instance Segmentation Jianzong Wu Xiangtai Li Henghui Ding Xia Li Guangliang Cheng Yu Tong Chen Change Loy VLM 68 24 0 02 Jan 2023
Learning Local and Global Temporal Contexts for Video Semantic Segmentation Guolei Sun Yun Liu Henghui Ding Min Wu Luc Van Gool 17 31 0 07 Apr 2022
LAVT: Language-Aware Vision Transformer for Referring Image Segmentation Zhao Yang Jiaqi Wang Yansong Tang Kai-xiang Chen Hengshuang Zhao Philip H. S. Torr 120 308 0 04 Dec 2021
Boundary-Aware Feature Propagation for Scene Segmentation Henghui Ding Xudong Jiang A. Liu N. Magnenat-Thalmann G. Wang 130 253 0 31 Aug 2019