v1v2 (latest)

Video K-Net: A Simple, Strong, and Unified Baseline for Video Segmentation

Computer Vision and Pattern Recognition (CVPR), 2022

10 April 2022

Xiangtai Li

ArXiv (abs)PDF HTML Github (153★)

Papers citing "Video K-Net: A Simple, Strong, and Unified Baseline for Video Segmentation"

50 / 74 papers shown

Click2Graph: Interactive Panoptic Video Scene Graphs from a Single Click

Raphael Ruschel

Hardikkumar Prajapati

Awsafur Rahman

B. S. Manjunath

301

20 Nov 2025

Explicit Memory through Online 3D Gaussian Splatting Improves Class-Agnostic Video SegmentationIEEE Robotics and Automation Letters (IEEE RA-L), 2025

Anthony Opipari

Aravindhan K. Krishnan

Odest Chadwicke Jenkins

VOS 3DGS

371

27 Oct 2025

SPORTS: Simultaneous Panoptic Odometry, Rendering, Tracking and Segmentation for Urban Scenes Understanding

160

14 Oct 2025

UNO: Unifying One-stage Video Scene Graph Generation via Object-Centric Visual Representation Learning

542

07 Sep 2025

Autoregressive Universal Video Segmentation Model

270

26 Aug 2025

Local2Global query Alignment for Video Instance Segmentation

Rajat Koner

Zhipeng Wang

Srinivas Parthasarathy

Chinghang Chen

239

27 Jul 2025

CRUISE: Cooperative Reconstruction and Editing in V2X Scenarios using Gaussian Splatting

...

256

24 Jul 2025

A Comprehensive Survey on Video Scene Parsing:Advances, Challenges, and Prospects

Guohuan Xie

Syed Ariff Syed Hesham

199

16 Jun 2025

Exploiting Temporal State Space Sharing for Video Semantic SegmentationComputer Vision and Pattern Recognition (CVPR), 2025

Syed Ariff Syed Hesham

329

26 Mar 2025

Learning Appearance and Motion Cues for Panoptic Tracking

Juana Valeria Hurtado

Sajad Marvi

Rohit Mohan

Abhinav Valada

348

12 Mar 2025

Vitron: A Unified Pixel-level Vision LLM for Understanding, Generating, Segmenting, EditingNeural Information Processing Systems (NeurIPS), 2024

639

31 Dec 2024

Towards Open-Vocabulary Video Semantic SegmentationIEEE transactions on multimedia (IEEE TMM), 2024

422

12 Dec 2024

Event-guided Low-light Video Semantic SegmentationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024

Zhen Yao

Mooi Choo Choo Chuah

273

01 Nov 2024

Configurable Embodied Data Generation for Class-Agnostic RGB-D Video SegmentationIEEE Robotics and Automation Letters (RA-L), 2024

Anthony Opipari

Aravindhan K. Krishnan

Odest Chadwicke Jenkins

VOS

301

16 Oct 2024

Rethinking Video Segmentation with Masked Video Consistency: Did the Model Learn as Intended?

Chen Liang

Qiang Guo

Xiaochao Qu

Luoqi Liu

Ting Liu

VOS

195

20 Aug 2024

Segment Anything for Videos: A Systematic Survey

Yan Rong

Li Liu

Shiguang Shan

VLM

270

31 Jul 2024

PiPa++: Towards Unification of Domain Adaptive Semantic Segmentation via Self-supervised Learning

Mu Chen

Zhedong Zheng

Yi Yang

321

24 Jul 2024

ViLLa: Video Reasoning Segmentation with Large Language Model

Yu Qiao

607

18 Jul 2024

General and Task-Oriented Video Segmentation

Yi Yang

470

09 Jul 2024

CAVIS: Context-Aware Video Instance Segmentation

438

03 Jul 2024

OMG-LLaVA: Bridging Image-level, Object-level, Pixel-level Reasoning and Understanding

Tao Zhang

Xiangtai Li

Hao Fei

Chen Change Loy

406

142

27 Jun 2024

1st Place Winner of the 2024 Pixel-level Video Understanding in the Wild (CVPR'24 PVUW) Challenge in Video Panoptic Segmentation and Best Long Video Consistency of Video Semantic Segmentation

Qingfeng Liu

Mostafa El-Khamy

Kee-Bong Song

274

08 Jun 2024

Semantic Segmentation on VSPW Dataset through Masked Video Consistency

Ting Liu

Luoqi Liu

253

07 Jun 2024

3rd Place Solution for PVUW Challenge 2024: Video Panoptic Segmentation

Ting Liu

Luoqi Liu

288

06 Jun 2024

SemFlow: Binding Semantic Segmentation and Image Synthesis via Rectified Flow

Xiangtai Li

Henghui Ding

Ming-Hsuan Yang

334

30 May 2024

4D Panoptic Scene Graph GenerationNeural Information Processing Systems (NeurIPS), 2024

Jun Cen

Xiangtai Li

215

16 May 2024

An Integrated Framework for Multi-Granular Explanation of Video SummarizationFrontiers in Signal Processing (FSP), 2024

K. Tsigos

Evlampios Apostolidis

Vasileios Mezaris

245

16 May 2024

Multi-Space Alignments Towards Universal LiDAR SegmentationComputer Vision and Pattern Recognition (CVPR), 2024

Ziwei Liu

Yuexin Ma

3DPC

326

02 May 2024

Explore In-Context Segmentation via Latent Diffusion ModelsAAAI Conference on Artificial Intelligence (AAAI), 2024

Chaoyang Wang

Xiangtai Li

Henghui Ding

Jiangning Zhang

432

14 Mar 2024

UniVS: Unified and Universal Video Segmentation with Prompts as Queries

Ming-hui Li

Shuai Li

Xindong Zhang

Lei Zhang

VOS

301

28 Feb 2024

Vanishing-Point-Guided Video Semantic Segmentation of Driving ScenesComputer Vision and Pattern Recognition (CVPR), 2024

Luc Van Gool

406

27 Jan 2024

OMG-Seg: Is One Model Good Enough For All Segmentation?

Xiangtai Li

Henghui Ding

379

116

18 Jan 2024

RMP-SAM: Towards Real-Time Multi-Purpose Segment Anything

...

Xiangtai Li

Ming-Hsuan Yang

VLM

155

18 Jan 2024

Street Gaussians: Modeling Dynamic Urban Scenes with Gaussian SplattingEuropean Conference on Computer Vision (ECCV), 2024

Haiyang Sun

Kun Zhan

364

179

02 Jan 2024

A Simple Video Segmenter by Tracking Objects Along Axial Trajectories

Liang-Chieh Chen

367

30 Nov 2023

Panoptic Video Scene Graph GenerationComputer Vision and Pattern Recognition (CVPR), 2023

Xiangtai Li

...

Ziwei Liu

345

28 Nov 2023

Enriching Phrases with Coupled Pixel and Object Contexts for Panoptic Narrative GroundingInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

Junshi Huang

349

02 Nov 2023

OV-VG: A Benchmark for Open-Vocabulary Visual Grounding

Xiangtai Li

317

22 Oct 2023

Temporal-aware Hierarchical Mask Classification for Video Semantic SegmentationBritish Machine Vision Conference (BMVC), 2023

Luc Van Gool

243

14 Sep 2023

Tracking Anything with Decoupled Video SegmentationIEEE International Conference on Computer Vision (ICCV), 2023

328

227

07 Sep 2023

Integrating Boxes and Masks: A Multi-Object Framework for Unified Visual Tracking and SegmentationIEEE International Conference on Computer Vision (ICCV), 2023

383

25 Aug 2023

Time Does Tell: Self-Supervised Time-Tuning of Dense Image RepresentationsIEEE International Conference on Computer Vision (ICCV), 2023

272

22 Aug 2023

Prototypical Kernel Learning and Open-set Foreground Perception for Generalized Few-shot Semantic SegmentationIEEE International Conference on Computer Vision (ICCV), 2023

286

09 Aug 2023

Incorporating Pre-training Data Matters in Unsupervised Domain AdaptationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

390

06 Aug 2023

CTVIS: Consistent Training for Online Video Instance SegmentationIEEE International Conference on Computer Vision (ICCV), 2023

Hao Chen

Lin Yuanbo Wu

Yifan Liu

Chengxiang Fan

Yunzhi Zhuge

Chunhua Shen

375

24 Jul 2023

Iterative Robust Visual Grounding with Masked Reference based Centerpoint Supervision

Xiangtai Li

299

23 Jul 2023

Pair then Relation: Pair-Net for Panoptic Scene Graph GenerationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Xiangtai Li

Ziwei Liu

314

17 Jul 2023

Dense Video Object Captioning from Disjoint SupervisionInternational Conference on Learning Representations (ICLR), 2023

361

20 Jun 2023

3rd Place Solution for PVUW Challenge 2023: Video Panoptic Segmentation

361

11 Jun 2023

1st Place Solution for PVUW Challenge 2023: Video Panoptic Segmentation

Shunping Ji

337

07 Jun 2023