v1v2 (latest)

Towards Open-Vocabulary Video Instance Segmentation

IEEE International Conference on Computer Vision (ICCV), 2023

4 April 2023

XU Tang

Yao Hu

ArXiv (abs)PDF HTML Github (87★)

Papers citing "Towards Open-Vocabulary Video Instance Segmentation"

33 / 33 papers shown

ReVSeg: Incentivizing the Reasoning Chain for Video Segmentation with Reinforcement Learning

384

02 Dec 2025

Explicit Memory through Online 3D Gaussian Splatting Improves Class-Agnostic Video SegmentationIEEE Robotics and Automation Letters (IEEE RA-L), 2025

Anthony Opipari

Aravindhan K. Krishnan

Odest Chadwicke Jenkins

VOS 3DGS

331

27 Oct 2025

MaskCaptioner: Learning to Jointly Segment and Caption Object Trajectories in Videos

446

16 Oct 2025

Image-to-Video Transfer Learning based on Image-Language Foundation Models: A Comprehensive Survey

146

12 Oct 2025

UniPixel: Unified Object Referring and Segmentation for Pixel-Level Visual Reasoning

375

22 Sep 2025

Generalized Decoupled Learning for Enhancing Open-Vocabulary Dense Perception

130

15 Aug 2025

A Comprehensive Survey on Video Scene Parsing:Advances, Challenges, and Prospects

Guohuan Xie

Syed Ariff Syed Hesham

166

16 Jun 2025

SAM2Auto: Auto Annotation Using FLASH

Arash Rocky

Q.M. Jonathan Wu

VGen VLM

219

09 Jun 2025

SAM-I2V: Upgrading SAM to Support Promptable Video Segmentation with Less than 0.2% Training CostComputer Vision and Pattern Recognition (CVPR), 2025

247

02 Jun 2025

Reasoning Segmentation for Images and Videos: A Survey

423

24 May 2025

Learning Streaming Video Representation via Multitask Training

498

28 Apr 2025

ZS-VCOS: Zero-Shot Video Camouflaged Object Segmentation By Optical Flow and Open Vocabulary Object Detection

434

10 Apr 2025

Segment Anything, Even OccludedComputer Vision and Pattern Recognition (CVPR), 2025

309

08 Mar 2025

Omni-RGPT: Unifying Image and Video Region-level Understanding via Token MarksComputer Vision and Pattern Recognition (CVPR), 2025

Subhashree Radhakrishnan

529

14 Jan 2025

EdgeTAM: On-Device Track Anything ModelComputer Vision and Pattern Recognition (CVPR), 2025

...

Raghuraman Krishnamoorthi

309

13 Jan 2025

Towards Open-Vocabulary Video Semantic SegmentationIEEE transactions on multimedia (IEEE TMM), 2024

334

12 Dec 2024

Advancing Myopia To Holism: Fully Contrastive Language-Image Pre-trainingComputer Vision and Pattern Recognition (CVPR), 2024

...

370

30 Nov 2024

OVT-B: A New Large-Scale Benchmark for Open-Vocabulary Multi-Object TrackingNeural Information Processing Systems (NeurIPS), 2024

Haiji Liang

Ruize Han

VLM

349

23 Oct 2024

Configurable Embodied Data Generation for Class-Agnostic RGB-D Video SegmentationIEEE Robotics and Automation Letters (RA-L), 2024

Anthony Opipari

Aravindhan K. Krishnan

Odest Chadwicke Jenkins

VOS

255

16 Oct 2024

SAM 2: Segment Anything in Images and VideosInternational Conference on Learning Representations (ICLR), 2024

...

Piotr Dollár

Christoph Feichtenhofer

VLM MLLM

492

2,187

01 Aug 2024

Open-Vocabulary Audio-Visual Semantic Segmentation

250

31 Jul 2024

OCTrack: Benchmarking the Open-Corpus Multi-Object Tracking

277

19 Jul 2024

ViLLa: Video Reasoning Segmentation with Large Language Model

Yu Qiao

506

18 Jul 2024

VISA: Reasoning Video Object Segmentation via Large Language Models

Yao Hu

237

16 Jul 2024

Unified Embedding Alignment for Open-Vocabulary Video Instance Segmentation

331

10 Jul 2024

DENOISER: Rethinking the Robustness for Open-Vocabulary Action Recognition

232

23 Apr 2024

CLIP-VIS: Adapting CLIP for Open-Vocabulary Video Instance Segmentation

Wenqi Zhu

Jiale Cao

Jin Xie

Shuangming Yang

Yanwei Pang

VLM CLIP

290

19 Mar 2024

Instance Brownian Bridge as Texts for Open-vocabulary Video Instance Segmentation

268

18 Jan 2024

General Object Foundation Model for Images and Videos at ScaleComputer Vision and Pattern Recognition (CVPR), 2023

339

14 Dec 2023

A Survey on Open-Vocabulary Detection and Segmentation: Past, Present, and FutureIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Chaoyang Zhu

Long Chen

ObjD VLM

510

18 Jul 2023

Towards Open Vocabulary Learning: A SurveyIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Xiangtai Li

...

Jiangning Zhang

406

218

28 Jun 2023

OpenVIS: Open-vocabulary Video Instance SegmentationAAAI Conference on Artificial Intelligence (AAAI), 2023

Tianjun Xiao

Zhaoyu Chen

Wenqiang Zhang

VLM

226

26 May 2023

PiClick: Picking the desired mask from multiple candidates in click-based interactive segmentationNeurocomputing (Neurocomputing), 2023

Yao Hu

Xu Tang

Guoliang Kang

E. Gavves

VLM

273

23 Apr 2023