v1v2 (latest)

Towards Omnimodal Expressions and Reasoning in Referring Audio-Visual Segmentation

30 July 2025

Papers citing "Towards Omnimodal Expressions and Reasoning in Referring Audio-Visual Segmentation"

3 / 3 papers shown

Title
MOSEv2: A More Challenging Dataset for Video Object Segmentation in Complex Scenes Henghui Ding Kaining Ying Chang-rui Liu Shuting He Xudong Jiang Yu-Gang Jiang Juil Sock Song Bai VOS 144 14 0 07 Aug 2025
Multimodal Referring Segmentation: A Survey Henghui Ding Song Tang Shuting He Chang-rui Liu Zuxuan Wu Yu-Gang Jiang 181 6 0 01 Aug 2025
MOVE: Motion-Guided Few-Shot Video Object Segmentation Kaining Ying Hengrui Hu Henghui Ding VOS 123 3 0 29 Jul 2025