BAVS: Bootstrapping Audio-Visual Segmentation by Integrating Foundation Knowledge

IEEE transactions on multimedia (IEEE TMM), 2023

20 August 2023

Zi Huang

Papers citing "BAVS: Bootstrapping Audio-Visual Segmentation by Integrating Foundation Knowledge"

22 / 22 papers shown

Complementary and Contrastive Learning for Audio-Visual SegmentationIEEE transactions on multimedia (TMM), 2025

238

11 Oct 2025

TEn-CATG:Text-Enriched Audio-Visual Video Parsing with Multi-Scale Category-Aware Temporal Graph

197

04 Sep 2025

Multimodal Referring Segmentation: A Survey

382

01 Aug 2025

From Waveforms to Pixels: A Survey on Audio-Visual Segmentation

Jia Li

Yapeng Tian

VOS

218

29 Jul 2025

Implicit Counterfactual Learning for Audio-Visual Segmentation

163

28 Jul 2025

AuralSAM2: Enabling SAM2 Hear Through Pyramid Audio-Visual Feature Prompting

299

01 Jun 2025

Dynamic Derivation and Elimination: Audio Visual Segmentation with Enhanced Audio SemanticsComputer Vision and Pattern Recognition (CVPR), 2025

330

17 Mar 2025

Robust Audio-Visual Segmentation via Audio-Guided Visual Convergent AlignmentComputer Vision and Pattern Recognition (CVPR), 2025

230

17 Mar 2025

Crab: A Unified Audio-Visual Scene Understanding Model with Explicit CooperationComputer Vision and Pattern Recognition (CVPR), 2025

260

17 Mar 2025

AVS-Mamba: Exploring Temporal and Multi-modal Mamba for Audio-Visual SegmentationIEEE transactions on multimedia (TMM), 2025

133

14 Jan 2025

3D Audio-Visual Segmentation

273

04 Nov 2024

Locality-aware Cross-modal Correspondence Learning for Dense Audio-Visual Events Localization

567

12 Sep 2024

Unleashing the Temporal-Spatial Reasoning Capacity of GPT for Training-Free Audio and Language Referenced Video Object SegmentationAAAI Conference on Artificial Intelligence (AAAI), 2024

Shaofei Huang

Rui Ling

Hongyu Li

Tianrui Hui

Zongheng Tang

Xiaoming Wei

Jizhong Han

Si Liu

VOS

242

28 Aug 2024

AVESFormer: Efficient Transformer Design for Real-Time Audio-Visual Segmentation

230

03 Aug 2024

Can Textual Semantics Mitigate Sounding Object Segmentation Preference?

313

15 Jul 2024

CPM: Class-conditional Prompting Machine for Audio-visual Segmentation

319

07 Jul 2024

Unsupervised Audio-Visual Segmentation with Modality Alignment

189

21 Mar 2024

Bootstrapping Audio-Visual Segmentation by Strengthening Audio Cues

227

04 Feb 2024

Cooperation Does Matter: Exploring Multi-Order Bilateral Relations for Audio-Visual Segmentation

Pengfei Gao

Pengfei Yan

203

11 Dec 2023

Cross-modal Cognitive Consensus guided Audio-Visual SegmentationIEEE transactions on multimedia (IEEE TMM), 2023

Zhaofeng Shi

Qingbo Wu

Fanman Meng

Linfeng Xu

Hongliang Li

VOS

395

10 Oct 2023

Leveraging Foundation models for Unsupervised Audio-Visual Segmentation

213

13 Sep 2023

Unraveling Instance Associations: A Closer Look for Audio-Visual SegmentationComputer Vision and Pattern Recognition (CVPR), 2023

Hu Wang

318

06 Apr 2023