BAVS: Bootstrapping Audio-Visual Segmentation by Integrating Foundation Knowledge

IEEE transactions on multimedia (IEEE TMM), 2023

20 August 2023

Zi Huang

Papers citing "BAVS: Bootstrapping Audio-Visual Segmentation by Integrating Foundation Knowledge"

22 / 22 papers shown

Title
Complementary and Contrastive Learning for Audio-Visual SegmentationIEEE transactions on multimedia (TMM), 2025 Sitong Gong Yunzhi Zhuge Lu Zhang Pingping Zhang Huchuan Lu VOS 194 3 0 11 Oct 2025
TEn-CATG:Text-Enriched Audio-Visual Video Parsing with Multi-Scale Category-Aware Temporal Graph Yaru Chen Faegheh Sardari Peiliang Zhang Ruohao Guo Yang Xiang Zhenbo Li Wenwu Wang 180 0 0 04 Sep 2025
Multimodal Referring Segmentation: A Survey Henghui Ding Song Tang Shuting He Chang-rui Liu Zuxuan Wu Yu-Gang Jiang 346 10 0 01 Aug 2025
From Waveforms to Pixels: A Survey on Audio-Visual Segmentation Jia Li Yapeng Tian VOS 198 2 0 29 Jul 2025
Implicit Counterfactual Learning for Audio-Visual Segmentation Mingfeng Zha Tianyu Li G. Wang Peng Wang Yangyang Wu Yang Yang Heng Tao Shen VOS CML 138 1 0 28 Jul 2025
AuralSAM2: Enabling SAM2 Hear Through Pyramid Audio-Visual Feature Prompting Yuyuan Liu Yuanhong Chen Chong Wang Junlin Han Junde Wu Can Peng Jingkun Chen Yu Tian Gustavo Carneiro VLM 271 0 0 01 Jun 2025
Dynamic Derivation and Elimination: Audio Visual Segmentation with Enhanced Audio SemanticsComputer Vision and Pattern Recognition (CVPR), 2025 Chen Liu Liying Yang Peike Li Dadong Wang Lincheng Li Xin Yu VOS 285 3 0 17 Mar 2025
Robust Audio-Visual Segmentation via Audio-Guided Visual Convergent AlignmentComputer Vision and Pattern Recognition (CVPR), 2025 Chen Liu Peike Li Liying Yang Dadong Wang Lincheng Li Xin Yu VOS 199 2 0 17 Mar 2025
Crab: A Unified Audio-Visual Scene Understanding Model with Explicit CooperationComputer Vision and Pattern Recognition (CVPR), 2025 Henghui Du Guangyao Li Chang Zhou Chunjie Zhang Alan Zhao D. Hu 212 11 0 17 Mar 2025
AVS-Mamba: Exploring Temporal and Multi-modal Mamba for Audio-Visual SegmentationIEEE transactions on multimedia (TMM), 2025 Sitong Gong Yunzhi Zhuge Lu Zhang Yifan Wang Pingping Zhang Lijun Wang Huchuan Lu Mamba VOS 101 13 0 14 Jan 2025
3D Audio-Visual Segmentation Artem Sokolov Swapnil Bhosale Xiatian Zhu VOS 226 3 0 04 Nov 2024
Locality-aware Cross-modal Correspondence Learning for Dense Audio-Visual Events Localization Ling Xing Hongyu Qu Rui Yan Xiangbo Shu Jinhui Tang 498 8 0 12 Sep 2024
Unleashing the Temporal-Spatial Reasoning Capacity of GPT for Training-Free Audio and Language Referenced Video Object SegmentationAAAI Conference on Artificial Intelligence (AAAI), 2024 Shaofei Huang Rui Ling Hongyu Li Tianrui Hui Zongheng Tang Xiaoming Wei Jizhong Han Si Liu VOS 222 17 0 28 Aug 2024
AVESFormer: Efficient Transformer Design for Real-Time Audio-Visual Segmentation Zili Wang Qi Yang Linsu Shi Jiazhong Yu M. Tanveer Fei Li Shiming Xiang VOS 202 4 0 03 Aug 2024
Can Textual Semantics Mitigate Sounding Object Segmentation Preference? Yaoting Wang Peiwen Sun Yuanchao Li Honggang Zhang Di Hu 292 12 0 15 Jul 2024
CPM: Class-conditional Prompting Machine for Audio-visual Segmentation Yuanhong Chen Chong Wang Yuyuan Liu Hu Wang Gustavo Carneiro 287 10 0 07 Jul 2024
Unsupervised Audio-Visual Segmentation with Modality Alignment Swapnil Bhosale Haosen Yang Helen Treharne Jiangkang Deng Xiatian Zhu VOS 160 8 0 21 Mar 2024
Bootstrapping Audio-Visual Segmentation by Strengthening Audio Cues Tianxiang Chen Zhentao Tan Tao Gong Qi Chu Yue-bo Wu Bin Liu Le Lu Jieping Ye Nenghai Yu VOS 202 9 0 04 Feb 2024
Cooperation Does Matter: Exploring Multi-Order Bilateral Relations for Audio-Visual Segmentation Qi Yang Xing Nie Tong Li Pengfei Gao Ying Guo Cheng Zhen Pengfei Yan Shiming Xiang VOS 174 24 0 11 Dec 2023
Cross-modal Cognitive Consensus guided Audio-Visual SegmentationIEEE transactions on multimedia (IEEE TMM), 2023 Zhaofeng Shi Qingbo Wu Fanman Meng Linfeng Xu Hongliang Li VOS 318 8 0 10 Oct 2023
Leveraging Foundation models for Unsupervised Audio-Visual Segmentation Swapnil Bhosale Haosen Yang Helen Treharne Xiatian Zhu VOS 181 6 0 13 Sep 2023
Unraveling Instance Associations: A Closer Look for Audio-Visual SegmentationComputer Vision and Pattern Recognition (CVPR), 2023 Yuanhong Chen Yuyuan Liu Hu Wang Fengbei Liu Chong Wang Helen Frazer G. Carneiro VOS 257 34 0 06 Apr 2023