v1v2 (latest)

Improving Audio-Visual Segmentation with Bidirectional Generation

AAAI Conference on Artificial Intelligence (AAAI), 2023

16 August 2023

Yuchao Dai

Papers citing "Improving Audio-Visual Segmentation with Bidirectional Generation"

29 / 29 papers shown

Complementary and Contrastive Learning for Audio-Visual SegmentationIEEE transactions on multimedia (TMM), 2025

238

11 Oct 2025

Frequency-Domain Decomposition and Recomposition for Robust Audio-Visual Segmentation

205

23 Sep 2025

Multimodal Referring Segmentation: A Survey

379

01 Aug 2025

Implicit Counterfactual Learning for Audio-Visual Segmentation

163

28 Jul 2025

AuralSAM2: Enabling SAM2 Hear Through Pyramid Audio-Visual Feature Prompting

299

01 Jun 2025

HAVT-IVD: Heterogeneity-Aware Cross-Modal Network for Audio-Visual Surveillance: Idling Vehicles Detection With Multichannel Audio and Multiscale Visual Cues

Xiwen Li

Ross T. Whitaker

Tolga Tasdizen

278

15 Apr 2025

Dynamic Derivation and Elimination: Audio Visual Segmentation with Enhanced Audio SemanticsComputer Vision and Pattern Recognition (CVPR), 2025

330

17 Mar 2025

Robust Audio-Visual Segmentation via Audio-Guided Visual Convergent AlignmentComputer Vision and Pattern Recognition (CVPR), 2025

227

17 Mar 2025

AVS-Mamba: Exploring Temporal and Multi-modal Mamba for Audio-Visual SegmentationIEEE transactions on multimedia (TMM), 2025

133

14 Jan 2025

Towards Open-Vocabulary Audio-Visual Event LocalizationComputer Vision and Pattern Recognition (CVPR), 2024

497

18 Nov 2024

3D Audio-Visual Segmentation

273

04 Nov 2024

AVESFormer: Efficient Transformer Design for Real-Time Audio-Visual Segmentation

230

03 Aug 2024

Unveiling and Mitigating Bias in Audio Visual Segmentation

Peiwen Sun

Honggang Zhang

Di Hu

245

23 Jul 2024

Stepping Stones: A Progressive Training Strategy for Audio-Visual Semantic Segmentation

322

16 Jul 2024

Can Textual Semantics Mitigate Sounding Object Segmentation Preference?

312

15 Jul 2024

CPM: Class-conditional Prompting Machine for Audio-visual Segmentation

319

07 Jul 2024

Progressive Confident Masking Attention Network for Audio-Visual Segmentation

Yuxuan Wang

Feng Dong

Jinchao Zhu

Shuyue Zhu

VOS

383

04 Jun 2024

TAVGBench: Benchmarking Text to Audible-Video Generation

Zhen Qin

183

22 Apr 2024

Unsupervised Audio-Visual Segmentation with Modality Alignment

189

21 Mar 2024

Multi-modal Instruction Tuned LLMs with Fine-grained Visual Perception

Jun-Yan He

Yifan Wang

Lijun Wang

Huchuan Lu

Jun-Yan He

224

05 Mar 2024

Bootstrapping Audio-Visual Segmentation by Strengthening Audio Cues

224

04 Feb 2024

Lightning Attention-2: A Free Lunch for Handling Unlimited Sequence Lengths in Large Language Models

Zhen Qin

280

09 Jan 2024

Cooperation Does Matter: Exploring Multi-Order Bilateral Relations for Audio-Visual Segmentation

Pengfei Gao

Pengfei Yan

203

11 Dec 2023

Cross-modal Cognitive Consensus guided Audio-Visual SegmentationIEEE transactions on multimedia (IEEE TMM), 2023

Zhaofeng Shi

Qingbo Wu

Fanman Meng

Linfeng Xu

Hongliang Li

VOS

394

10 Oct 2023

QDFormer: Towards Robust Audiovisual Segmentation in Complex Environments with Quantization-based Semantic DecompositionComputer Vision and Pattern Recognition (CVPR), 2023

Xiang Li

Bhiksha Raj

361

29 Sep 2023

Leveraging Foundation models for Unsupervised Audio-Visual Segmentation

209

13 Sep 2023

Contrastive Conditional Latent Diffusion for Audio-visual SegmentationIEEE Transactions on Image Processing (IEEE TIP), 2023

382

31 Jul 2023

Exploring Transformer ExtrapolationAAAI Conference on Artificial Intelligence (AAAI), 2023

Zhen Qin

Yiran Zhong

Huiyuan Deng

139

19 Jul 2023

Unraveling Instance Associations: A Closer Look for Audio-Visual SegmentationComputer Vision and Pattern Recognition (CVPR), 2023

Hu Wang

318

06 Apr 2023