Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2309.08408
Cited By

Audio-Visual Active Speaker Extraction for Sparsely Overlapped
Multi-talker Speech

Audio-Visual Active Speaker Extraction for Sparsely Overlapped Multi-talker Speech

IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

15 September 2023

Shuai Wang

Haizhou Li

ArXiv (abs)PDF HTML

Papers citing "Audio-Visual Active Speaker Extraction for Sparsely Overlapped Multi-talker Speech"

2 / 2 papers shown

M3ANet: Multi-scale and Multi-Modal Alignment Network for Brain-Assisted Target Speaker Extraction

M3ANet: Multi-scale and Multi-Modal Alignment Network for Brain-Assisted Target Speaker ExtractionInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

171

3

0

31 May 2025

On the effectiveness of enrollment speech augmentation for Target
Speaker Extraction

On the effectiveness of enrollment speech augmentation for Target Speaker ExtractionSpoken Language Technology Workshop (SLT), 2024

Junjie Li

Ke Zhang

Shuai Wang

Haizhou Li

142

9

0

15 Sep 2024