SoundBeam: Target sound extraction conditioned on sound-class labels and enrollment clues for increased performance and continuous learning

8 April 2022

Marc Delcroix

Jorge Bennasar Vázquez

Papers citing "SoundBeam: Target sound extraction conditioned on sound-class labels and enrollment clues for increased performance and continuous learning"

23 / 23 papers shown

Title
Listen to Extract: Onset-Prompted Target Speaker Extraction Pengjie Shen Kangrui Chen Shulin He Pengru Chen Shuqi Yuan He Kong Xueliang Zhang Z. Wang 41 0 0 08 May 2025
Assessing the Utility of Audio Foundation Models for Heart and Respiratory Sound Analysis Daisuke Niizumi Daiki Takeuchi Masahiro Yasuda Binh Thien Nguyen Yasunori Ohishi N. Harada 27 0 0 25 Apr 2025
Distance Based Single-Channel Target Speech Extraction Runwu Shi Benjamin Yen Kazuhiro Nakadai 23 0 0 31 Dec 2024
Task-Aware Unified Source Separation Kohei Saijo Janek Ebbers François G. Germain G. Wichern Jonathan Le Roux 24 1 0 31 Oct 2024
SoundBeam meets M2D: Target Sound Extraction with Audio Foundation Model Carlos Hernandez-Olivan Marc Delcroix Tsubasa Ochiai Daisuke Niizumi Naohiro Tawara Tomohiro Nakatani Shoko Araki 26 2 0 19 Sep 2024
Multichannel-to-Multichannel Target Sound Extraction Using Direction and Timestamp Clues Dayun Choi Jung-Woo Choi 21 0 0 19 Sep 2024
Language-Queried Target Sound Extraction Without Parallel Training Data Hao Ma Zhiyuan Peng Xu Li Yukai Li Mingjie Shao Qiuqiang Kong Ju Liu VLM 67 1 0 14 Sep 2024
DENSE: Dynamic Embedding Causal Target Speech Extraction Yiwen Wang Zeyu Yuan Xihong Wu 33 0 0 10 Sep 2024
Cross-attention Inspired Selective State Space Models for Target Sound Extraction Donghang Wu Yiwen Wang Xihong Wu T. Qu Mamba 26 3 0 07 Sep 2024
Interaural time difference loss for binaural target sound extraction Carlos Hernandez-Olivan Marc Delcroix Tsubasa Ochiai Naohiro Tawara Tomohiro Nakatani Shoko Araki 19 1 0 01 Aug 2024
TSE-PI: Target Sound Extraction under Reverberant Environments with Pitch Information Yiwen Wang Xihong Wu 33 2 0 13 Jun 2024
CATSE: A Context-Aware Framework for Causal Target Sound Extraction Shrishail Baligar M. Kegler Bryce Irvin Marko Stamenovic Shawn Newsam 28 0 0 21 Mar 2024
Audio Prompt Tuning for Universal Sound Separation Yuzhuo Liu Xubo Liu Yan Zhao Yuanyuan Wang Rui Xia Pingchuan Tain Yuxuan Wang VLM 9 5 0 30 Nov 2023
Semantic Hearing: Programming Acoustic Scenes with Binaural Hearables Bandhav Veluri Malek Itani Justin Chan Takuya Yoshioka Shyamnath Gollakota 15 15 0 01 Nov 2023
Typing to Listen at the Cocktail Party: Text-Guided Target Speaker Extraction Xiang Hao Jibin Wu Jianwei Yu Chenglin Xu Kay Chen Tan 16 10 0 11 Oct 2023
Separate Anything You Describe Xubo Liu Qiuqiang Kong Yan Zhao Haohe Liu Yiitan Yuan Yuzhuo Liu Rui Xia Yuxuan Wang Mark D. Plumbley Wenwu Wang VLM 17 43 0 09 Aug 2023
CAPTDURE: Captioned Sound Dataset of Single Sources Yuki Okamoto Kanta Shimonishi Keisuke Imoto Kota Dohi Shota Horiguchi Y. Kawaguchi 11 1 0 28 May 2023
Universal Source Separation with Weakly Labelled Data Qiuqiang Kong K. Chen Haohe Liu Xingjian Du Taylor Berg-Kirkpatrick Shlomo Dubnov Mark D. Plumbley 11 17 0 11 May 2023
Real-Time Target Sound Extraction Bandhav Veluri Justin Chan Malek Itani Tuochao Chen Takuya Yoshioka Shyamnath Gollakota 25 29 0 04 Nov 2022
ConceptBeam: Concept Driven Target Speech Extraction Yasunori Ohishi Marc Delcroix Tsubasa Ochiai S. Araki Daiki Takeuchi Daisuke Niizumi Akisato Kimura N. Harada K. Kashino 18 18 0 25 Jul 2022
USEV: Universal Speaker Extraction with Visual Cue Zexu Pan Meng Ge Haizhou Li 13 41 0 30 Sep 2021
Source separation with weakly labelled data: An approach to computational auditory scene analysis Qiuqiang Kong Yuxuan Wang Xuchen Song Yin Cao Wenwu Wang Mark D. Plumbley 11 43 0 06 Feb 2020
Deep Extractor Network for Target Speaker Recovery From Single Channel Speech Mixtures J. Wang Jie Chen Dan Su Lianwu Chen Meng Yu Y. Qian Dong Yu 29 90 0 24 Jul 2018