v1v2 (latest)

Two-Step Sound Source Separation: Training on Learned Latent Targets

IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2019

22 October 2019

Efthymios Tzinis

Shrikant Venkataramani

Papers citing "Two-Step Sound Source Separation: Training on Learned Latent Targets"

35 / 35 papers shown

Learning Linearity in Audio Consistency Autoencoders via Implicit Regularization

Bernardo Torres

Manuel Moussallam

Gabriel Meseguer-Brocal

216

27 Oct 2025

Neural Speech Separation with Parallel Amplitude and Phase Spectrum Estimation

Fei Liu

Yang Ai

Zhen-Hua Ling

113

17 Sep 2025

Advances in Speech Separation: Techniques, Challenges, and Future Trends

...

119

14 Aug 2025

A Reference-free Metric for Language-Queried Audio Source Separation using Contrastive Language-Audio Pretraining

Wenwu Wang

322

06 Jul 2024

Papez: Resource-Efficient Speech Separation with Auditory Working Memory

Hyunseok Oh

Juheon Yi

Youngki Lee

188

01 Jul 2024

SoundCount: Sound Counting from Raw Audio with Dyadic Decomposition Neural Network

193

26 Dec 2023

Speech Separation based on Contrastive Learning and Deep Modularization

Peter Ochieng

SSL

270

18 May 2023

Learning Semantic-Agnostic and Spatial-Aware Representation for Generalizable Visual-Audio NavigationIEEE Robotics and Automation Letters (RA-L), 2023

388

21 Apr 2023

Scaling strategies for on-device low-complexity source separation with Conv-Tasnet

Mohamed Nabih Ali

Francesco Paissan

Daniele Falavigna

Alessio Brutti

149

06 Mar 2023

MossFormer: Pushing the Performance Limit of Monaural Speech Separation using Gated Single-Head Transformer with Convolution-Augmented Joint Self-AttentionsIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

Shengkui Zhao

Bin Ma

213

23 Feb 2023

Deep neural network techniques for monaural speech enhancement: state of the art analysisArtificial Intelligence Review (Artif Intell Rev), 2022

P. Ochieng

269

01 Dec 2022

Latent Iterative Refinement for Modular Source SeparationIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

169

22 Nov 2022

Speech Enhancement with Fullband-Subband Cross-Attention NetworkInterspeech (Interspeech), 2022

Jun Chen

Zhiyong Wu

112

10 Nov 2022

AudioScopeV2: Audio-Visual Attention Architectures for Calibrated Open-Domain On-Screen Sound SeparationEuropean Conference on Computer Vision (ECCV), 2022

297

20 Jul 2022

SATTS: Speaker Attractor Text to Speech, Learning to Speak by Learning to SeparateInterspeech (Interspeech), 2022

Nabarun Goswami

Tatsuya Harada

162

13 Jul 2022

Tiny-Sepformer: A Tiny Time-Domain Transformer Network for Speech SeparationInterspeech (Interspeech), 2022

152

28 Jun 2022

Resource-Efficient Separation TransformerIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Mirco Ravanelli

178

19 Jun 2022

FullSubNet+: Channel Attention FullSubNet with Complex Spectrograms for Speech EnhancementIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Jun Chen

Zehao Wang

Deyi Tuo

Zhiyong Wu

Shiyin Kang

Helen Meng

206

137

23 Mar 2022

RemixIT: Continual self-training of speech enhancement models via bootstrapped remixingIEEE Journal on Selected Topics in Signal Processing (IEEE JSTSP), 2022

Yossi Adi

225

17 Feb 2022

Exploring Self-Attention Mechanisms for Speech SeparationIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2022

Mirco Ravanelli

233

06 Feb 2022

Speech Separation Using an Asynchronous Fully Recurrent Convolutional Neural NetworkNeural Information Processing Systems (NeurIPS), 2021

156

04 Dec 2021

REAL-M: Towards Speech Separation on Real MixturesIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

Cem Subakan

Mirco Ravanelli

Samuele Cornell

François Grondin

161

20 Oct 2021

Stepwise-Refining Speech Separation Network via Fine-Grained Encoding in High-order Latent DomainIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2021

Zengwei Yao

192

10 Oct 2021

Multi-channel Speech Enhancement with 2-D Convolutional Time-frequency Domain Features and a Pre-trained Acoustic ModelAsia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), 2021

Liyong Guo

Yujun Wang

234

23 Jul 2021

Improving On-Screen Sound Separation for Open-Domain Videos with Audio-Visual Self-Attention

246

17 Jun 2021

Teacher-Student MixIT for Unsupervised and Semi-supervised Speech SeparationInterspeech (Interspeech), 2021

Jisi Zhang

Catalin Zorila

R. Doddipatla

Jon Barker

140

15 Jun 2021

Compute and memory efficient universal sound source separationJournal of Signal Processing Systems (JSPS), 2021

Efthymios Tzinis

Zhepei Wang

Xilin Jiang

Paris Smaragdis

194

03 Mar 2021

What's All the FUSS About Free Universal Sound Separation Data?IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2020

246

02 Nov 2020

Unified Gradient Reweighting for Model Biasing with Applications to Source SeparationIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2020

Efthymios Tzinis

Dimitrios Bralios

Paris Smaragdis

296

25 Oct 2020

Attention is All You Need in Speech SeparationIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2020

Mirco Ravanelli

289

699

25 Oct 2020

Sudo rm -rf: Efficient Networks for Universal Audio Source SeparationInternational Workshop on Machine Learning for Signal Processing (MLSP), 2020

Efthymios Tzinis

Zhepei Wang

Paris Smaragdis

230

150

14 Jul 2020

Revisiting Representation Learning for Singing Voice Separation with Sinkhorn Distances

S. I. Mimilakis

Konstantinos Drossos

G. Schuller

152

06 Jul 2020

Depthwise Separable Convolutions Versus Recurrent Neural Networks for Monaural Singing Voice Separation

140

06 Jul 2020

Asteroid: the PyTorch-based audio source separation toolkit for researchers

...

Antoine Deleforge

250

170

08 May 2020

Unsupervised Interpretable Representation Learning for Singing Voice SeparationEuropean Signal Processing Conference (EUSIPCO), 2020

S. I. Mimilakis

Konstantinos Drossos

G. Schuller

252

03 Mar 2020