VoiceFixer: Toward General Speech Restoration with Neural Vocoder

VoiceFixer: Toward General Speech Restoration with Neural Vocoder

28 September 2021

Chuanzeng Huang

Yuxuan Wang

Papers citing "VoiceFixer: Toward General Speech Restoration with Neural Vocoder"

16 / 16 papers shown

Title
Muyan-TTS: A Trainable Text-to-Speech Model Optimized for Podcast Scenarios with a $50K Budget$ Xin Li Kaikai Jia Hao Sun Jun Dai Z. L. Jiang 123 0 0 27 Apr 2025
FlashSR: One-step Versatile Audio Super-resolution via Diffusion Distillation Jaekwon Im Juhan Nam DiffM 45 0 0 18 Jan 2025
Single-Channel Robot Ego-Speech Filtering during Human-Robot Interaction Yue Li Koen V. Hindriks Florian A. Kunneman 27 2 0 05 Mar 2024
AudioLDM 2: Learning Holistic Audio Generation with Self-supervised Pretraining Haohe Liu Yiitan Yuan Xubo Liu Xinhao Mei Qiuqiang Kong Qiao Tian Yuping Wang Wenwu Wang Yuxuan Wang Mark D. Plumbley DiffM 25 221 0 10 Aug 2023
ResGrad: Residual Denoising Diffusion Probabilistic Models for Text to Speech Ze Chen Yihan Wu Yichong Leng Jiawei Chen Haohe Liu ... Ke Wang Lei He Sheng Zhao Jiang Bian Danilo P. Mandic DiffM 22 22 0 30 Dec 2022
ReVISE: Self-Supervised Speech Resynthesis with Visual Input for Universal and Generalized Speech Enhancement Wei-Ning Hsu Tal Remez Bowen Shi Jacob Donley Yossi Adi DiffM 27 11 0 21 Dec 2022
Neural Vocoder Feature Estimation for Dry Singing Voice Separation Jae-Yeol Im Soonbeom Choi Sangeon Yong Juhan Nam 13 1 0 29 Nov 2022
Analysing Diffusion-based Generative Approaches versus Discriminative Approaches for Speech Restoration Jean-Marie Lemercier Julius Richter Simon Welker Timo Gerkmann DiffM 23 34 0 04 Nov 2022
Hierarchical Diffusion Models for Singing Voice Neural Vocoder Naoya Takahashi Mayank Kumar Singh Yuki Mitsufuji DiffM 13 16 0 14 Oct 2022
WaveFit: An Iterative and Non-autoregressive Neural Vocoder based on Fixed-Point Iteration Yuma Koizumi Kohei Yatabe Heiga Zen M. Bacchiani DiffM 42 29 0 03 Oct 2022
NU-Wave 2: A General Neural Audio Upsampling Model for Various Sampling Rates Seungu Han Junhyeok Lee DiffM 20 41 0 17 Jun 2022
FFC-SE: Fast Fourier Convolution for Speech Enhancement Ivan Shchekotov Pavel Andreev Oleg Ivanov Aibek Alanov Dmitry Vetrov 8 23 0 06 Apr 2022
SpecGrad: Diffusion Probabilistic Model based Neural Vocoder with Adaptive Noise Spectral Shaping Yuma Koizumi Heiga Zen Kohei Yatabe Nanxin Chen M. Bacchiani DiffM 23 45 0 31 Mar 2022
HiFi++: a Unified Framework for Bandwidth Extension and Speech Enhancement Pavel Andreev Aibek Alanov Oleg Ivanov Dmitry Vetrov 25 38 0 24 Mar 2022
CWS-PResUNet: Music Source Separation with Channel-wise Subband Phase-aware ResUNet Haohe Liu Qiuqiang Kong Jiafeng Liu 22 24 0 09 Dec 2021
Decoupling Magnitude and Phase Estimation with Deep ResUNet for Music Source Separation Qiuqiang Kong Yin Cao Haohe Liu Keunwoo Choi Yuxuan Wang 116 96 0 12 Sep 2021