Metric-oriented Speech Enhancement using Diffusion Probabilistic Model

Metric-oriented Speech Enhancement using Diffusion Probabilistic Model

23 February 2023

Chen Chen

Yuchen Hu

Papers citing "Metric-oriented Speech Enhancement using Diffusion Probabilistic Model"

15 / 15 papers shown

Title
GenTranslate: Large Language Models are Generative Multilingual Speech and Machine Translators Yuchen Hu Chen Chen Chao-Han Huck Yang Ruizhe Li Dong Zhang Zhehuai Chen E. Chng 13 7 0 10 Feb 2024
Investigating the Design Space of Diffusion Models for Speech Enhancement Philippe Gonzalez Zheng-Hua Tan Jan Østergaard Jesper Jensen T. S. Alstrøm Tobias May DiffM 15 5 0 07 Dec 2023
Diffusion-Based Speech Enhancement in Matched and Mismatched Conditions Using a Heun-Based Sampler Philippe Gonzalez Zheng-Hua Tan Jan Østergaard Jesper Jensen T. S. Alstrøm Tobias May DiffM 13 2 0 05 Dec 2023
Noise-aware Speech Enhancement using Diffusion Probabilistic Model Yuchen Hu Cheng Chen Ruizhe Li Qiu-shi Zhu E. Chng DiffM 6 9 0 16 Jul 2023
MIR-GAN: Refining Frame-Level Modality-Invariant Representations with Adversarial Network for Audio-Visual Speech Recognition Yuchen Hu Chen Chen Ruizhe Li Heqing Zou Chng Eng Siong GAN 34 9 0 18 Jun 2023
Hearing Lips in Noise: Universal Viseme-Phoneme Mapping and Transfer for Robust Audio-Visual Speech Recognition Yuchen Hu Ruizhe Li Cheng Chen Chengwei Qin Qiu-shi Zhu E. Chng 16 5 0 18 Jun 2023
Noise-Aware Speech Separation with Contrastive Learning Zizheng Zhang Cheng Chen Hsin-Hung Chen Xiang Liu Yuchen Hu E. Chng 10 5 0 18 May 2023
Diffusion-Based Speech Enhancement with Joint Generative and Predictive Decoders Hao Shi Kazuki Shimada M. Hirano Takashi Shibuya Yuichiro Koyama Zhi-Wei Zhong Shusuke Takahashi Tatsuya Kawahara Yuki Mitsufuji DiffM 12 14 0 18 May 2023
Cross-Modal Global Interaction and Local Alignment for Audio-Visual Speech Recognition Yuchen Hu Ruizhe Li Chen Chen Heqing Zou Qiu-shi Zhu E. Chng 18 4 0 16 May 2023
Wav2code: Restore Clean Speech Representations via Codebook Lookup for Noise-Robust ASR Yuchen Hu Cheng Chen Qiu-shi Zhu E. Chng 12 15 0 11 Apr 2023
Time-domain Speech Enhancement Assisted by Multi-resolution Frequency Encoder and Decoder Hao Shi Masato Mimura Longbiao Wang J. Dang Tatsuya Kawahara 15 13 0 26 Mar 2023
Gradient Remedy for Multi-Task Learning in End-to-End Noise-Robust Speech Recognition Yuchen Hu Chen Chen Ruizhe Li Qiu-shi Zhu E. Chng 10 15 0 22 Feb 2023
Unifying Speech Enhancement and Separation with Gradient Modulation for End-to-End Noise-Robust Speech Separation Yuchen Hu Chen Chen Heqing Zou Xionghu Zhong Chng Eng Siong 40 16 0 22 Feb 2023
Robust Data2vec: Noise-robust Speech Representation Learning for ASR by Combining Regression and Improved Contrastive Learning Qiu-shi Zhu Long Zhou Jie M. Zhang Shujie Liu Yu-Chen Hu Lirong Dai VLM SSL 40 36 0 27 Oct 2022
Diffusion Probabilistic Models for 3D Point Cloud Generation Shitong Luo Wei Hu 3DPC 164 711 0 02 Mar 2021