DNSMOS P.835: A Non-Intrusive Perceptual Objective Speech Quality Metric to Evaluate Noise Suppressors

5 October 2021

Papers citing "DNSMOS P.835: A Non-Intrusive Perceptual Objective Speech Quality Metric to Evaluate Noise Suppressors"

50 / 115 papers shown

Title
Teochew-Wild: The First In-the-wild Teochew Dataset with Orthographic Annotations Linrong Pan Chenglong Jiang Gaoze Hou Ying Gao 41 0 0 08 May 2025
Dopamine Audiobook: A Training-free MLLM Agent for Emotional and Human-like Audiobook Generation Yan Rong Shan Yang Guangzhi Lei Li Liu 23 0 0 15 Apr 2025
ALMTokenizer: A Low-bitrate and Semantic-rich Audio Codec Tokenizer for Audio Language Modeling Dongchao Yang Songxiang Liu Haohan Guo Jiankun Zhao Yuanyuan Wang ... Xubo Liu Xueyuan Chen Xu Tan Xixin Wu H. Meng 37 0 0 14 Apr 2025
DiTSE: High-Fidelity Generative Speech Enhancement via Latent Diffusion Transformers Heitor R. Guimarães Jiaqi Su Rithesh Kumar Tiago H. Falk Zeyu Jin DiffM 30 2 0 13 Apr 2025
LauraTSE: Target Speaker Extraction using Auto-Regressive Decoder-Only Language Models Beilong Tang Bang Zeng Ming Li AI4TS 34 0 0 10 Apr 2025
VoiceCraft-Dub: Automated Video Dubbing with Neural Codec Language Models Kim Sung-Bin Jeongsoo Choi Puyuan Peng Joon Son Chung Tae-Hyun Oh David F. Harwath VGen 45 1 0 03 Apr 2025
Magnitude-Phase Dual-Path Speech Enhancement Network based on Self-Supervised Embedding and Perceptual Contrast Stretch Boosting Alimjan Mattursun Liejun Wang Yinfeng Yu Chunyang Ma 49 0 0 27 Mar 2025
Wireless Hearables With Programmable Speech AI Accelerators Malek Itani Tuochao Chen Arun Raghavan Gavriel Kohlberg Shyamnath Gollakota AuLLM 56 0 0 24 Mar 2025
Are Deep Speech Denoising Models Robust to Adversarial Noise? Will Schwarzer Philip S. Thomas Andrea Fanelli Xiaoyu Liu 47 0 0 14 Mar 2025
ESPnet-SDS: Unified Toolkit and Demo for Spoken Dialogue Systems Siddhant Arora Yifan Peng Jiatong Shi Jinchuan Tian William Chen ... Yosuke Kashiwagi E. Tsunoo Shuichiro Shimizu Vaibhav Srivastav Shinji Watanabe 42 0 0 11 Mar 2025
CleanMel: Mel-Spectrogram Enhancement for Improving Both Speech Quality and ASR Nian Shao Rui Zhou Pengyu Wang Xian Li Ying Fang Yujie Yang Xiaofei Li 31 0 0 27 Feb 2025
Emilia: A Large-Scale, Extensive, Multilingual, and Diverse Dataset for Speech Generation Haorui He Zengqiang Shang Chaoren Wang Xuyuan Li Yicheng Gu ... Peiyang Shi Y. Wang Kai Chen Pengyuan Zhang Z. Wu AuLLM 50 3 0 28 Jan 2025
AnyEnhance: A Unified Generative Model with Prompt-Guidance and Self-Critic for Voice Enhancement Junan Zhang Jing Yang Zihao Fang Y. Wang Zehua Zhang Zhuo Wang Fan Fan Z. Wu 39 2 0 26 Jan 2025
AnCoGen: Analysis, Control and Generation of Speech with a Masked Autoencoder Samir Sadok Simon Leglaive Laurent Girin Gaël Richard Xavier Alameda-Pineda 50 1 0 10 Jan 2025
Reducing the Gap Between Pretrained Speech Enhancement and Recognition Models Using a Real Speech-Trained Bridging Module Zhongjian Cui Chenrui Cui Tianrui Wang Mengnan He Hao Shi Meng Ge Caixia Gong Longbiao Wang J. Dang 26 0 0 05 Jan 2025
RDSinger: Reference-based Diffusion Network for Singing Voice Synthesis Kehan Sui Jinxu Xiang Fang Jin DiffM 17 0 0 29 Oct 2024
Towards Unifying Evaluation of Counterfactual Explanations: Leveraging Large Language Models for Human-Centric Assessments M. Domnich Julius Valja Rasmus Moorits Veski Giacomo Magnifico Kadi Tulver Eduard Barbu Raul Vicente LRM ELM 37 2 0 28 Oct 2024
Non-intrusive Speech Quality Assessment with Diffusion Models Trained on Clean Speech Danilo de Oliveira Julius Richter Jean-Marie Lemercier Simon Welker Timo Gerkmann DiffM 18 0 0 23 Oct 2024
Align-ULCNet: Towards Low-Complexity and Robust Acoustic Echo and Noise Reduction Shrishti Saha Shetu Naveen Kumar Desiraju Wolfgang Mack Emanuël A. P. Habets 19 0 0 17 Oct 2024
SF-Speech: Straightened Flow for Zero-Shot Voice Clone Xuyuan Li Zengqiang Shang Hua Hua Peiyang Shi Chen Yang Li Wang Pengyuan Zhang 30 2 0 16 Oct 2024
FINALLY: fast and universal speech enhancement with studio-like quality Nicholas Babaev Kirill Tamogashev Azat Saginbaev Ivan Shchekotov Hanbin Bae Hosang Sung WonJun Lee Hoon-Young Cho Pavel Andreev 27 2 0 08 Oct 2024
Restorative Speech Enhancement: A Progressive Approach Using SE and Codec Modules Hsin-Tien Chiang Hao Zhang Yong Xu Meng Yu Dong Yu 18 1 0 02 Oct 2024
Semi-intrusive audio evaluation: Casting non-intrusive assessment as a multi-modal text prediction task Jozef Coldenhoff Milos Cernak 26 0 0 21 Sep 2024
TSELM: Target Speaker Extraction using Discrete Tokens and Language Models Beilong Tang Bang Zeng Ming Li 25 2 0 12 Sep 2024
The VoiceMOS Challenge 2024: Beyond Speech Quality Prediction Wen-Chin Huang Szu-Wei Fu Erica Cooper Ryandhimas E. Zezario T. Toda Hsin-Min Wang Junichi Yamagishi Yu Tsao 24 5 0 11 Sep 2024
FireRedTTS: A Foundation Text-To-Speech Framework for Industry-Level Generative Speech Applications Hao-Han Guo Kun Liu Fei-Yu Shen Yi-Chen Wu Xu Tang Kun Xie Kai-Tuo Xu Kun Xie Kai-Tuo Xu 32 20 0 05 Sep 2024
A multilingual training strategy for low resource Text to Speech Asma Amalas Mounir Ghogho Mohamed Chetouani Rachid Oulad Haj Thami 33 2 0 02 Sep 2024
A Hybrid Approach for Low-Complexity Joint Acoustic Echo and Noise Reduction Shrishti Saha Shetu Naveen Kumar Desiraju Jose Miguel Martinez Aponte Emanuël A. P. Habets Edwin Mabande 21 2 0 28 Aug 2024
Distil-DCCRN: A Small-footprint DCCRN Leveraging Feature-based Knowledge Distillation in Speech Enhancement Runduo Han Weiming Xu Zihan Zhang Mingshuai Liu Lei Xie 27 1 0 08 Aug 2024
Speech Editing -- a Summary Tobias Kässmann Yining Liu Danni Liu 26 0 0 24 Jul 2024
Laugh Now Cry Later: Controlling Time-Varying Emotional States of Flow-Matching-Based Zero-Shot Text-to-Speech Haibin Wu Xiaofei Wang Sefik Emre Eskimez Manthan Thakker Daniel Tompkins ... Canrun Li Zhen Xiao Sheng Zhao Jinyu Li Naoyuki Kanda 15 6 0 17 Jul 2024
Emilia: An Extensive, Multilingual, and Diverse Speech Dataset for Large-Scale Speech Generation Haorui He Zengqiang Shang Chaoren Wang Xuyuan Li Yicheng Gu ... Peiyang Shi Yuancheng Wang Kai Chen Pengyuan Zhang Zhizheng Wu 25 33 0 07 Jul 2024
SpeakerBeam-SS: Real-time Target Speaker Extraction with Lightweight Conv-TasNet and State Space Modeling Hiroshi Sato Takafumi Moriya Masato Mimura Shota Horiguchi Tsubasa Ochiai Takanori Ashihara Atsushi Ando Kentaro Shinayama Marc Delcroix 30 1 0 01 Jul 2024
RealMAN: A Real-Recorded and Annotated Microphone Array Dataset for Dynamic Speech Enhancement and Localization Bing Yang Changsheng Quan Yabo Wang Pengyu Wang Yujie Yang Ying Fang Nian Shao Hui Bu Xin Xu Xiaofei Li 30 5 0 28 Jun 2024
DASB -- Discrete Audio and Speech Benchmark Pooneh Mousavi Luca Della Libera J. Duret Artem Ploujnikov Cem Subakan Mirco Ravanelli 27 12 0 20 Jun 2024
Improved Remixing Process for Domain Adaptation-Based Speech Enhancement by Mitigating Data Imbalance in Signal-to-Noise Ratio Li Li Shogo Seki 22 0 0 20 Jun 2024
Diffusion-based Generative Modeling with Discriminative Guidance for Streamable Speech Enhancement Chenda Li Samuele Cornell Shinji Watanabe Yanmin Qian DiffM 18 2 0 19 Jun 2024
Universal Score-based Speech Enhancement with High Content Preservation Robin Scheibler Yusuke Fujita Yuma Shirahata Tatsuya Komatsu DiffM 27 10 0 18 Jun 2024
How Should We Extract Discrete Audio Tokens from Self-Supervised Models? Pooneh Mousavi J. Duret Salah Zaiem Luca Della Libera Artem Ploujnikov Cem Subakan Mirco Ravanelli 29 9 0 15 Jun 2024
Personalized Speech Enhancement Without a Separate Speaker Embedding Model Tanel Pärnamaa Ando Saabas 28 1 0 14 Jun 2024
RaD-Net 2: A causal two-stage repairing and denoising speech enhancement network with knowledge distillation and complex axial self-attention Mingshuai Liu Zhuangqi Chen Xiaopeng Yan Yuanjun Lv Xianjun Xia Chuanzeng Huang Yijian Xiao Lei Xie 41 2 0 11 Jun 2024
URGENT Challenge: Universality, Robustness, and Generalizability For Speech Enhancement Wangyou Zhang Robin Scheibler Kohei Saijo Samuele Cornell Chenda Li ... Jan Pirklbauer Marvin Sach Shinji Watanabe Tim Fingscheidt Yanmin Qian VLM 26 6 0 07 Jun 2024
Beyond Performance Plateaus: A Comprehensive Study on Scalability in Speech Enhancement Wangyou Zhang Kohei Saijo Jee-weon Jung Chenda Li Shinji Watanabe Yanmin Qian 30 4 0 06 Jun 2024
The PESQetarian: On the Relevance of Goodhart's Law for Speech Enhancement Danilo de Oliveira Simon Welker Julius Richter Timo Gerkmann 33 5 0 05 Jun 2024
LiveSpeech: Low-Latency Zero-shot Text-to-Speech via Autoregressive Modeling of Audio Discrete Codes Trung D. Q. Dang David Aponte Dung Tran K. Koishida 34 3 0 05 Jun 2024
Automatic Speech Recognition System-Independent Word Error Rate Estimation Chanho Park Mingjie Chen Thomas Hain 21 0 0 25 Apr 2024
Objective and subjective evaluation of speech enhancement methods in the UDASE task of the 7th CHiME challenge Simon Leglaive Matthieu Fraticelli Hend ElGhazaly Léonie Borne Mostafa Sadeghi Scott Wisdom Manuel Pariente J. Hershey Daniel Pressnitzer Jon P. Barker 13 8 0 02 Feb 2024
SpeechComposer: Unifying Multiple Speech Tasks with Prompt Composition Yihan Wu Soumi Maiti Yifan Peng Wangyou Zhang Chenda Li Yuyue Wang Xihua Wang Shinji Watanabe Ruihua Song 25 3 0 31 Jan 2024
Improving Design of Input Condition Invariant Speech Enhancement Wangyou Zhang Jee-weon Jung Shinji Watanabe Yanmin Qian AAML 26 2 0 25 Jan 2024
RaD-Net: A Repairing and Denoising Network for Speech Signal Improvement Mingshuai Liu Zhuangqi Chen Xiaopeng Yan Yuanjun Lv Xianjun Xia Chuanzeng Huang Yijian Xiao Lei Xie 37 3 0 09 Jan 2024