Voice Conversion Challenge 2020: Intra-lingual semi-parallel and cross-lingual voice conversion

28 August 2020

Rohan Kumar Das

Papers citing "Voice Conversion Challenge 2020: Intra-lingual semi-parallel and cross-lingual voice conversion"

33 / 33 papers shown

Title
Generative Adversarial Network based Voice Conversion: Techniques, Challenges, and Recent Advancements Sandipan Dhar N. D. Jana Swagatam Das 43 0 0 27 Apr 2025
FADEL: Uncertainty-aware Fake Audio Detection with Evidential Deep Learning Ju Yeon Kang J. Yoon Semin Kim Min Hyun Han Nam Soo Kim 27 0 0 22 Apr 2025
QualiSpeech: A Speech Quality Assessment Dataset with Natural Language Reasoning and Descriptions Siyin Wang Wenyi Yu Xianzhao Chen Xiaohai Tian J. Zhang Lu Lu Yu Tsao Junichi Yamagishi Y. Wang Chao Zhang AuLLM 76 0 0 26 Mar 2025
SONICS: Synthetic Or Not -- Identifying Counterfeit Songs Md Awsafur Rahman Zaber Ibn Abdul Hakim Najibul Haque Sarker Bishmoy Paul S. Fattah 38 7 0 26 Aug 2024
Harder or Different? Understanding Generalization of Audio Deepfake Detection Nicolas M. Muller Nicholas W. D. Evans Hemlata Tak Philip Sperl Konstantin Böttinger 27 3 0 05 Jun 2024
Audio Anti-Spoofing Detection: A Survey Menglu Li Yasaman Ahmadiadli Xiao-Ping Zhang 34 17 0 22 Apr 2024
A Large-Scale Evaluation of Speech Foundation Models Shu-Wen Yang Heng-Jui Chang Zili Huang Andy T. Liu Cheng-I Jeff Lai ... Kushal Lakhotia Shang-Wen Li Abdelrahman Mohamed Shinji Watanabe Hung-yi Lee 38 19 0 15 Apr 2024
High-Fidelity Neural Phonetic Posteriorgrams Cameron Churchwell Max Morrison Bryan Pardo 32 4 0 27 Feb 2024
Do You Remember? Overcoming Catastrophic Forgetting for Fake Audio Detection Xiaohui Zhang Jiangyan Yi J. Tao Chenglong Wang Chuyuan Zhang CLL 28 22 0 07 Aug 2023
Multi-Dataset Co-Training with Sharpness-Aware Optimization for Audio Anti-spoofing Hye-jin Shim Jee-weon Jung Tomi Kinnunen 19 13 0 31 May 2023
Voice Conversion With Just Nearest Neighbors Matthew Baas Benjamin van Niekerk Herman Kamper SSL 30 48 0 30 May 2023
ASVspoof 2021: Towards Spoofed and Deepfake Speech Detection in the Wild Xuechen Liu Xin Wang Md. Sahidullah J. Patino Héctor Delgado ... Massimiliano Todisco Junichi Yamagishi Nicholas W. D. Evans A. Nautsch Kong Aik Lee 27 172 0 05 Oct 2022
ControlVC: Zero-Shot Voice Conversion with Time-Varying Controls on Pitch and Speed Mei-Shuo Chen Z. Duan 22 10 0 23 Sep 2022
Deepfake: Definitions, Performance Metrics and Standards, Datasets and Benchmarks, and a Meta-Review Enes ALTUNCU V. N. Franqueira Shujun Li 21 11 0 21 Aug 2022
Learning Noise-independent Speech Representation for High-quality Voice Conversion for Noisy Target Speakers Liumeng Xue Shan Yang Na Hu Dan Su Linfu Xie 16 2 0 02 Jul 2022
Speak Like a Dog: Human to Non-human creature Voice Conversion Kohei Suzuki Shoki Sakamoto T. Taniguchi Hirokazu Kameoka 17 2 0 09 Jun 2022
Zero-Shot Voice Conditioning for Denoising Diffusion TTS Models Alon Levkovitch Eliya Nachmani Lior Wolf DiffM 19 29 0 05 Jun 2022
Enhancement of Pitch Controllability using Timbre-Preserving Pitch Augmentation in FastPitch Hanbin Bae Young-Sun Joo 14 2 0 12 Apr 2022
Fusion of Self-supervised Learned Models for MOS Prediction Zhengdong Yang Wangjin Zhou Chenhui Chu Sheng Li Raj Dabre Raphaël Rubino Yi Zhao 20 28 0 11 Apr 2022
Improve few-shot voice cloning using multi-modal learning Haitong Zhang Yue Lin 11 8 0 18 Mar 2022
Learning the Beauty in Songs: Neural Singing Voice Beautifier Jinglin Liu Chengxi Li Yi Ren Zhiying Zhu Zhou Zhao DiffM 28 14 0 27 Feb 2022
A Comparison of Discrete and Soft Speech Units for Improved Voice Conversion Benjamin van Niekerk M. Carbonneau Julian Zaïdi Matthew Baas Hugo Seuté Herman Kamper DRL 11 111 0 03 Nov 2021
ESPnet2-TTS: Extending the Edge of TTS Research Tomoki Hayashi Ryuichi Yamamoto Takenori Yoshimura Peter Wu Jiatong Shi Takaaki Saeki Yooncheol Ju Yusuke Yasuda Shinnosuke Takamichi Shinji Watanabe VLM 42 60 0 15 Oct 2021
Style Equalization: Unsupervised Learning of Controllable Generative Sequence Models Jen-Hao Rick Chang A. Shrivastava H. Koppula Xiaoshuai Zhang Oncel Tuzel DiffM 46 16 0 06 Oct 2021
Benchmarking and challenges in security and privacy for voice biometrics J. Bonastre Héctor Delgado Nicholas W. D. Evans Tomi Kinnunen Kong Aik Lee ... Massimiliano Todisco N. Tomashenko Emmanuel Vincent Xin Wang Junichi Yamagishi 23 8 0 01 Sep 2021
StarGANv2-VC: A Diverse, Unsupervised, Non-parallel Framework for Natural-Sounding Voice Conversion Yinghao Aaron Li A. Zare N. Mesgarani 16 98 0 21 Jul 2021
SVSNet: An End-to-end Speaker Voice Similarity Assessment Model Cheng-Hung Hu Yu-Huai Peng Junichi Yamagishi Yu Tsao Hsin-Min Wang 24 5 0 20 Jul 2021
Translatotron 2: High-quality direct speech-to-speech translation with voice preservation Ye Jia Michelle Tadmor Ramanovich Tal Remez Roi Pomerantz 26 67 0 19 Jul 2021
Emotional Voice Conversion: Theory, Databases and ESD Kun Zhou Berrak Sisman Rui Liu Haizhou Li 20 167 0 31 May 2021
S2VC: A Framework for Any-to-Any Voice Conversion with Self-Supervised Pretrained Representations Jheng-hao Lin Yist Y. Lin C. Chien Hung-yi Lee 20 56 0 07 Apr 2021
An Empirical Study on Channel Effects for Synthetic Voice Spoofing Countermeasure Systems You Zhang Ge Zhu Fei Jiang Z. Duan 29 29 0 03 Apr 2021
Predictions of Subjective Ratings and Spoofing Assessments of Voice Conversion Challenge 2020 Submissions Rohan Kumar Das Tomi Kinnunen Wen-Chin Huang Zhenhua Ling Junichi Yamagishi Yi Zhao Xiaohai Tian T. Toda 18 52 0 08 Sep 2020
An Overview of Voice Conversion and its Challenges: From Statistical Modeling to Deep Learning Berrak Sisman Junichi Yamagishi Simon King Haizhou Li BDL 27 316 0 09 Aug 2020