Deep Voice 2: Multi-Speaker Neural Text-to-Speech

24 May 2017

Papers citing "Deep Voice 2: Multi-Speaker Neural Text-to-Speech"

24 / 74 papers shown

Title
Direct Speech-to-image Translation Jiguo Li Xinfeng Zhang Chuanmin Jia Jizheng Xu Li Zhang Y. Wang Siwei Ma Wen Gao 28 29 0 07 Apr 2020
AlignTTS: Efficient Feed-Forward Text-to-Speech System without Explicit Alignment Zhen Zeng Jianzong Wang Ning Cheng Tian Xia Jing Xiao VLM 25 56 0 04 Mar 2020
Semi-Supervised Neural Architecture Search Renqian Luo Xu Tan Rui Wang Tao Qin Enhong Chen Tie-Yan Liu 8 88 0 24 Feb 2020
Mellotron: Multispeaker expressive voice synthesis by conditioning on rhythm, pitch and global style tokens Rafael Valle Jason Chun Lok Li R. Prenger Bryan Catanzaro 14 148 0 26 Oct 2019
Vision-Infused Deep Audio Inpainting Hang Zhou Ziwei Liu Lingfeng Guo Ping Luo Dahua Lin 27 88 0 24 Oct 2019
High Fidelity Speech Synthesis with Adversarial Networks Mikolaj Binkowski Jeff Donahue Sander Dieleman Aidan Clark Erich Elsen Norman Casagrande Luis C. Cobo Karen Simonyan 223 239 0 25 Sep 2019
Maximizing Mutual Information for Tacotron Peng Liu Xixin Wu Shiyin Kang Guangzhi Li Dan Su Dong Yu 6 16 0 30 Aug 2019
Unpaired Image-to-Speech Synthesis with Multimodal Information Bottleneck Shuang Ma Daniel J. McDuff Yale Song 20 22 0 19 Aug 2019
Polyphone Disambiguation for Mandarin Chinese Using Conditional Neural Network with Multi-level Embedding Features Zexin Cai Yaogen Yang Chuxiong Zhang Xiaoyi Qin Ming Li 16 26 0 03 Jul 2019
Non-Autoregressive Neural Text-to-Speech Kainan Peng Wei Ping Z. Song Kexin Zhao 27 39 0 21 May 2019
Adversarially Trained Autoencoders for Parallel-Data-Free Voice Conversion Orhan Ocal Oguz H. Elibol Gokce Keskin Cory Stephenson Anil Thomas K. Ramchandran 18 10 0 09 May 2019
TTS Skins: Speaker Conversion via ASR Adam Polyak Lior Wolf Yaniv Taigman 13 27 0 18 Apr 2019
Probability density distillation with generative adversarial networks for high-quality parallel waveform generation Ryuichi Yamamoto Eunwoo Song Jae-Min Kim 11 55 0 09 Apr 2019
Multi-reference Tacotron by Intercross Training for Style Disentangling,Transfer and Control in Speech Synthesis Yanyao Bian Changbin Chen Yongguo Kang Zhenglin Pan 10 46 0 04 Apr 2019
Data Efficient Voice Cloning for Neural Singing Synthesis Merlijn Blaauw J. Bonada R. Daido 11 33 0 19 Feb 2019
Securing Voice-driven Interfaces against Fake (Cloned) Audio Attacks Hafiz Malik 11 26 0 18 Feb 2019
Learning pronunciation from a foreign language in speech synthesis networks Younggun Lee Suwon Shon Taesu Kim 20 26 0 23 Nov 2018
Multi-task WaveNet: A Multi-task Generative Model for Statistical Parametric Speech Synthesis without Fundamental Frequency Conditions Yu Gu Yongguo Kang 10 17 0 22 Jun 2018
Voice Imitating Text-to-Speech Neural Networks Younggun Lee Taesu Kim Soo-Young Lee 17 11 0 04 Jun 2018
Towards End-to-End Prosody Transfer for Expressive Speech Synthesis with Tacotron RJ Skerry-Ryan Eric Battenberg Y. Xiao Yuxuan Wang Daisy Stanton Joel Shor Ron J. Weiss R. Clark Rif A. Saurous 14 547 0 24 Mar 2018
Do WaveNets Dream of Acoustic Waves? Kanru Hua 13 1 0 23 Feb 2018
Fitting New Speakers Based on a Short Untranscribed Sample Eliya Nachmani Adam Polyak Yaniv Taigman Lior Wolf 16 84 0 20 Feb 2018
Adversarial Audio Synthesis Chris Donahue Julian McAuley M. Puckette GAN 24 602 0 12 Feb 2018
NSML: A Machine Learning Platform That Enables You to Focus on Your Models Nako Sung Minkyu Kim Hyunwoo Jo Youngil Yang Jingwoong Kim ... Youngkwan Kim Gayoung Lee Donghyun Kwak Jung-Woo Ha Sunghun Kim 30 86 0 16 Dec 2017