v1v2v3 (latest)

Deep Voice 3: Scaling Text-to-Speech with Convolutional Sequence Learning

20 October 2017

Sharan Narang

Papers citing "Deep Voice 3: Scaling Text-to-Speech with Convolutional Sequence Learning"

20 / 170 papers shown

Title
FloWaveNet : A Generative Flow for Raw AudioInternational Conference on Machine Learning (ICML), 2018 Sungwon Kim Sang-gil Lee Jongyoon Song Jaehyeon Kim Sungroh Yoon 258 176 0 06 Nov 2018
Leveraging Weakly Supervised Data to Improve End-to-End Speech-to-Text Translation Ye Jia Melvin Johnson Wolfgang Macherey Ron J. Weiss Yuan Cao Chung-Cheng Chiu Naveen Ari Stella Laurenzo Yonghui Wu 225 170 0 05 Nov 2018
Neural Music Synthesis for Flexible Timbre Control Jong Wook Kim Rachel M. Bittner Aparna Kumar J. P. Bello 183 42 0 01 Nov 2018
Speaking style adaptation in Text-To-Speech synthesis using Sequence-to-sequence models with attention Bajibabu Bollepalli Lauri Juvela P. Alku 88 4 0 29 Oct 2018
Hierarchical Generative Modeling for Controllable Speech Synthesis Wei-Ning Hsu Yu Zhang Ron J. Weiss Heiga Zen Yonghui Wu ... Ye Jia Zhiwen Chen Jonathan Shen Patrick Nguyen Ruoming Pang BDL 222 288 0 16 Oct 2018
Sequence-to-Sequence Acoustic Modeling for Voice Conversion Jing-Xuan Zhang Zhenhua Ling Li-Juan Liu Yuan Jiang Lirong Dai 284 134 0 16 Oct 2018
Sample Efficient Adaptive Text-to-SpeechInternational Conference on Learning Representations (ICLR), 2018 Yutian Chen Yannis Assael Brendan Shillingford David Budden Scott E. Reed ... Ben Laurie Çağlar Gülçehre Aaron van den Oord Oriol Vinyals Nando de Freitas 193 156 0 27 Sep 2018
Fast Spectrogram Inversion using Multi-head Convolutional Neural Networks Sercan O. Arik Heewoo Jun G. Diamos 231 118 0 20 Aug 2018
Multimodal speech synthesis architecture for unsupervised speaker adaptation Hieu-Thi Luong Junichi Yamagishi 116 10 0 20 Aug 2018
Investigating accuracy of pitch-accent annotations in neural network-based speech synthesis and denoising effects Hieu-Thi Luong Xin Wang Junichi Yamagishi Nobuyuki Nishizawa 89 17 0 02 Aug 2018
Multi-task WaveNet: A Multi-task Generative Model for Statistical Parametric Speech Synthesis without Fundamental Frequency Conditions Yu Gu Yongguo Kang 128 16 0 22 Jun 2018
Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis Ye Jia Yu Zhang Ron J. Weiss Quan Wang Jonathan Shen ... Zhiwen Chen Patrick Nguyen Ruoming Pang Ignacio López Moreno Yonghui Wu 551 900 0 12 Jun 2018
Voice Imitating Text-to-Speech Neural Networks Younggun Lee Taesu Kim Soo-Young Lee 104 11 0 04 Jun 2018
A Universal Music Translation Network Noam Mor Lior Wolf Adam Polyak Yaniv Taigman 303 112 0 21 May 2018
Collapsed speech segment detection and suppression for WaveNet vocoder Yi-Chiao Wu Kazuhiro Kobayashi Tomoki Hayashi Patrick Lumban Tobing Tomoki Toda 171 26 0 30 Apr 2018
Style Tokens: Unsupervised Style Modeling, Control and Transfer in End-to-End Speech Synthesis Yuxuan Wang Daisy Stanton Yu Zhang RJ Skerry-Ryan Eric Battenberg Joel Shor Y. Xiao Fei Ren Ye Jia Rif A. Saurous 253 880 0 23 Mar 2018
Fitting New Speakers Based on a Short Untranscribed Sample Eliya Nachmani Adam Polyak Yaniv Taigman Lior Wolf 98 87 0 20 Feb 2018
Neural Voice Cloning with a Few Samples Sercan O. Arik Jitong Chen Kainan Peng Ming-Yu Liu Yanqi Zhou 185 417 0 14 Feb 2018
Adversarial Audio Synthesis Chris Donahue Julian McAuley M. Puckette GAN 314 667 0 12 Feb 2018
Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions Jonathan Shen Ruoming Pang Ron J. Weiss M. Schuster Navdeep Jaitly ... Yuxuan Wang RJ Skerry-Ryan Rif A. Saurous Yannis Agiomyrgiannakis Yonghui Wu 389 2,902 0 16 Dec 2017