PortaSpeech: Portable and High-Quality Generative Text-to-Speech

PortaSpeech: Portable and High-Quality Generative Text-to-Speech

30 September 2021

Zhou Zhao

Papers citing "PortaSpeech: Portable and High-Quality Generative Text-to-Speech"

17 / 17 papers shown

Title
Likelihood-Free Variational Autoencoders Chen Xu Qiang Wang Lijun Sun DiffM DRL 78 0 0 24 Apr 2025
Learning Frame-Wise Emotion Intensity for Audio-Driven Talking-Head Generation Jingyi Xu Hieu Le Zhixin Shu Yang Wang Yi-Hsuan Tsai Dimitris Samaras 24 0 0 29 Sep 2024
Controlling Emotion in Text-to-Speech with Natural Language Prompts Thomas Bott Florian Lux Ngoc Thang Vu 31 6 0 10 Jun 2024
GMTalker: Gaussian Mixture-based Audio-Driven Emotional Talking Video Portraits Yibo Xia Lizhen Wang Xiang Deng Xiaoyan Luo Yunhong Wang Yebin Liu VGen 33 1 0 12 Dec 2023
DPP-TTS: Diversifying prosodic features of speech via determinantal point processes Seongho Joo Hyukhun Koh Kyomin Jung DiffM 34 0 0 23 Oct 2023
LightGrad: Lightweight Diffusion Probabilistic Model for Text-to-Speech Jing Chen Xingcheng Song Zhendong Peng Binbin Zhang Fuping Pan Zhiyong Wu DiffM 10 16 0 31 Aug 2023
Adversarial Training of Denoising Diffusion Model Using Dual Discriminators for High-Fidelity Multi-Speaker TTS Myeongji Ko Yong-Hoon Choi DiffM 13 1 0 03 Aug 2023
Ada-TTA: Towards Adaptive High-Quality Text-to-Talking Avatar Synthesis Zhe Ye Ziyue Jiang Yi Ren Jinglin Liu Chen Zhang Xiang Yin Zejun Ma Zhou Zhao 40 4 0 06 Jun 2023
EfficientSpeech: An On-Device Text to Speech Model Rowel Atienza 21 4 0 23 May 2023
GeneFace: Generalized and High-Fidelity Audio-Driven 3D Talking Face Synthesis Zhenhui Ye Ziyue Jiang Yi Ren Jinglin Liu Jinzheng He Zhou Zhao CVBM 17 122 0 31 Jan 2023
ProDiff: Progressive Fast Diffusion Model For High-Quality Text-to-Speech Rongjie Huang Zhou Zhao Huadai Liu Jinglin Liu Chenye Cui Yi Ren DiffM 44 193 0 13 Jul 2022
R-MelNet: Reduced Mel-Spectral Modeling for Neural TTS Kyle Kastner Aaron Courville 22 0 0 30 Jun 2022
Multimodal Learning with Transformers: A Survey P. Xu Xiatian Zhu David A. Clifton ViT 41 522 0 13 Jun 2022
A Deep Reinforcement Learning Blind AI in DareFightingICE Thai Van Nguyen Xincheng Dai Ibrahim Khan R. Thawonmas H. V. Pham VLM 21 7 0 16 May 2022
FastDiff: A Fast Conditional Diffusion Model for High-Quality Speech Synthesis Rongjie Huang Max W. Y. Lam J. Wang Dan Su Dong Yu Yi Ren Zhou Zhao DiffM 16 164 0 21 Apr 2022
Contrastive Learning with Positive-Negative Frame Mask for Music Representation D. Yao Zhou Zhao Shengyu Zhang Jieming Zhu Yudong Zhu Rui Zhang Xiuqiang He 14 21 0 17 Mar 2022
DiffGAN-TTS: High-Fidelity and Efficient Text-to-Speech with Denoising Diffusion GANs Songxiang Liu Dan Su Dong Yu DiffM 68 65 0 28 Jan 2022