EMOVIE: A Mandarin Emotion Speech Dataset with a Simple Emotional
Text-to-Speech Model

EMOVIE: A Mandarin Emotion Speech Dataset with a Simple Emotional Text-to-Speech Model

17 June 2021

Rongjie Huang

Zhou Zhao

Papers citing "EMOVIE: A Mandarin Emotion Speech Dataset with a Simple Emotional Text-to-Speech Model"

19 / 19 papers shown

Title
Making Social Platforms Accessible: Emotion-Aware Speech Generation with Integrated Text Analysis Suparna De Ionut Bostan Nishanth Sastry 32 0 0 24 Oct 2024
FlashAudio: Rectified Flows for Fast and High-Fidelity Text-to-Audio Generation Huadai Liu Jialei Wang Rongjie Huang Yang Liu H. Lu Wei Xue Zhou Zhao 13 3 0 16 Oct 2024
EELE: Exploring Efficient and Extensible LoRA Integration in Emotional Text-to-Speech Xin Qi Ruibo Fu Zhengqi Wen Jianhua Tao Shuchen Shi ... Yuankun Xie Yukun Liu Guanjun Li Xuefei Liu Yongwei Li 27 1 0 20 Aug 2024
Exploring speech style spaces with language models: Emotional TTS without emotion labels Shreeram Suresh Chandra Zongyang Du Berrak Sisman 38 2 0 18 May 2024
Construction and Evaluation of Mandarin Multimodal Emotional Speech Database Ting Zhu Liangqi Li Shufei Duan Xueying Zhang Zhongzhe Xiao Hairng Jia Huizhi Liang 20 0 0 14 Jan 2024
Cross-speaker Emotion Transfer by Manipulating Speech Style Latents Suhee Jo Younggun Lee Yookyung Shin Yeongtae Hwang Taesu Kim 11 3 0 15 Mar 2023
QI-TTS: Questioning Intonation Control for Emotional Speech Synthesis Haobin Tang Xulong Zhang Jianzong Wang Ning Cheng Jing Xiao 20 14 0 14 Mar 2023
Emotion Selectable End-to-End Text-based Speech Editing Tao Wang Jiangyan Yi Ruibo Fu J. Tao Zhengqi Wen Chu Yuan Zhang 30 2 0 20 Dec 2022
VarietySound: Timbre-Controllable Video to Sound Generation via Unsupervised Information Disentanglement Chenye Cui Yi Ren Jinglin Liu Rongjie Huang Zhou Zhao VGen 30 14 0 19 Nov 2022
Controllable Data Generation by Deep Learning: A Review Shiyu Wang Yuanqi Du Xiaojie Guo Bo Pan Zhaohui Qin Liang Zhao 29 28 0 19 Jul 2022
ProDiff: Progressive Fast Diffusion Model For High-Quality Text-to-Speech Rongjie Huang Zhou Zhao Huadai Liu Jinglin Liu Chenye Cui Yi Ren DiffM 44 193 0 13 Jul 2022
Language Model-Based Emotion Prediction Methods for Emotional Speech Synthesis Systems Hyun-Wook Yoon Ohsung Kwon Hoyeon Lee Ryuichi Yamamoto Eunwoo Song Jae-Min Kim Min-Jae Hwang 29 14 0 30 Jun 2022
Accurate Emotion Strength Assessment for Seen and Unseen Speech Based on Data-Driven Deep Learning Rui Liu Berrak Sisman Björn Schuller Guanglai Gao Haizhou Li 22 11 0 15 Jun 2022
GenerSpeech: Towards Style Transfer for Generalizable Out-Of-Domain Text-to-Speech Rongjie Huang Yi Ren Jinglin Liu Chenye Cui Zhou Zhao OODD VLM 115 34 0 15 May 2022
vTTS: visual-text to speech Yoshifumi Nakano Takaaki Saeki Shinnosuke Takamichi Katsuhito Sudoh Hiroshi Saruwatari 9 4 0 28 Mar 2022
A Dataset for Speech Emotion Recognition in Greek Theatrical Plays Maria Moutti S. Eleftheriou Panagiotis Koromilas Theodoros Giannakopoulos 14 2 0 27 Mar 2022
Multi-Singer: Fast Multi-Singer Singing Voice Vocoder With A Large-Scale Corpus Rongjie Huang Feiyang Chen Yi Ren Jinglin Liu Chenye Cui Zhou Zhao 28 98 0 20 Dec 2021
SingGAN: Generative Adversarial Network For High-Fidelity Singing Voice Generation Rongjie Huang Chenye Cui Feiyang Chen Yi Ren Jinglin Liu Zhou Zhao Baoxing Huai N. Yuan GAN 99 62 0 14 Oct 2021
LSSED: a large-scale dataset and benchmark for speech emotion recognition Weiquan Fan Xiangmin Xu Xiaofen Xing Weidong Chen Dongyan Huang 51 33 0 30 Jan 2021