PromptVC: Flexible Stylistic Voice Conversion in Latent Space Driven by
Natural Language Prompts

PromptVC: Flexible Stylistic Voice Conversion in Latent Space Driven by Natural Language Prompts

17 September 2023

Heng Lu

Papers citing "PromptVC: Flexible Stylistic Voice Conversion in Latent Space Driven by Natural Language Prompts"

14 / 14 papers shown

Title
Enhancing Expressive Voice Conversion with Discrete Pitch-Conditioned Flow Matching Model Jialong Zuo Shengpeng Ji Minghui Fang Ziyue Jiang Xize Cheng ... Wenrui Liu Guangyan Zhang Zehai Tu Yiwen Guo Zhou Zhao 49 0 0 08 Feb 2025
AudioMiXR: Spatial Audio Object Manipulation with 6DoF for Sound Design in Augmented Reality Brandon Woodard Margarita Geleta Joseph J. LaViola Jr. Andrea Fanelli Rhonda Wilson 55 2 0 05 Feb 2025
Emotion Recognition and Generation: A Comprehensive Review of Face, Speech, and Text Modalities Rebecca Mobbs Dimitrios Makris Vasileios Argyriou 38 0 0 02 Feb 2025
SoundMorpher: Perceptually-Uniform Sound Morphing with Diffusion Model Xinlei Niu Jing Zhang Charles Patrick Martin 25 1 0 03 Oct 2024
StyleFusion TTS: Multimodal Style-control and Enhanced Feature Fusion for Zero-shot Text-to-speech Synthesis Zhiyong Chen Xinnuo Li Zhiqi Ai Shugong Xu DiffM 34 1 0 24 Sep 2024
Takin: A Cohort of Superior Quality Zero-shot Speech Generation Models Sijing Chen Yuan Feng Laipeng He Tianwei He Wendi He ... Huimin Zhang Xiang Zhang Guangcheng Zhao Hongbin Zhou Pengpeng Zou 25 4 0 18 Sep 2024
Factor-Conditioned Speaking-Style Captioning Atsushi Ando Takafumi Moriya Shota Horiguchi Ryo Masumura 30 0 0 27 Jun 2024
HybridVC: Efficient Voice Style Conversion with Text and Audio Prompts Xinlei Niu Jing Zhang Charles Patrick Martin 18 2 0 24 Apr 2024
Voice Attribute Editing with Text Prompt Zheng-Yan Sheng Yang Ai Li-Juan Liu Jia Pan Zhenhua Ling 26 6 0 13 Apr 2024
PromptCodec: High-Fidelity Neural Speech Codec using Disentangled Representation Learning based Adaptive Feature-aware Prompt Encoders Yu Pan Lei Ma Jianjun Zhao 32 4 0 03 Apr 2024
Prompt-Singer: Controllable Singing-Voice-Synthesis with Natural Language Prompt Yongqi Wang Ruofan Hu Rongjie Huang Zhiqing Hong Ruiqi Li Wenrui Liu Fuming You Tao Jin Zhou Zhao 38 11 0 18 Mar 2024
MSAC: Multiple Speech Attribute Control Method for Reliable Speech Emotion Recognition Y. Pan Yuguang Yang Yuheng Huang Jixun Yao Jingjing Yin Yanni Hu Heng Lu Lei Ma Jianjun Zhao 25 5 0 08 Aug 2023
Nonparallel Emotional Voice Conversion For Unseen Speaker-Emotion Pairs Using Dual Domain Adversarial Network & Virtual Domain Pairing Nirmesh J. Shah M. Singh Naoya Takahashi N. Onoe 34 13 0 21 Feb 2023
Self-supervised Context-aware Style Representation for Expressive Speech Synthesis Yihan Wu Xi Wang S. Zhang Lei He Ruihua Song J. Nie 25 15 0 25 Jun 2022