AGAIN-VC: A One-shot Voice Conversion using Activation Guidance and Adaptive Instance Normalization

IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2020

31 October 2020

Papers citing "AGAIN-VC: A One-shot Voice Conversion using Activation Guidance and Adaptive Instance Normalization"

50 / 62 papers shown

O_O-VC: Synthetic Data-Driven One-to-One Alignment for Any-to-Any Voice Conversion

133

10 Oct 2025

LatentVoiceGrad: Nonparallel Voice Conversion with Latent Diffusion/Flow-Matching ModelsIEEE Transactions on Audio, Speech, and Language Processing (TASLP), 2025

207

10 Sep 2025

NE-PADD: Leveraging Named Entity Knowledge for Robust Partial Audio Deepfake Detection via Attention Aggregation

148

04 Sep 2025

FreeTalk:A plug-and-play and black-box defense against speech synthesis attacks

143

30 Aug 2025

ClearMask: Noise-Free and Naturalness-Preserving Protection Against Voice Deepfake AttacksACM Asia Conference on Computer and Communications Security (AsiaCCS), 2025

169

25 Aug 2025

FasterVoiceGrad: Faster One-step Diffusion-Based Voice Conversion with Adversarial Diffusion Conversion Distillation

129

25 Aug 2025

ReFlow-VC: Zero-shot Voice Conversion Based on Rectified Flow and Speaker Feature Optimization

168

01 Jun 2025

AVENet: Disentangling Features by Approximating Average Features for Voice Conversion

210

08 Apr 2025

Enhancing Expressive Voice Conversion with Discrete Pitch-Conditioned Flow Matching ModelIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2025

...

489

08 Feb 2025

Discrete Unit based Masking for Improving Disentanglement in Voice ConversionSpoken Language Technology Workshop (SLT), 2024

Philip H. Lee

Ismail Rasim Ulgen

Berrak Sisman

239

17 Sep 2024

Speaker Contrastive Learning for Source Speaker TracingSpoken Language Technology Workshop (SLT), 2024

Xiao-Lei Zhang

372

16 Sep 2024

FastVoiceGrad: One-step Diffusion-Based Voice Conversion with Adversarial Conditional Diffusion DistillationInterspeech (Interspeech), 2024

319

03 Sep 2024

RAVE for Speech: Efficient Voice Conversion at High Sampling Rates

A. R. Bargum

Simon Lajboschitz

Cumhur Erkut

242

29 Aug 2024

Disentangling segmental and prosodic factors to non-native speech comprehensibilityIEEE Transactions on Audio, Speech, and Language Processing (IEEE TASLP), 2024

Waris Quamer

Ricardo Gutierrez-Osuna

298

20 Aug 2024

VQ-CTAP: Cross-Modal Fine-Grained Sequence Representation Learning for Speech ProcessingIEEE Transactions on Audio, Speech, and Language Processing (IEEE TASLP), 2024

...

435

11 Aug 2024

End-to-end Streaming model for Low-Latency Speech Anonymization

Waris Quamer

Ricardo Gutierrez-Osuna

271

13 Jun 2024

Improving child speech recognition with augmented child-like speech

205

12 Jun 2024

Converting Anyone's Voice: End-to-End Expressive Voice Conversion with a Conditional Diffusion ModelThe Speaker and Language Recognition Workshop (Odyssey), 2024

294

02 May 2024

MAIN-VC: Lightweight Speech Representation Disentanglement for One-shot Voice Conversion

260

02 May 2024

Who is Authentic Speaker

Qiang Huang

217

30 Apr 2024

Self-Supervised Disentangled Representation Learning for Robust Target Speech ExtractionAAAI Conference on Artificial Intelligence (AAAI), 2023

334

16 Dec 2023

Low-latency Real-time Voice Conversion on CPU

642

01 Nov 2023

SelfVC: Voice Conversion With Iterative Refinement using Self Transformations

Paarth Neekhara

Shehzeen Samarah Hussain

Boris Ginsburg

Shlomo Dubnov

245

14 Oct 2023

AutoCycle-VC: Towards Bottleneck-Independent Zero-Shot Cross-Lingual Voice Conversion

214

10 Oct 2023

U-Style: Cascading U-nets with Multi-level Speaker and Style Modeling for Zero-Shot Voice CloningIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2023

Jian Cong

Lei Xie

207

06 Oct 2023

An Efficient Temporary Deepfake Location Approach Based Embeddings for Partially Spoofed Audio DetectionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

Yuankun Xie

Haonan Cheng

Yutian Wang

Long Ye

257

06 Sep 2023

SLMGAN: Exploiting Speech Language Model Representations for Unsupervised Zero-Shot Voice Conversion in GANsIEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), 2023

Yinghao Aaron Li

Cong Han

N. Mesgarani

275

18 Jul 2023

LM-VC: Zero-shot Voice Conversion via Speech Generation based on Language ModelsIEEE Signal Processing Letters (IEEE SPL), 2023

381

18 Jun 2023

Iteratively Improving Speech Recognition and Voice ConversionInterspeech (Interspeech), 2023

Mayank Singh

Naoya Takahashi

Ono Naoyuki

272

24 May 2023

Multi-level Temporal-channel Speaker Retrieval for Zero-shot Voice ConversionIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2023

378

12 May 2023

TriAAN-VC: Triple Adaptive Attention Normalization for Any-to-Any Voice ConversionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

264

16 Mar 2023

Cross-modal Face- and Voice-style Transfer

311

27 Feb 2023

Catch You and I Can: Revealing Source Voiceprint Against Voice ConversionUSENIX Security Symposium (USENIX Security), 2023

Jiangyi Deng

Yanjiao Chen

Yinan Zhong

Qianhao Miao

Xueluan Gong

Wenyuan Xu Zhejiang University

303

24 Feb 2023

StyleTTS-VC: One-Shot Voice Conversion by Knowledge Transfer from Style-Based TTS ModelsSpoken Language Technology Workshop (SLT), 2022

Yinghao Aaron Li

Cong Han

N. Mesgarani

205

29 Dec 2022

Speaking Style Conversion in the Waveform Domain Using Discrete Self-Supervised UnitsConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Gallil Maimon

Yossi Adi

373

19 Dec 2022

Multi-Speaker Expressive Speech Synthesis via Multiple Factors DecouplingIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

255

19 Nov 2022

Expressive-VC: Highly Expressive Voice Conversion with Attention Fusion of Bottleneck and Perturbation FeaturesIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Pengcheng Zhu

185

09 Nov 2022

Preserving background sound in noise-robust voice conversion via multi-task learningIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

245

06 Nov 2022

FreeVC: Towards High-Quality Text-Free One-Shot Voice ConversionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Jingyi Li

Weiping Tu

Li Xiao

434

207

27 Oct 2022

MetaSpeech: Speech Effects Switch Along with Environment for MetaverseInternational Conference on Mobile Ad-hoc and Sensor Networks (MSN), 2022

155

25 Oct 2022

Disentangled Speech Representation Learning for One-Shot Cross-lingual Voice Conversion Using

β

-VAESpoken Language Technology Workshop (SLT), 2022

Zhiyong Wu

262

25 Oct 2022

Robust One-Shot Singing Voice Conversion

312

20 Oct 2022

Identifying Source Speakers for Voice Conversion based Spoofing Attacks on Speaker Verification SystemsIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Danwei Cai

Zexin Cai

Ming Li

271

18 Jun 2022

End-to-End Voice Conversion with Information PerturbationInternational Symposium on Chinese Spoken Language Processing (ISCSLP), 2022

Shan Yang

176

15 Jun 2022

VisageSynTalk: Unseen Speaker Video-to-Speech Synthesis via Speech-Visage Feature SelectionEuropean Conference on Computer Vision (ECCV), 2022

299

15 Jun 2022

StyleTTS: A Style-Based Generative Model for Natural and Diverse Text-to-Speech SynthesisIEEE Journal on Selected Topics in Signal Processing (IEEE JSTSP), 2022

Yinghao Aaron Li

Cong Han

N. Mesgarani

397

30 May 2022

End-to-End Zero-Shot Voice Conversion with Location-Variable ConvolutionsInterspeech (Interspeech), 2022

Wonjune Kang

M. Hasegawa-Johnson

D. Roy

286

19 May 2022

ContentVec: An Improved Self-Supervised Speech Representation by Disentangling SpeakersInternational Conference on Machine Learning (ICML), 2022

Kaizhi Qian

255

155

20 Apr 2022

DRVC: A Framework of Any-to-Any Voice Conversion with Self-Supervised LearningIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

282

22 Feb 2022

Training Robust Zero-Shot Voice Conversion Models with Self-supervised Features

227

08 Dec 2021