v1v2v3 (latest)

DiffWave: A Versatile Diffusion Model for Audio Synthesis

International Conference on Learning Representations (ICLR), 2020

21 September 2020

Papers citing "DiffWave: A Versatile Diffusion Model for Audio Synthesis"

50 / 1,134 papers shown

On the Design Fundamentals of Diffusion Models: A SurveyPattern Recognition (Pattern Recogn.), 2023

Ziyi Chang

George Alex Koulieris

Hyung Jin Chang

Hubert P. H. Shum

DiffM

637

07 Jun 2023

Mega-TTS: Zero-Shot Text-to-Speech at Scale with Intrinsic Inductive Bias

...

Rongjie Huang

Chunfeng Wang

Xiang Yin

Zejun Ma

Zhou Zhao

DiffM

262

06 Jun 2023

LipVoicer: Generating Speech from Silent Videos Guided by Lip ReadingInternational Conference on Learning Representations (ICLR), 2023

330

05 Jun 2023

Detector Guidance for Multi-Object Text-to-Image Generation

Luping Liu

Zijian Zhang

Yi Ren

Rongjie Huang

Xiang Yin

Zhou Zhao

DiffM

180

04 Jun 2023

Conditional Generation from Unconditional Diffusion Models using Denoiser Representations

188

02 Jun 2023

DiffECG: A Versatile Probabilistic Diffusion Model for ECG Signals SynthesisInternational Conference on Software Engineering Research and Applications (ICSERA), 2023

383

02 Jun 2023

Denoising Diffusion Semantic Segmentation with Mask Prior Modeling

Yu Qiao

197

02 Jun 2023

UnDiff: Unsupervised Voice Restoration with Unconditional Diffusion ModelInterspeech (Interspeech), 2023

Dmitry Vetrov

339

01 Jun 2023

Addressing Negative Transfer in Diffusion ModelsNeural Information Processing Systems (NeurIPS), 2023

547

01 Jun 2023

A Geometric Perspective on Diffusion Models

Chunhua Shen

212

31 May 2023

Spontaneous Symmetry Breaking in Generative Diffusion ModelsNeural Information Processing Systems (NeurIPS), 2023

G. Raya

Luca Ambrogioni

DiffM

307

31 May 2023

Unsupervised Statistical Feature-Guided Diffusion Model for Sensor-based Human Activity Recognition

250

30 May 2023

Nested Diffusion Processes for Anytime Image GenerationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

260

30 May 2023

Diffusion-Stego: Training-free Diffusion Generative Steganography via Message ProjectionInformation Sciences (Inf. Sci.), 2023

282

30 May 2023

Learning to Jump: Thinning and Thickening Latent Counts for Generative ModelingInternational Conference on Machine Learning (ICML), 2023

Tianqi Chen

Mingyuan Zhou

DiffM

188

28 May 2023

Functional Flow MatchingInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

Gavin Kerrigan

Giosue Migliorini

Padhraic Smyth

368

26 May 2023

An Efficient Membership Inference Attack for the Diffusion Model by Proximal InitializationInternational Conference on Learning Representations (ICLR), 2023

209

26 May 2023

DiffusionNAG: Predictor-guided Neural Architecture Generation with Diffusion ModelsInternational Conference on Learning Representations (ICLR), 2023

514

26 May 2023

Diverse and Expressive Speech Prosody Prediction with Denoising Diffusion Probabilistic ModelInterspeech (Interspeech), 2023

Xiang Li

Zhiyong Wu

221

26 May 2023

DPOK: Reinforcement Learning for Fine-tuning Text-to-Image Diffusion ModelsNeural Information Processing Systems (NeurIPS), 2023

Pieter Abbeel

417

287

25 May 2023

Non-adversarial training of Neural SDEs with signature kernel scoresNeural Information Processing Systems (NeurIPS), 2023

321

25 May 2023

Trans-Dimensional Generative Modeling via Jump Diffusion ModelsNeural Information Processing Systems (NeurIPS), 2023

Andrew Campbell

William Harvey

Christian D. Weilbach

240

25 May 2023

DDDM-VC: Decoupled Denoising Diffusion Models with Disentangled Representation and Prior Mixup for Verified Robust Voice ConversionAAAI Conference on Artificial Intelligence (AAAI), 2023

147

25 May 2023

Efficient Neural Music GenerationNeural Information Processing Systems (NeurIPS), 2023

...

Jitong Chen

Yuxuan Wang

251

25 May 2023

David helps Goliath: Inference-Time Collaboration Between Small Specialized and Large General Diffusion LMsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2023

282

24 May 2023

Revisit and Outstrip Entity Alignment: A Perspective of Generative ModelsInternational Conference on Learning Representations (ICLR), 2023

Huajun Chen

184

24 May 2023

Improved Convergence of Score-Based Diffusion Models via Prediction-Correction

316

23 May 2023

FluentSpeech: Stutter-Oriented Automatic Speech Editing with Context-Aware Diffusion ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Rongjie Huang

Zhou Zhao

161

23 May 2023

VDT: General-purpose Video Diffusion Transformers via Mask ModelingInternational Conference on Learning Representations (ICLR), 2023

Ping Luo

Mingyu Ding

DiffM VGen

226

100

22 May 2023

DiffusionNER: Boundary Diffusion for Named Entity RecognitionAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Dongsheng Li

285

22 May 2023

GSURE-Based Diffusion Model Training with Corrupted Data

466

22 May 2023

AudioToken: Adaptation of Text-Conditioned Diffusion Models for Audio-to-Image Generation

Guy Yariv

Itai Gat

Lior Wolf

Yossi Adi

Idan Schwartz

DiffM

262

22 May 2023

DiffAVA: Personalized Text-to-Audio Generation with Visual Alignment

Shentong Mo

Jing Shi

Yapeng Tian

139

22 May 2023

NAS-FM: Neural Architecture Search for Tunable and Interpretable Sound Synthesis based on Frequency ModulationInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

Wei Xue

181

22 May 2023

Duplex Diffusion Models Improve Speech-to-Speech TranslationAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Xianchao Wu

DiffM

223

22 May 2023

Guided Motion Diffusion for Controllable Human Motion SynthesisIEEE International Conference on Computer Vision (ICCV), 2023

Korrawe Karunratanakul

Konpat Preechakul

Supasorn Suwajanakorn

Siyu Tang

DiffM

427

205

21 May 2023

Towards Consistent Stochastic Human Motion Prediction via Motion DiffusionEuropean Conference on Computer Vision (ECCV), 2023

Jiarui Sun

Girish Chowdhary

DiffM

247

21 May 2023

Spatio-temporal Diffusion Point ProcessesKnowledge Discovery and Data Mining (KDD), 2023

Yuan Yuan

Jingtao Ding

Chenyang Shao

Depeng Jin

Yong Li

DiffM

240

21 May 2023

DiffCap: Exploring Continuous Diffusion on Image Captioning

Zefan Cai

205

20 May 2023

Incomplete Multi-view Clustering via Diffusion Completion

Sifan Fang

DiffM

172

19 May 2023

Data Redaction from Conditional Generative Models

Zhifeng Kong

Kamalika Chaudhuri

KELM

209

18 May 2023

Blackout Diffusion: Generative Diffusion Models in Discrete-State SpacesInternational Conference on Machine Learning (ICML), 2023

261

18 May 2023

FastFit: Towards Real-Time Iterative Neural Vocoder by Replacing U-Net Encoder With Multiple STFTsInterspeech (Interspeech), 2023

Won Jang

D. Lim

Heayoung Park

198

18 May 2023

Catch-Up Distillation: You Only Need to Train Once for Accelerating Sampling

381

18 May 2023

Controllable Mind Visual Diffusion ModelAAAI Conference on Artificial Intelligence (AAAI), 2023

Xuhui Liu

Xu Tang

229

17 May 2023

Discrete Diffusion Probabilistic Models for Symbolic Music GenerationInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

176

16 May 2023

TESS: Text-to-Text Self-Conditioned Simplex DiffusionConference of the European Chapter of the Association for Computational Linguistics (EACL), 2023

Rabeeh Karimi Mahabadi

Arman Cohan

300

15 May 2023

Learn to Sing by Listening: Building Controllable Virtual Singer by Unsupervised Learning from Voice Recordings

Wei Xue

Yiwen Wang

Qi-fei Liu

Yi-Ting Guo

183

09 May 2023

Can Diffusion Model Achieve Better Performance in Text Generation? Bridging the Gap between Training and Inference!Annual Meeting of the Association for Computational Linguistics (ACL), 2023

212

08 May 2023

A Variational Perspective on Solving Inverse Problems with Diffusion ModelsInternational Conference on Learning Representations (ICLR), 2023

323

206

07 May 2023