v1v2v3 (latest)

DiffWave: A Versatile Diffusion Model for Audio Synthesis

International Conference on Learning Representations (ICLR), 2020

21 September 2020

Papers citing "DiffWave: A Versatile Diffusion Model for Audio Synthesis"

50 / 1,135 papers shown

Revisiting Energy Based Models as Policies: Ranking Noise Contrastive Estimation and Interpolating Energy Models

285

11 Sep 2023

Diffusion-Based Co-Speech Gesture Generation Using Joint Text and Audio RepresentationInternational Conference on Multimodal Interaction (ICMI), 2023

227

11 Sep 2023

Discrete Denoising Diffusion Approach to Integer FactorizationInternational Conference on Artificial Neural Networks (ICANN), 2023

143

11 Sep 2023

Variations and Relaxations of Normalizing Flows

275

08 Sep 2023

Matcha-TTS: A fast TTS architecture with conditional flow matchingIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

312

179

06 Sep 2023

BigVSAN: Enhancing GAN-based Neural Vocoders with Slicing Adversarial NetworkIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

Takashi Shibuya

Yuhta Takida

Yuki Mitsufuji

272

06 Sep 2023

sasdim: self-adaptive noise scaling diffusion model for spatial time series imputationInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

177

05 Sep 2023

DiffHPE: Robust, Coherent 3D Human Pose Lifting with Diffusion

224

04 Sep 2023

FinDiff: Diffusion Models for Financial Tabular Data GenerationInternational Conference on AI in Finance (ICAF), 2023

199

04 Sep 2023

NADiffuSE: Noise-aware Diffusion-based Model for Speech EnhancementAsia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), 2023

Dongchao Yang

290

03 Sep 2023

Diffusion Models with Deterministic Normalizing Flow Priors

380

03 Sep 2023

PathLDM: Text conditioned Latent Diffusion Model for HistopathologyIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

365

01 Sep 2023

VideoGen: A Reference-Guided Latent Diffusion Approach for High Definition Text-to-Video Generation

Errui Ding

Jingdong Wang

VGen

332

01 Sep 2023

LightGrad: Lightweight Diffusion Probabilistic Model for Text-to-SpeechIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

Binbin Zhang

Zhiyong Wu

163

31 Aug 2023

A Review of Differentiable Digital Signal Processing for Music & Speech SynthesisFrontiers in Signal Processing (FSP), 2023

240

29 Aug 2023

Elucidating the Exposure Bias in Diffusion ModelsInternational Conference on Learning Representations (ICLR), 2023

521

29 Aug 2023

C2G2: Controllable Co-speech Gesture Generation with Latent Diffusion Model

Xiang Yin

149

29 Aug 2023

Transfusor: Transformer Diffusor for Controllable Human-like Generation of Vehicle Lane Changing Trajectories

Jiqian Dong

Sikai Chen

Samuel Labi

155

28 Aug 2023

Voice Conversion with Denoising Diffusion Probabilistic GAN ModelsInternational Conference on Advanced Data Mining and Applications (ADMA), 2023

150

28 Aug 2023

AI-Generated Content (AIGC) for Various Data Modalities: A SurveyACM Computing Surveys (ACM Comput. Surv.), 2023

Lin Geng Foo

Hossein Rahmani

Jing Liu

770

27 Aug 2023

DiffI2I: Efficient Diffusion Model for Image-to-Image TranslationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Luc Van Gool

242

26 Aug 2023

Exploiting Time-Frequency Conformers for Music Audio EnhancementACM Multimedia (ACM MM), 2023

181

24 Aug 2023

Audio Generation with Multiple Conditional Diffusion ModelAAAI Conference on Artificial Intelligence (AAAI), 2023

Hong Liu

Xiangdong Wang

DiffM

350

23 Aug 2023

Shape-conditioned 3D Molecule Generation via Equivariant Diffusion Models

Ziqi Chen

Bo Peng

Srinivas Parthasarathy

Xia Ning

DiffM

318

23 Aug 2023

Diffusion Language Models Can Perform Many Tasks with Scaling and Instruction-Finetuning

Jiasheng Ye

Quanquan Gu

647

23 Aug 2023

Convergence guarantee for consistency models

155

22 Aug 2023

Fast Inference and Update of Probabilistic Density Estimation on Trajectory PredictionIEEE International Conference on Computer Vision (ICCV), 2023

Takahiro Maeda

Norimichi Ukita

241

17 Aug 2023

Enhancing Phrase Representation by Information Bottleneck Guided Text Diffusion Process for Keyphrase ExtractionInternational Conference on Language Resources and Evaluation (LREC), 2023

211

17 Aug 2023

DiffV2S: Diffusion-based Video-to-Speech Synthesis with Vision-guided Speaker EmbeddingIEEE International Conference on Computer Vision (ICCV), 2023

192

15 Aug 2023

iSTFTNet2: Faster and More Lightweight iSTFT-Based Neural Vocoder Using 1D-2D CNNInterspeech (Interspeech), 2023

166

14 Aug 2023

ModelScope Text-to-Video Technical Report

348

615

12 Aug 2023

Audio is all in one: speech-driven gesture synthetics using WavLM pre-trained model

249

11 Aug 2023

AudioLDM 2: Learning Holistic Audio Generation with Self-supervised Pretraining

Yuxuan Wang

356

387

10 Aug 2023

On Error Propagation of Diffusion ModelsInternational Conference on Learning Representations (ICLR), 2023

Yangming Li

M. Schaar

DiffM

259

09 Aug 2023

JEN-1: Text-Guided Universal Music Generation with Omnidirectional Diffusion ModelsConference on Algebraic Informatics (CAI), 2023

672

09 Aug 2023

From Unimodal to Multimodal: improving sEMG-Based Pattern Recognition via deep generative models

Wentao Wei

Linyan Ren

109

08 Aug 2023

Diffusion Model in Causal Inference with Unmeasured ConfoundersIEEE Symposium Series on Computational Intelligence (IEEE-SSCI), 2023

Tatsuhiro Shimizu

DiffM

270

07 Aug 2023

DiffDance: Cascaded Human Motion Diffusion Model for Dance GenerationACM Multimedia (ACM MM), 2023

223

05 Aug 2023

Improved Order Analysis and Design of Exponential Integrator for Diffusion Models Sampling

Qinsheng Zhang

Jiaming Song

Yongxin Chen

DiffM

188

04 Aug 2023

Synthesizing Long-Term Human Motions with Diffusion Models via Coherent SamplingACM Multimedia (ACM MM), 2023

244

03 Aug 2023

MusicLDM: Enhancing Novelty in Text-to-Music Generation Using Beat-Synchronous Mixup StrategiesIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

Taylor Berg-Kirkpatrick

Shlomo Dubnov

DiffM

253

128

03 Aug 2023

From Discrete Tokens to High-Fidelity Audio Using Multi-Band DiffusionNeural Information Processing Systems (NeurIPS), 2023

Robin San Roman

Yossi Adi

Antoine Deleforge

Romain Serizel

Gabriel Synnaeve

Alexandre Défossez

DiffM

255

02 Aug 2023

DAVIS: High-Quality Audio-Visual Separation with Generative Diffusion ModelsAsian Conference on Computer Vision (ACCV), 2023

183

31 Jul 2023

Image Synthesis under Limited Data: A Survey and TaxonomyInternational Journal of Computer Vision (IJCV), 2023

Mengping Yang

Zhe Wang

241

31 Jul 2023

A Novel DDPM-based Ensemble Approach for Energy Theft Detection in Smart Grids

Yang Yang

147

30 Jul 2023

RGB-D-Fusion: Image Conditioned Depth Diffusion of Humanoid SubjectsIEEE Access (IEEE Access), 2023

200

29 Jul 2023

Minimally-Supervised Speech Synthesis with Conditional Diffusion Model and Language Model: A Comparative Study of Semantic CodingIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

Hao Li

Tao Wang

Longbiao Wang

Jianwu Dang

DiffM

199

28 Jul 2023

TransFusion: Generating Long, High Fidelity Time Series using Diffusion Models with TransformersMachine Learning with Applications (MLWA), 2023

Md Fahim Sikder

R. Ramachandranpillai

Fredrik Heintz

DiffM

262

24 Jul 2023

Predict, Refine, Synthesize: Self-Guiding Diffusion Models for Probabilistic Time Series ForecastingNeural Information Processing Systems (NeurIPS), 2023

Marcel Kollovieh

Abdul Fatir Ansari

Michael Bohlke-Schneider

316

21 Jul 2023

Progressive distillation diffusion for raw music generation

Svetlana Pavlova

DiffM

227

20 Jul 2023