v1v2v3 (latest)

DiffWave: A Versatile Diffusion Model for Audio Synthesis

International Conference on Learning Representations (ICLR), 2020

21 September 2020

Papers citing "DiffWave: A Versatile Diffusion Model for Audio Synthesis"

50 / 1,134 papers shown

Research on Anomaly Detection Methods Based on Diffusion Models

Yi Chen

DiffM

326

08 May 2025

Wasserstein Convergence of Score-based Generative Models under Semiconvexity and Discontinuous Gradients

Stefano Bruno

Sotirios Sabanis

DiffM

477

06 May 2025

T2S: High-resolution Time Series Generation with Text-to-Series Diffusion ModelsInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

765

05 May 2025

A Time-Series Data Augmentation Model through Diffusion and Transformer Integration

Yuren Zhang

Zhongnan Pu

Lei Jing

195

01 May 2025

TriniMark: A Robust Generative Speech Watermarking Method for Trinity-Level Attribution

Yue Li

Wen Liu

Dongdong Lin

284

29 Apr 2025

Integration Flow Models

967

28 Apr 2025

SOLIDO: A Robust Watermarking Method for Speech Synthesis via Low-Rank Adaptation

Yue Li

Weizhi Liu

Dongdong Lin

374

21 Apr 2025

Emergence and Evolution of Interpretable Concepts in Diffusion Models

271

21 Apr 2025

Novel Concept-Oriented Synthetic Data approach for Training Generative AI-Driven Crystal Grain Analysis Using Diffusion ModelComputational materials science (Comput. Mater. Sci.), 2025

194

21 Apr 2025

Diffusion-Driven Inertial Generated Data for Smartphone Location Classification

169

20 Apr 2025

Image Editing with Diffusion Models: A Survey

322

17 Apr 2025

Beyond Words: Augmenting Discriminative Richness via Diffusions in Unsupervised Prompt LearningComputer Vision and Pattern Recognition (CVPR), 2025

227

16 Apr 2025

Generalized Visual Relation Detection with Diffusion Models

285

16 Apr 2025

Deep Audio Watermarks are Shallow: Limitations of Post-Hoc Watermarking Techniques for Speech

275

15 Apr 2025

SD-ReID: View-aware Stable Diffusion for Aerial-Ground Person Re-Identification

328

13 Apr 2025

Scalable Motion In-betweening via Diffusion and Physics-Based Character Adaptation

Jia Qin

DiffM VGen

236

13 Apr 2025

D$^2$iT: Dynamic Diffusion Transformer for Accurate Image Generation

^2

iT: Dynamic Diffusion Transformer for Accurate Image GenerationComputer Vision and Pattern Recognition (CVPR), 2025

306

13 Apr 2025

On the Design of Diffusion-based Neural Speech Codecs

Pietro Foti

Andreas Brendel

DiffM

190

11 Apr 2025

SlimSpeech: Lightweight and Efficient Text-to-Speech with Slim Rectified FlowIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2025

453

10 Apr 2025

Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics

177

09 Apr 2025

A Hybrid Wavelet-Fourier Method for Next-Generation Conditional Diffusion Models

Andrew Kiruluta

Andreas Lemos

DiffM

244

04 Apr 2025

A Survey on Music Generation from Single-Modal, Cross-Modal, and Multi-Modal Perspectives

568

01 Apr 2025

ORAL: Prompting Your Large-Scale LoRAs via Conditional Recurrent Diffusion

Rana Muhammad Shahroz Khan

1.1K

31 Mar 2025

Dual Audio-Centric Modality Coupling for Talking Head Generation

Ao Fu

Ziqi Ni

Yi Zhou

303

26 Mar 2025

PCM : Picard Consistency Model for Fast Parallel Sampling of Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2025

339

25 Mar 2025

Improving Discriminator Guidance in Diffusion Models

307

20 Mar 2025

WaveFM: A High-Fidelity and Efficient Vocoder Based on Flow MatchingNorth American Chapter of the Association for Computational Linguistics (NAACL), 2025

235

20 Mar 2025

Bezier Distillation

Ling Feng

SK Yang

152

20 Mar 2025

DiffGAP: A Lightweight Diffusion Module in Contrastive Space for Bridging Cross-Model GapIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2025

234

15 Mar 2025

Cross-Modal Diffusion for Biomechanical Dynamical Systems Through Local Manifold Alignment

S. Dey

Sarath Ravindran Nair

DiffM

296

15 Mar 2025

StFT: Spatio-temporal Fourier Transformer for Long-term Dynamics Prediction

344

14 Mar 2025

MAVFlow: Preserving Paralinguistic Elements with Conditional Flow Matching for Zero-Shot AV2AV Multilingual Translation

322

14 Mar 2025

^R

FLAV: Rolling Flow matching for infinite Audio Video generation

210

13 Mar 2025

Probabilistic Forecasting via Autoregressive Flow Matching

Ahmed El-Gazzar

Marcel van Gerven

AI4TS

286

13 Mar 2025

Data augmentation using diffusion models to enhance inverse Ising inferencePhysical Review E (Phys. Rev. E), 2025

180

13 Mar 2025

Studying Classifier(-Free) Guidance From a Classifier-Centric Perspective

Xiaoming Zhao

Alexander Schwing

FaML

368

13 Mar 2025

Probability-Flow ODE in Infinite-Dimensional Function Spaces

285

13 Mar 2025

Accelerating Diffusion Sampling via Exploiting Local Transition Coherence

322

12 Mar 2025

Understanding the Quality-Diversity Trade-off in Diffusion Language Models

Zak Buzzard

DiffM

192

11 Mar 2025

Boosting Diffusion-Based Text Image Super-Resolution Model Towards Generalized Real-World Scenarios

455

10 Mar 2025

Backdoor Attacks on Discrete Graph Diffusion Models

473

08 Mar 2025

Accelerating db-A* for Kinodynamic Motion Planning Using Diffusion

303

07 Mar 2025

Discrete Contrastive Learning for Diffusion Policies in Autonomous DrivingIEEE International Conference on Robotics and Automation (ICRA), 2025

198

07 Mar 2025

Towards Understanding Text Hallucination of Diffusion Models via Local Generation BiasInternational Conference on Learning Representations (ICLR), 2025

286

05 Mar 2025

Self-attention-based Diffusion Model for Time-series Imputation in Partial Blackout ScenariosAAAI Conference on Artificial Intelligence (AAAI), 2025

Mohammad Rafid Ul Islam

Prasad Tadepalli

Alan Fern

177

03 Mar 2025

Enhancing Retinal Vessel Segmentation Generalization via Layout-Aware Generative Modelling

456

03 Mar 2025

Dynamical Diffusion: Learning Temporal Dynamics with Diffusion ModelsInternational Conference on Learning Representations (ICLR), 2025

357

02 Mar 2025

Optimal Stochastic Trace Estimation in Generative ModelingInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2025

262

26 Feb 2025

DualSpec: Text-to-spatial-audio Generation via Dual-Spectrogram Guided Diffusion Model

417

26 Feb 2025

Diffusion-based Planning with Learned Viability FiltersProceedings of the ACM on Computer Graphics and Interactive Techniques (PACMCGIT), 2025

258

26 Feb 2025