Fast Timing-Conditioned Latent Audio Diffusion

Fast Timing-Conditioned Latent Audio Diffusion

7 February 2024

Scott H. Hawley

Papers citing "Fast Timing-Conditioned Latent Audio Diffusion"

19 / 19 papers shown

Title
OmniAudio: Generating Spatial Audio from 360-Degree Video Huadai Liu Tianyi Luo Qikai Jiang Kaicheng Luo Peiwen Sun ... X. Li Shiliang Zhang Zhijie Yan Zhou Zhao Wei Xue VGen 46 0 0 21 Apr 2025
LoopGen: Training-Free Loopable Music Generation Davide Marincione Giorgio Strano Donato Crisostomi Roberto Ribuoli Emanuele Rodolà MGen 43 0 0 06 Apr 2025
RayFlow: Instance-Aware Diffusion Acceleration via Adaptive Flow Trajectories Huiyang Shao Xin Xia Y. Yang Yuxi Ren Xing Wang Xuefeng Xiao 48 1 0 10 Mar 2025
Beyond Fixed Horizons: A Theoretical Framework for Adaptive Denoising Diffusions Soren Christensen C. Strauch Lukas Trottner DiffM 93 0 0 31 Jan 2025
Editing Music with Melody and Text: Using ControlNet for Diffusion Transformer Siyuan Hou Shansong Liu Ruibin Yuan Wei Xue Ying Shan Mangsuo Zhao Chao Zhang 79 3 0 17 Jan 2025
COCOLA: Coherence-Oriented Contrastive Learning of Musical Audio Representations Ruben Ciranni Emilian Postolache Giorgio Mariani Michele Mancusi Giorgio Fabbro Emanuele Rodolà Luca Cosmo 49 7 0 10 Jan 2025
TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching and Clap-Ranked Preference Optimization Chia-Yu Hung Navonil Majumder Zhifeng Kong Ambuj Mehrish Rafael Valle Bryan Catanzaro Soujanya Poria Bryan Catanzaro Soujanya Poria 46 4 0 30 Dec 2024
SoftVQ-VAE: Efficient 1-Dimensional Continuous Tokenizer H. Chen Z. Wang X. Li X. Sun Fangyi Chen Jiang Liu J. Wang Bhiksha Raj Zicheng Liu Emad Barsoum VLM 99 6 0 14 Dec 2024
Linear Convergence of Diffusion Models Under the Manifold Hypothesis Peter Potaptchik Iskander Azangulov George Deligiannidis DiffM 25 5 0 11 Oct 2024
Distillation of Discrete Diffusion through Dimensional Correlations Satoshi Hayakawa Yuhta Takida Masaaki Imaizumi Hiromi Wakaki Yuki Mitsufuji DiffM 48 0 0 11 Oct 2024
Presto! Distilling Steps and Layers for Accelerating Music Generation Zachary Novack Ge Zhu Jonah Casebeer Julian McAuley Taylor Berg-Kirkpatrick Nicholas J. Bryan 38 4 0 07 Oct 2024
Synthio: Augmenting Small-Scale Audio Classification Datasets with Synthetic Data Sreyan Ghosh Sonal Kumar Zhifeng Kong Rafael Valle Bryan Catanzaro Dinesh Manocha DiffM 34 2 0 02 Oct 2024
PDMX: A Large-Scale Public Domain MusicXML Dataset for Symbolic Music Processing Phillip Long Zachary Novack Taylor Berg-Kirkpatrick Julian McAuley 27 0 0 17 Sep 2024
Generating Sample-Based Musical Instruments Using Neural Audio Codec Language Models S. Nercessian Johannes Imort Ninon Devis Frederik Blang 22 1 0 22 Jul 2024
Images that Sound: Composing Images and Sounds on a Single Canvas Ziyang Chen Daniel Geng Andrew Owens DiffM 32 8 0 20 May 2024
Controllable Music Production with Diffusion Models and Guidance Gradients Mark Levy Bruno Di Giorgi Floris Weers Angelos Katharopoulos Tom Nickson DiffM 69 20 0 01 Nov 2023
Text-to-Audio Generation using Instruction-Tuned LLM and Latent Diffusion Model Deepanway Ghosal Navonil Majumder Ambuj Mehrish Soujanya Poria 135 137 0 24 Apr 2023
Make-An-Audio: Text-To-Audio Generation with Prompt-Enhanced Diffusion Models Rongjie Huang Jia-Bin Huang Dongchao Yang Yi Ren Luping Liu Mingze Li Zhenhui Ye Jinglin Liu Xiaoyue Yin Zhou Zhao DiffM 137 304 0 30 Jan 2023
Automatic multitrack mixing with a differentiable mixing console of neural audio effects C. Steinmetz Jordi Pons Santiago Pascual Joan Serra 52 47 0 20 Oct 2020