v1v2 (latest)

JEN-1: Text-Guided Universal Music Generation with Omnidirectional Diffusion Models

Conference on Algebraic Informatics (CAI), 2023

9 August 2023

ArXiv (abs)PDF HTML HuggingFace (32 upvotes)

Papers citing "JEN-1: Text-Guided Universal Music Generation with Omnidirectional Diffusion Models"

50 / 69 papers shown

AudioMoG: Guiding Audio Generation with Mixture-of-Guidance

137

28 Sep 2025

LiLAC: A Lightweight Latent ControlNet for Musical Audio Generation

Tom Baker

Javier Nistal

DiffM

237

13 Jun 2025

Auto-Regressive vs Flow-Matching: a Comparative Study of Modeling Paradigms for Text-to-Music Generation

337

10 Jun 2025

A Review on Score-based Generative Models for Audio Applications

214

10 Jun 2025

A Survey on Cross-Modal Interaction Between Music and Multimodal Data

305

17 Apr 2025

Analyzable Chain-of-Musical-Thought Prompting for High-Fidelity Music Generation

...

352

25 Mar 2025

InspireMusic: Integrating Super Resolution and Large Language Model for High-Fidelity Long-Form Music Generation

...

154

28 Feb 2025

NOTA: Multimodal Music Notation Understanding for Visual Large Language ModelNorth American Chapter of the Association for Computational Linguistics (NAACL), 2025

210

17 Feb 2025

Music for All: Representational Bias and Cross-Cultural Adaptability of Music Generation ModelsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2025

593

11 Feb 2025

Editing Music with Melody and Text: Using ControlNet for Diffusion TransformerIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2024

315

17 Jan 2025

MusicFlow: Cascaded Flow Matching for Text Guided Music GenerationInternational Conference on Machine Learning (ICML), 2024

Bowen Shi

...

Baishan Guo

Huiyu Wang

Triantafyllos Afouras

David Kant

Wei-Ning Hsu

192

27 Oct 2024

Multi-Source Music Generation with Latent Diffusion

406

10 Sep 2024

FLUX that Plays Music

316

01 Sep 2024

MusiConGen: Rhythm and Chord Control for Transformer-Based Text-to-Music Generation

198

21 Jul 2024

Audio Conditioning for Music Generation via Discrete Bottleneck Features

Yossi Adi

308

17 Jul 2024

High Fidelity Text-Guided Music Generation and Editing via Single-Stage Flow Matching

Zhaoheng Ni

...

Ernie Chang

120

04 Jul 2024

Towards Training Music Taggers on Synthetic Data

N. Kroher

Steven Manangu

A. Pikrakis

183

02 Jul 2024

JEN-1 DreamStyler: Customized Musical Concept Learning via Pivotal Parameters Tuning

Alex Wang

184

18 Jun 2024

Joint Audio and Symbolic Conditioning for Temporally Controlled Text-to-Music Generation

Yossi Adi

195

16 Jun 2024

Diff-A-Riff: Musical Accompaniment Co-creation via Latent Diffusion Models

302

12 Jun 2024

Autoregressive Diffusion Transformer for Text-to-Speech Synthesis

Zhijun Liu

Haizhou Li

184

08 Jun 2024

A Survey of Deep Learning Audio Generation Methods

Matej Bozic

Marko Horvat

VLM MedIm

299

31 May 2024

Instruct-MusicGen: Unlocking Text-to-Music Editing for Music Language Models via Instruction Tuning

Marco A. Martínez-Ramírez

427

28 May 2024

Quality-aware Masked Diffusion Transformer for Enhanced Music Generation

391

24 May 2024

Music Consistency Models

Zhengcong Fei

Mingyuan Fan

Junshi Huang

DiffM

197

20 Apr 2024

MusicMagus: Zero-Shot Text-to-Music Editing via Diffusion Models

Yixiao Zhang

Yukara Ikemiya

Gus Xia

Naoki Murata

Marco A. Martínez-Ramírez

Wei-Hsiang Liao

Yuki Mitsufuji

Simon Dixon

307

09 Feb 2024

Fast Timing-Conditioned Latent Audio Diffusion

502

192

07 Feb 2024

Bass Accompaniment Generation via Latent Diffusion

Marco Pasini

M. Grachten

Stefan Lattner

198

02 Feb 2024

Masked Audio Generation using a Single Non-Autoregressive TransformerInternational Conference on Learning Representations (ICLR), 2024

Yossi Adi

390

09 Jan 2024

Audiobox: Unified Audio Generation with Natural Language Prompts

...

315

137

25 Dec 2023

Can MusicGen Create Training Data for MIR Tasks?

207

15 Nov 2023

JEN-1 Composer: A Unified Framework for High-Fidelity Multi-Track Music GenerationAAAI Conference on Artificial Intelligence (AAAI), 2023

212

29 Oct 2023

Stack-and-Delay: a new codebook pattern for music generationIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

207

15 Sep 2023

AudioPaLM: A Large Language Model That Can Speak and Listen

Paul Kishan Rubenstein

Chulayuth Asawaroengchai

...

253

390

22 Jun 2023

Simple and Controllable Music GenerationNeural Information Processing Systems (NeurIPS), 2023

Yossi Adi

429

583

08 Jun 2023

Text-to-Audio Generation using Instruction-Tuned LLM and Latent Diffusion Model

348

190

24 Apr 2023

Noise2Music: Text-conditioned Music Generation with Diffusion Models

...

338

245

08 Feb 2023

Make-An-Audio: Text-To-Audio Generation with Prompt-Enhanced Diffusion ModelsInternational Conference on Machine Learning (ICML), 2023

Rongjie Huang

Dongchao Yang

Zhou Zhao

400

427

30 Jan 2023

AudioLDM: Text-to-Audio Generation with Latent Diffusion ModelsInternational Conference on Machine Learning (ICML), 2023

726

665

29 Jan 2023

Moûsai: Text-to-Music Generation with Long-Context Latent Diffusion

357

111

27 Jan 2023

MusicLM: Generating Music From Text

...

708

595

26 Jan 2023

High Fidelity Neural Audio Compression

Alexandre Défossez

Jade Copet

Gabriel Synnaeve

Yossi Adi

300

982

24 Oct 2022

Scaling Instruction-Finetuned Language ModelsJournal of machine learning research (JMLR), 2022

...

1.3K

3,790

20 Oct 2022

AudioGen: Textually Guided Audio GenerationInternational Conference on Learning Representations (ICLR), 2022

Devi Parikh

Yossi Adi

391

30 Sep 2022

AudioLM: a Language Modeling Approach to Audio GenerationIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2022

Olivier Pietquin

...

392

813

07 Sep 2022

Prompt-to-Prompt Image Editing with Cross Attention ControlInternational Conference on Learning Representations (ICLR), 2022

Amir Hertz

Ron Mokady

J. Tenenbaum

Kfir Aberman

Yael Pritch

Daniel Cohen-Or

DiffM

711

2,323

02 Aug 2022

Classifier-Free Diffusion Guidance

Jonathan Ho

Tim Salimans

FaML

470

5,280

26 Jul 2022

Diffsound: Discrete Diffusion Model for Text-to-sound GenerationIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2022

Dongchao Yang

Helin Wang

Dong Yu

262

379

20 Jul 2022

Photorealistic Text-to-Image Diffusion Models with Deep Language UnderstandingNeural Information Processing Systems (NeurIPS), 2022

...

Raphael Gontijo-Lopes

David J Fleet

1.1K

7,473

23 May 2022

Symbolic music generation conditioned on continuous-valued emotionsIEEE Access (IEEE Access), 2022

194

30 Mar 2022