v1v2 (latest)

Scalable Diffusion Models with Transformers

IEEE International Conference on Computer Vision (ICCV), 2022

19 December 2022

William S. Peebles

Saining Xie

GNN

ArXiv (abs)PDF HTML HuggingFace (18 upvotes)

Papers citing "Scalable Diffusion Models with Transformers"

50 / 2,711 papers shown

On the Design Fundamentals of Diffusion Models: A SurveyPattern Recognition (Pattern Recogn.), 2023

Ziyi Chang

George Alex Koulieris

Hyung Jin Chang

Hubert P. H. Shum

DiffM

624

07 Jun 2023

PLANNER: Generating Diversified Paragraph via Latent Language Diffusion ModelNeural Information Processing Systems (NeurIPS), 2023

389

05 Jun 2023

SnapFusion: Text-to-Image Diffusion Model on Mobile Devices within Two SecondsNeural Information Processing Systems (NeurIPS), 2023

Huan Wang

339

234

01 Jun 2023

Coneheads: Hierarchy Aware AttentionNeural Information Processing Systems (NeurIPS), 2023

264

01 Jun 2023

Addressing Negative Transfer in Diffusion ModelsNeural Information Processing Systems (NeurIPS), 2023

545

01 Jun 2023

Humans in 4D: Reconstructing and Tracking Humans with TransformersIEEE International Conference on Computer Vision (ICCV), 2023

Shubham Goel

Georgios Pavlakos

Jathushan Rajasegaran

Angjoo Kanazawa

Jitendra Malik

3DH

387

309

31 May 2023

A Unified Framework for U-Net Design and AnalysisNeural Information Processing Systems (NeurIPS), 2023

Christopher Williams

Fabian Falck

George Deligiannidis

Chris Holmes

Arnaud Doucet

Saifuddin Syed

SSeg AI4CE

234

31 May 2023

Nested Diffusion Processes for Anytime Image GenerationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

251

30 May 2023

Make-An-Audio 2: Temporal-Enhanced Text-to-Audio Generation

Jia-Bin Huang

Yi Ren

Rongjie Huang

Dongchao Yang

Xiang Yin

Zhou Zhao

205

29 May 2023

Diffusion Model is an Effective Planner and Data Synthesizer for Multi-Task Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

Xuelong Li

352

135

29 May 2023

UDPM: Upsampling Diffusion Probabilistic ModelsNeural Information Processing Systems (NeurIPS), 2023

Shady Abu Hussein

Raja Giryes

DiffM

394

25 May 2023

Knowledge Diffusion for DistillationNeural Information Processing Systems (NeurIPS), 2023

Yuan Zhang

Fei Wang

323

25 May 2023

T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified Visual Modalities

331

24 May 2023

VDT: General-purpose Video Diffusion Transformers via Mask ModelingInternational Conference on Learning Representations (ICLR), 2023

Ping Luo

Mingyu Ding

DiffM VGen

223

22 May 2023

U-DiT TTS: U-Diffusion Vision Transformer for Text-to-Speech

Andreas Triantafyllopoulos

Bjoern W. Schuller

206

22 May 2023

Is Synthetic Data From Diffusion Models Ready for Knowledge Distillation?

Zheng Li

Yuxuan Li

Penghai Zhao

Renjie Song

Xiang Li

Jian Yang

197

22 May 2023

ViT-TTS: Visual Text-to-Speech with Scalable Diffusion TransformerConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

Rongjie Huang

Zhou Zhao

333

22 May 2023

Guided Motion Diffusion for Controllable Human Motion SynthesisIEEE International Conference on Computer Vision (ICCV), 2023

Korrawe Karunratanakul

Konpat Preechakul

Supasorn Suwajanakorn

Siyu Tang

DiffM

425

204

21 May 2023

Learning Joint 2D & 3D Diffusion Models for Complete Molecule Generation

286

21 May 2023

LaCon: Late-Constraint Diffusion for Steerable Guided Image Synthesis

464

19 May 2023

Controllable Mind Visual Diffusion ModelAAAI Conference on Artificial Intelligence (AAAI), 2023

Xuhui Liu

Xu Tang

223

17 May 2023

Parameter-Efficient Fine-Tuning for Medical Image Analysis: The Missed OpportunityInternational Conference on Medical Imaging with Deep Learning (MIDL), 2023

Raman Dutt

Linus Ericsson

Pedro Sanchez

Sotirios A. Tsaftaris

Timothy M. Hospedales

MedIm

482

14 May 2023

Visual TuningACM Computing Surveys (ACM Comput. Surv.), 2023

...

438

10 May 2023

BoDiffusion: Diffusing Sparse Observations for Full-Body Human Motion Synthesis

217

21 Apr 2023

Refusion: Enabling Large-Size Realistic Image Restoration with Latent-Space Diffusion Models

Ziwei Luo

Fredrik K. Gustafsson

Zhengli Zhao

Jens Sjölund

Thomas B. Schon

188

160

17 Apr 2023

Control3Diff: Learning Controllable 3D Diffusion Models from Single-view ImagesInternational Conference on 3D Vision (3DV), 2023

267

13 Apr 2023

DiffFit: Unlocking Transferability of Large Diffusion Models via Simple Parameter-Efficient Fine-TuningIEEE International Conference on Computer Vision (ICCV), 2023

615

13 Apr 2023

Intriguing properties of synthetic images: from generative adversarial networks to diffusion models

313

142

13 Apr 2023

Revisiting the Evaluation of Image Synthesis with GANsNeural Information Processing Systems (NeurIPS), 2023

278

04 Apr 2023

Your Diffusion Model is Secretly a Zero-Shot ClassifierIEEE International Conference on Computer Vision (ICCV), 2023

686

309

28 Mar 2023

The Stable Signature: Rooting Watermarks in Latent Diffusion ModelsIEEE International Conference on Computer Vision (ICCV), 2023

Pierre Fernandez

327

298

27 Mar 2023

PDPP: Projected Diffusion for Procedure Planning in Instructional VideosComputer Vision and Pattern Recognition (CVPR), 2023

423

26 Mar 2023

MDTv2: Masked Diffusion Transformer is a Strong Image SynthesizerIEEE International Conference on Computer Vision (ICCV), 2023

1.1K

248

25 Mar 2023

CompoDiff: Versatile Composed Image Retrieval With Latent Diffusion

550

21 Mar 2023

Polynomial Implicit Neural Representations For Large Diverse DatasetsComputer Vision and Pattern Recognition (CVPR), 2023

202

20 Mar 2023

SVDiff: Compact Parameter Space for Diffusion Fine-TuningIEEE International Conference on Computer Vision (ICCV), 2023

Feng Yang

668

367

20 Mar 2023

Denoising Diffusion Autoencoders are Unified Self-supervised LearnersIEEE International Conference on Computer Vision (ICCV), 2023

Yunhong Wang

465

119

17 Mar 2023

Efficient Diffusion Training via Min-SNR Weighting StrategyIEEE International Conference on Computer Vision (ICCV), 2023

Jianmin Bao

305

220

16 Mar 2023

ResDiff: Combining CNN and Diffusion Model for Image Super-ResolutionAAAI Conference on Artificial Intelligence (AAAI), 2023

277

136

15 Mar 2023

Editing Implicit Assumptions in Text-to-Image Diffusion ModelsIEEE International Conference on Computer Vision (ICCV), 2023

363

115

14 Mar 2023

Scaling up GANs for Text-to-Image SynthesisComputer Vision and Pattern Recognition (CVPR), 2023

Jun-Yan Zhu

325

597

09 Mar 2023

TRACT: Denoising Diffusion Models with Transitive Closure Time-Distillation

249

119

07 Mar 2023

DLT: Conditioned layout generation with Joint Discrete-Continuous Diffusion Layout TransformerIEEE International Conference on Computer Vision (ICCV), 2023

201

07 Mar 2023

Understanding Diffusion Objectives as the ELBO with Simple Data AugmentationNeural Information Processing Systems (NeurIPS), 2023

Diederik P. Kingma

Ruiqi Gao

DiffM

744

238

01 Mar 2023

Unlimited-Size Diffusion Restoration

Yinhuai Wang

Jiwen Yu

Runyi Yu

Jian Zhang

192

01 Mar 2023

Diffusion Models and Semi-Supervised Learners Benefit Mutually with Few LabelsNeural Information Processing Systems (NeurIPS), 2023

Jun Zhu

528

21 Feb 2023

A Reparameterized Discrete Diffusion Model for Text Generation

Lin Zheng

Jianbo Yuan

Lei Yu

Lingpeng Kong

DiffM

285

114

11 Feb 2023

Q-Diffusion: Quantizing Diffusion ModelsIEEE International Conference on Computer Vision (ICCV), 2023

Zhen Dong

Shanghang Zhang

374

237

08 Feb 2023

Structure and Content-Guided Video Synthesis with Diffusion ModelsIEEE International Conference on Computer Vision (ICCV), 2023

379

663

06 Feb 2023

Diffusion Models as Artists: Are we Closing the Gap between Humans and Machines?International Conference on Machine Learning (ICML), 2023

274

27 Jan 2023