v1v2 (latest)

Scalable Diffusion Models with Transformers

IEEE International Conference on Computer Vision (ICCV), 2022

19 December 2022

William S. Peebles

Saining Xie

GNN

ArXiv (abs)PDF HTML HuggingFace (18 upvotes)

Papers citing "Scalable Diffusion Models with Transformers"

50 / 2,712 papers shown

Locality-Aware Generalizable Implicit Neural RepresentationNeural Information Processing Systems (NeurIPS), 2023

261

09 Oct 2023

Perceptual Artifacts Localization for Image Synthesis TasksIEEE International Conference on Computer Vision (ICCV), 2023

246

09 Oct 2023

IPDreamer: Appearance-Controllable 3D Object Generation with Complex Image PromptsInternational Conference on Learning Representations (ICLR), 2023

...

Conghui He

289

09 Oct 2023

The Emergence of Reproducibility and Generalizability in Diffusion Models

Huijie Zhang

Jinfan Zhou

Yifu Lu

Minzhe Guo

Peng Wang

Liyue Shen

Qing Qu

DiffM

302

08 Oct 2023

Assessing Robustness via Score-Based Adversarial Image Generation

Leo Schwinn

Stephan Günnemann

DiffM

550

06 Oct 2023

Kandinsky: an Improved Text-to-Image Synthesis with Image Prior and Latent DiffusionConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

334

118

05 Oct 2023

AlignDiff: Aligning Diverse Human Preferences via Behavior-Customisable Diffusion ModelInternational Conference on Learning Representations (ICLR), 2023

Zibin Dong

Jianye Hao

Yan Zheng

Changjie Fan

255

03 Oct 2023

PixArt-

α

: Fast Training of Diffusion Transformer for Photorealistic Text-to-Image SynthesisInternational Conference on Learning Representations (ICLR), 2023

...

Ping Luo

Huchuan Lu

Zhenguo Li

DiffM

600

680

30 Sep 2023

GAIA-1: A Generative World Model for Autonomous Driving

Masane Fuchi

Lloyd Russell

Hudson Yeo

Alex Kendall

Gianluca Corrado

399

422

29 Sep 2023

AdaDiff: Accelerating Diffusion Models through Step-Wise Adaptive ComputationEuropean Conference on Computer Vision (ECCV), 2023

Yaqing Wang

Dongkuan Xu

253

29 Sep 2023

Denoising Diffusion Bridge ModelsInternational Conference on Learning Representations (ICLR), 2023

422

129

29 Sep 2023

Text-to-3D using Gaussian SplattingComputer Vision and Pattern Recognition (CVPR), 2023

494

330

28 Sep 2023

Dream the Impossible: Outlier Imagination with Diffusion ModelsNeural Information Processing Systems (NeurIPS), 2023

332

23 Sep 2023

GLOBER: Coherent Non-autoregressive Video Generation via GLOBal Guided Video DecodERNeural Information Processing Systems (NeurIPS), 2023

160

23 Sep 2023

DreamLLM: Synergistic Multimodal Comprehension and CreationInternational Conference on Learning Representations (ICLR), 2023

Runpei Dong

Chunrui Han

Yuang Peng

...

Xiangyu Zhang

299

275

20 Sep 2023

Cartoondiff: Training-free Cartoon Image Generation with Diffusion Transformer ModelsIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

236

15 Sep 2023

Large-Vocabulary 3D Diffusion Model with TransformerInternational Conference on Learning Representations (ICLR), 2023

Ziwei Liu

295

14 Sep 2023

SA-Solver: Stochastic Adams Solver for Fast Sampling of Diffusion ModelsNeural Information Processing Systems (NeurIPS), 2023

540

10 Sep 2023

MaskDiffusion: Boosting Text-to-Image Consistency with Conditional MaskInternational Journal of Computer Vision (IJCV), 2023

174

08 Sep 2023

Relay Diffusion: Unifying diffusion process across resolutions for image synthesisInternational Conference on Learning Representations (ICLR), 2023

234

04 Sep 2023

VideoGen: A Reference-Guided Latent Diffusion Approach for High Definition Text-to-Video Generation

Errui Ding

Jingdong Wang

VGen

332

01 Sep 2023

Elucidating the Exposure Bias in Diffusion ModelsInternational Conference on Learning Representations (ICLR), 2023

520

29 Aug 2023

Towards Large-scale 3D Representation Learning with Multi-dataset Point Prompt TrainingComputer Vision and Pattern Recognition (CVPR), 2023

Xin Wen

Kaicheng Yu

206

18 Aug 2023

Learning A Coarse-to-Fine Diffusion Transformer for Image Restoration

Cong Wang

226

17 Aug 2023

Accelerating Diffusion-based Combinatorial Optimization Solvers by Progressive Distillation

124

12 Aug 2023

Audio is all in one: speech-driven gesture synthetics using WavLM pre-trained model

249

11 Aug 2023

The Paradigm Shifts in Artificial IntelligenceCommunications of the ACM (CACM), 2023

V. Dhar

AI4TS AI4CE

152

02 Aug 2023

Memory Encoding Model

Huzheng Yang

James C. Gee

Jianbo Shi

135

02 Aug 2023

Understanding the Latent Space of Diffusion Models through the Lens of Riemannian GeometryNeural Information Processing Systems (NeurIPS), 2023

447

109

24 Jul 2023

Diffusion Sampling with Momentum for Mitigating Divergence ArtifactsInternational Conference on Learning Representations (ICLR), 2023

Suttisak Wizadwongsa

Worameth Chinchuthakun

Pramook Khungurn

Amit Raj

Supasorn Suwajanakorn

DiffM

291

20 Jul 2023

BSDM: Background Suppression Diffusion Model for Hyperspectral Anomaly Detection

111

19 Jul 2023

Flow Matching in Latent Space

362

110

17 Jul 2023

Complexity Matters: Rethinking the Latent Space for Generative ModelingNeural Information Processing Systems (NeurIPS), 2023

Tianyang Hu

320

17 Jul 2023

DreamTeacher: Pretraining Image Backbones with Deep Generative ModelsIEEE International Conference on Computer Vision (ICCV), 2023

Antonio Torralba

Sanja Fidler

VLM DiffM

266

14 Jul 2023

AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific TuningInternational Conference on Learning Representations (ICLR), 2023

Yu Qiao

946

1,296

10 Jul 2023

Detecting Images Generated by Deep Diffusion Models using their Local Intrinsic Dimensionality

615

05 Jul 2023

SVDM: Single-View Diffusion Model for Pseudo-Stereo 3D Object Detection

Yuguang Shi

DiffM

258

05 Jul 2023

SDXL: Improving Latent Diffusion Models for High-Resolution Image SynthesisInternational Conference on Learning Representations (ICLR), 2023

1.7K

3,891

04 Jul 2023

DiT-3D: Exploring Plain Diffusion Transformers for 3D Shape GenerationNeural Information Processing Systems (NeurIPS), 2023

Shentong Mo

Enze Xie

Ruihang Chu

Lewei Yao

Lanqing Hong

Matthias Nießner

Zhenguo Li

194

110

04 Jul 2023

Spiking Denoising Diffusion Probabilistic ModelsIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Jiahang Cao

Ziqing Wang

Hanzhong Guo

Haotai Cheng

Qiang Zhang

Renjing Xu

DiffM

307

29 Jun 2023

Federated Generative Learning with Foundation Models

295

28 Jun 2023

Diffusion with Forward Models: Solving Stochastic Inverse Problems Without Direct SupervisionNeural Information Processing Systems (NeurIPS), 2023

William T. Freeman

411

113

20 Jun 2023

EMoG: Synthesizing Emotive Co-speech 3D Gesture with Diffusion Model

Tianyu He

187

20 Jun 2023

Masked Diffusion Models Are Fast Distribution Learners

457

20 Jun 2023

ArtFusion: Controllable Arbitrary Style Transfer using Dual Conditional Latent Diffusion Models

Da Chen

DiffM

224

15 Jun 2023

Fast Training of Diffusion Models with Masked Transformers

324

132

15 Jun 2023

Conditional Human Sketch Synthesis with Explicit Abstraction Control

Da Chen

DiffM

149

15 Jun 2023

DiffAug: A Diffuse-and-Denoise Augmentation for Training Robust ClassifiersNeural Information Processing Systems (NeurIPS), 2023

Chandramouli Shama Sastry

Sri Harsha Dumpala

Sageev Oore

279

15 Jun 2023

Extraction and Recovery of Spatio-Temporal Structure in Latent Dynamics Alignment with Diffusion ModelsNeural Information Processing Systems (NeurIPS), 2023

325

09 Jun 2023

BOOT: Data-free Distillation of Denoising Diffusion Models with Bootstrapping

216

08 Jun 2023