v1v2v3v4v5 (latest)

eDiff-I: Text-to-Image Diffusion Models with an Ensemble of Expert Denoisers

2 November 2022

Qinsheng Zhang

ArXiv (abs)PDF HTML HuggingFace (3 upvotes)

Papers citing "eDiff-I: Text-to-Image Diffusion Models with an Ensemble of Expert Denoisers"

50 / 767 papers shown

A Unified Diffusion Framework for Scene-aware Human Motion Estimation from Sparse Signals

Jingyi Yu

203

07 Apr 2024

InitNO: Boosting Text-to-Image Diffusion Models via Initial Noise Optimization

382

06 Apr 2024

Aligning Diffusion Models by Optimizing Human Utility

Shufan Li

Konstantinos Kallidromitis

Akash Gokul

Yusuke Kato

Kazuki Kozuka

308

06 Apr 2024

Identity Decoupling for Multi-Subject Personalization of Text-to-Image Models

271

05 Apr 2024

AI Royalties -- an IP Framework to Compensate Artists & IP Holders for AI-Generated Content

260

05 Apr 2024

On the Scalability of Diffusion-based Text-to-Image GenerationComputer Vision and Pattern Recognition (CVPR), 2024

224

03 Apr 2024

Faster Diffusion via Temporal Attention Decomposition

Juan-Manuel Perez-Rua

Jürgen Schmidhuber

DiffM

528

03 Apr 2024

Upsample Guidance: Scale Up Diffusion Models without Training

Juno Hwang

Yong-Hyun Park

Junghyo Jo

175

02 Apr 2024

A Unified and Interpretable Emotion Representation and Expression Generation

Luc Van Gool

151

01 Apr 2024

DreamSalon: A Staged Diffusion Framework for Preserving Identity-Context in Editable Face Generation

Mengmeng Wang

Guang Dai

Jingdong Wang

224

28 Mar 2024

Imperceptible Protection against Style Imitation from Diffusion Models

390

28 Mar 2024

TextCraftor: Your Text Encoder Can be Image Quality Controller

303

27 Mar 2024

CPR: Retrieval Augmented Generation for Copyright Protection

309

27 Mar 2024

Attention Calibration for Disentangled Text-to-Image Personalization

361

27 Mar 2024

SD-DiT: Unleashing the Power of Self-supervised Discrimination in Diffusion Transformer

Yingwei Pan

Tao Mei

212

25 Mar 2024

Be Yourself: Bounded Attention for Multi-Subject Text-to-Image Generation

Omer Dahary

Or Patashnik

Kfir Aberman

Daniel Cohen-Or

DiffM

269

25 Mar 2024

Refining Text-to-Image Generation: Towards Accurate Training-Free Glyph-Enhanced Image Generation

Vinija Jain

169

25 Mar 2024

DreamFlow: High-Quality Text-to-3D Generation by Approximating Probability FlowInternational Conference on Learning Representations (ICLR), 2024

Kyungmin Lee

Kihyuk Sohn

Jinwoo Shin

227

22 Mar 2024

Multimodal-Conditioned Latent Diffusion Models for Fashion Image Editing

257

21 Mar 2024

Latent Diffusion Models for Attribute-Preserving Image Anonymization

207

21 Mar 2024

Champ: Controllable and Consistent Human Image Animation with 3D Parametric Guidance

Xun Cao

379

229

21 Mar 2024

Harmonizing Visual and Textual Embeddings for Zero-Shot Text-to-Image Customization

Nojun Kwak

162

21 Mar 2024

Efficient Video Diffusion Models via Content-Frame Motion-Latent Decomposition

De-An Huang

277

21 Mar 2024

ReGround: Improving Textual and Spatial Grounding at No Cost

Yuseung Lee

Minhyuk Sung

DiffM

399

20 Mar 2024

Scaling Diffusion Models to Real-World 3D LiDAR Scene Completion

Benedikt Mersch

240

20 Mar 2024

Text-to-3D Shape Generation

Han-Hung Lee

Manolis Savva

Angel X. Chang

261

20 Mar 2024

Diffusion Model for Data-Driven Black-Box Optimization

Zihao Li

Hui Yuan

Kaixuan Huang

Mengdi Wang

250

20 Mar 2024

FouriScale: A Frequency Perspective on Training-Free High-Resolution Image Synthesis

263

19 Mar 2024

You Only Sample Once: Taming One-Step Text-to-Image Synthesis by Self-Cooperative Diffusion GANs

426

19 Mar 2024

LASPA: Latent Spatial Alignment for Fast Training-free Single Image Editing

Yazeed Alharbi

Peter Wonka

DiffM

197

19 Mar 2024

One-Step Image Translation with Text-to-Image Models

298

104

18 Mar 2024

Fast High-Resolution Image Synthesis with Latent Adversarial Diffusion DistillationACM SIGGRAPH Conference and Exhibition on Computer Graphics and Interactive Techniques in Asia (SIGGRAPH Asia), 2024

355

222

18 Mar 2024

Denoising Task Difficulty-based Curriculum for Training Diffusion ModelsInternational Conference on Learning Representations (ICLR), 2024

694

15 Mar 2024

Switch Diffusion Transformer: Synergizing Denoising Tasks with Sparse Mixture-of-ExpertsEuropean Conference on Computer Vision (ECCV), 2024

312

14 Mar 2024

Desigen: A Pipeline for Controllable Design Template GenerationComputer Vision and Pattern Recognition (CVPR), 2024

Yu Qiao

Tong Zhang

205

14 Mar 2024

SCP-Diff: Spatial-Categorical Joint Prior for Diffusion Based Semantic Image SynthesisEuropean Conference on Computer Vision (ECCV), 2024

372

14 Mar 2024

ARtVista: Gateway To Empower Anyone Into Artist

169

13 Mar 2024

FaceChain-SuDe: Building Derived Class to Inherit Category Attributes for One-shot Subject-Driven GenerationComputer Vision and Pattern Recognition (CVPR), 2024

135

11 Mar 2024

DivCon: Divide and Conquer for Complex Numerical and Spatial Reasoning in Text-to-Image Generation

Yuhao Jia

Wenhan Tan

DiffM

314

11 Mar 2024

FastVideoEdit: Leveraging Consistency Models for Efficient Text-to-Video EditingIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024

166

10 Mar 2024

VideoElevator: Elevating Video Generation Quality with Versatile Text-to-Image Diffusion Models

Wangmeng Zuo

223

08 Mar 2024

ELLA: Equip Diffusion Models with LLM for Enhanced Semantic Alignment

288

249

08 Mar 2024

Sora as a World Model? A Complete Survey on Text-to-Video Generation

Joseph Cho

Fachrina Dewi Puspitasari

Sheng Zheng

Jingyao Zheng

Noor Ul Eman

...

Caiyan Qin

Tae-Ho Kim

Choong Seon Hong

Yang Yang

Heng Tao Shen

EGVM VGen

288

08 Mar 2024

Controllable Generation with Text-to-Image Diffusion Models: A Survey

291

07 Mar 2024

NoiseCollage: A Layout-Aware Text-to-Image Diffusion Model Based on Noise Cropping and Merging

Takahiro Shirakawa

Seiichi Uchida

DiffM

213

06 Mar 2024

PLACE: Adaptive Layout-Semantic Fusion for Semantic Image Synthesis

Zheng Lv

Yuxiang Wei

Wangmeng Zuo

Kwan-Yee K. Wong

213

04 Mar 2024

RealCustom: Narrowing Real Text Word for Real-Time Open-Domain Text-to-Image Customization

Mengqi Huang

212

01 Mar 2024

DistriFusion: Distributed Parallel Inference for High-Resolution Diffusion Models

Tianle Cai

Qinsheng Zhang

Song Han

417

29 Feb 2024

Panda-70M: Captioning 70M Videos with Multiple Cross-Modality Teachers

...

Hsin-Ying Lee

Ming-Hsuan Yang

369

342

29 Feb 2024

Trajectory Consistency Distillation: Improved Latent Consistency Distillation by Semi-Linear Consistency Function with Trajectory Mapping

348

29 Feb 2024