Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding

Neural Information Processing Systems (NeurIPS), 2022

23 May 2022

Seyed Kamyar Seyed Ghasemipour

Burcu Karagol Ayan

S. S. Mahdavi

Raphael Gontijo-Lopes

David J Fleet

ArXiv (abs)PDF HTML HuggingFace (1 upvotes)

Papers citing "Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding"

50 / 5,041 papers shown

ShaLa: Multimodal Shared Latent Space Modelling

148

24 Aug 2025

Neural Stochastic Differential Equations on Compact State-Spaces

139

23 Aug 2025

Delta-SVD: Efficient Compression for Personalized Text-to-Image Models

110

23 Aug 2025

HiCache: A Plug-in Scaled-Hermite Upgrade for Taylor-Style Cache-then-Forecast Diffusion Acceleration

...

153

23 Aug 2025

Forecast then Calibrate: Feature Caching as ODE for Efficient Diffusion Transformers

...

129

22 Aug 2025

Constraints-Guided Diffusion Reasoner for Neuro-Symbolic Learning

182

22 Aug 2025

PromptFlare: Prompt-Generalized Defense via Cross-Attention Decoy in Diffusion-Based Inpainting

128

22 Aug 2025

On the Collapse Errors Induced by the Deterministic Sampler for Diffusion Models

193

22 Aug 2025

Audio2Face-3D: Audio-driven Realistic Facial Animation For Digital Avatars

259

22 Aug 2025

Scaling Group Inference for Diverse and High-Quality Generation

181

21 Aug 2025

MUSE: Multi-Subject Unified Synthesis via Explicit Layout Semantic Expansion

165

20 Aug 2025

Generative AI models capture realistic sea-ice evolution from days to decades

146

20 Aug 2025

CTA-Flux: Integrating Chinese Cultural Semantics into High-Quality English Text-to-Image Communities

236

20 Aug 2025

Ouroboros: Single-step Diffusion Models for Cycle-consistent Forward and Inverse Rendering

174

20 Aug 2025

Virtual Multiplex Staining for Histological Images using a Marker-wise Conditioned Diffusion Model

249

20 Aug 2025

SAGA: Learning Signal-Aligned Distributions for Improved Text-to-Image Generation

171

19 Aug 2025

Single-Reference Text-to-Image Manipulation with Dual Contrastive Denoising Score

Syed Muhmmad Israr

Feng Zhao

DiffM

155

18 Aug 2025

7Bench: a Comprehensive Benchmark for Layout-guided Text-to-image Models

112

18 Aug 2025

DualFit: A Two-Stage Virtual Try-On via Warping and Synthesis

105

16 Aug 2025

SafeCtrl: Region-Based Safety Control for Text-to-Image Diffusion via Detect-Then-Suppress

126

16 Aug 2025

SPG: Style-Prompting Guidance for Style-Specific Content Creation

131

15 Aug 2025

LEARN: A Story-Driven Layout-to-Image Generation Framework for STEM Instruction

15 Aug 2025

StyleMM: Stylized 3D Morphable Face Model via Text-Driven Aligned Image Translation

136

15 Aug 2025

TimeMachine: Fine-Grained Facial Age Editing with Identity Preservation

163

15 Aug 2025

Remove360: Benchmarking Residuals After Object Removal in 3D Gaussian Splatting

131

15 Aug 2025

Towards Spatially Consistent Image Generation: On Incorporating Intrinsic Scene Properties into Diffusion Models

194

14 Aug 2025

Object Fidelity Diffusion for Remote Sensing Image Generation

222

14 Aug 2025

High Fidelity Text to Image Generation with Contrastive Alignment and Structural Guidance

Danyi Gao

14 Aug 2025

Translation of Text Embedding via Delta Vector to Suppress Strongly Entangled Content in Text-to-Image Diffusion Models

282

14 Aug 2025

NanoControl: A Lightweight Framework for Precise and Efficient Control in Diffusion Transformer

...

14 Aug 2025

CountCluster: Training-Free Object Quantity Guidance with Cross-Attention Map Clustering for Text-to-Image Generation

Joohyeon Lee

Jin-Seop Lee

Jee-Hyong Lee

118

14 Aug 2025

A Survey on Diffusion Language Models

323

14 Aug 2025

OneVAE: Joint Discrete and Continuous Optimization Helps Discrete Video VAE Train Better

...

238

13 Aug 2025

Exploring the Equivalence of Closed-Set Generative and Real Data Augmentation in Image Classification

159

13 Aug 2025

Security Analysis of ChatGPT: Threats and Privacy Risks

183

13 Aug 2025

Prototype-Guided Diffusion: Visual Conditioning without External Memory

Hanane Azzag

M. Lebbah

DiffM VLM

296

13 Aug 2025

Story2Board: A Training-Free Approach for Expressive Storyboard Generation

133

13 Aug 2025

Animate-X++: Universal Character Image Animation with Dynamic Backgrounds

277

13 Aug 2025

Gen-AFFECT: Generation of Avatar Fine-grained Facial Expressions with Consistent identiTy

13 Aug 2025

Per-Query Visual Concept Learning

120

12 Aug 2025

X-UniMotion: Animating Human Images with Expressive, Unified and Identity-Agnostic Motion Latents

120

12 Aug 2025

Enhancing Small-Scale Dataset Expansion with Triplet-Connection-based Sample Re-Weighting

165

11 Aug 2025

Learning User Preferences for Image Generation Model

11 Aug 2025

S^2VG: 3D Stereoscopic and Spatial Video Generation via Denoising Frame Matrix

137

11 Aug 2025

Exploring Multimodal Diffusion Transformers for Enhanced Prompt-based Image Editing

124

11 Aug 2025

Comparison Reveals Commonality: Customized Image Generation through Contrastive Inversion

11 Aug 2025

Undress to Redress: A Training-Free Framework for Virtual Try-On

...

137

11 Aug 2025

Tailored Emotional LLM-Supporter: Enhancing Cultural Sensitivity

116

11 Aug 2025

Efficient Approximate Posterior Sampling with Annealed Langevin Monte Carlo

Advait Parulekar

Litu Rout

Karthikeyan Shanmugam

Sanjay Shakkottai

184

11 Aug 2025

LaRender: Training-Free Occlusion Control in Image Generation via Latent Rendering

Xiaohang Zhan

Dingming Liu

DiffM

136

11 Aug 2025