SDXL: Improving Latent Diffusion Models for High-Resolution Image
Synthesis

SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis

4 July 2023

Papers citing "SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis"

16 / 1,616 papers shown

Title
Real-World Image Variation by Aligning Diffusion Inversion Chain Yuechen Zhang Jinbo Xing Eric Lo Jiaya Jia 19 34 0 30 May 2023
GlyphControl: Glyph Conditional Control for Visual Text Generation Yukang Yang Dongnan Gui Yuhui Yuan Weicong Liang Haisong Ding Hang-Rui Hu Kai Chen DiffM 22 76 0 29 May 2023
Are Diffusion Models Vision-And-Language Reasoners? Benno Krojer Elinor Poole-Dayan Vikram S. Voleti Christopher Pal Siva Reddy 29 12 0 25 May 2023
A Tale of Two Features: Stable Diffusion Complements DINO for Zero-Shot Semantic Correspondence Junyi Zhang Charles Herrmann Junhwa Hur Luisa Polania Cabrera Varun Jampani Deqing Sun Ming Yang DiffM 17 170 0 24 May 2023
LLM-grounded Diffusion: Enhancing Prompt Understanding of Text-to-Image Diffusion Models with Large Language Models Long Lian Boyi Li Adam Yala Trevor Darrell 23 151 0 23 May 2023
VDT: General-purpose Video Diffusion Transformers via Mask Modeling Haoyu Lu Guoxing Yang Nanyi Fei Yuqi Huo Zhiwu Lu Ping Luo Mingyu Ding DiffM VGen 20 56 0 22 May 2023
LeftRefill: Filling Right Canvas based on Left Reference through Generalized Text-to-Image Diffusion Model Chenjie Cao Yunuo Cai Qiaole Dong Yikai Wang Yanwei Fu DiffM 35 14 0 19 May 2023
Swap Attention in Spatiotemporal Diffusions for Text-to-Video Generation Wenjing Wang Huan Yang Zixi Tuo Huiguo He Junchen Zhu Jianlong Fu Jiaying Liu DiffM VGen 40 113 0 18 May 2023
Exploiting Diffusion Prior for Real-World Image Super-Resolution Jianyi Wang Zongsheng Yue Shangchen Zhou Kelvin C. K. Chan Chen Change Loy 32 279 0 11 May 2023
Generative AI meets 3D: A Survey on Text-to-3D in AIGC Era Chenghao Li Chaoning Zhang Atish Waghwase Lik-Hang Lee François Rameau Yang Yang Sung-Ho Bae Choong Seon Hong 46 73 0 10 May 2023
Pick-a-Pic: An Open Dataset of User Preferences for Text-to-Image Generation Yuval Kirstain Adam Polyak Uriel Singer Shahbuland Matiana Joe Penna Omer Levy EGVM 163 349 0 02 May 2023
MasaCtrl: Tuning-Free Mutual Self-Attention Control for Consistent Image Synthesis and Editing Ming Cao Xintao Wang Zhongang Qi Ying Shan Xiaohu Qie Yinqiang Zheng DiffM 31 427 0 17 Apr 2023
Improving Diffusion Models for Scene Text Editing with Dual Encoders Jiabao Ji Guanhua Zhang Zhaowen Wang Bairu Hou Zhifei Zhang Brian L. Price Shiyu Chang DiffM 25 29 0 12 Apr 2023
T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models Chong Mou Xintao Wang Liangbin Xie Yanze Wu Jing Zhang Zhongang Qi Ying Shan Xiaohu Qie DiffM 14 967 0 16 Feb 2023
Make-An-Audio: Text-To-Audio Generation with Prompt-Enhanced Diffusion Models Rongjie Huang Jia-Bin Huang Dongchao Yang Yi Ren Luping Liu Mingze Li Zhenhui Ye Jinglin Liu Xiaoyue Yin Zhou Zhao DiffM 140 315 0 30 Jan 2023
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 253 4,764 0 24 Feb 2021