SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis

4 July 2023

Papers citing "SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis"

50 / 1,616 papers shown

Title
Cut-and-Splat: Leveraging Gaussian Splatting for Synthetic Data Generation Bram Vanherle Brent Zoomers Jeroen Put F. Reeth Nick Michiels 3DGS 32 0 0 11 Apr 2025
CoProSketch: Controllable and Progressive Sketch Generation with Diffusion Model Ruohao Zhan Yijin Li Yisheng He Shuo Chen Yichen Shen Xinyu Chen Zilong Dong Zhaoyang Huang Guofeng Zhang DiffM 34 0 0 11 Apr 2025
ZipIR: Latent Pyramid Diffusion Transformer for High-Resolution Image Restoration Yongsheng Yu Haitian Zheng Zhifei Zhang Jianming Zhang Yuqian Zhou Connelly Barnes Y. Liu Wei Xiong Zhe Lin Jiebo Luo 44 0 0 11 Apr 2025
Training-free Guidance in Text-to-Video Generation via Multimodal Planning and Structured Noise Initialization Jialu Li Shoubin Yu Han Lin Jaemin Cho Jaehong Yoon Mohit Bansal DiffM VGen 48 0 0 11 Apr 2025
Discriminator-Free Direct Preference Optimization for Video Diffusion Haoran Cheng Qide Dong Liang Peng Zhizhou Sha Weiguo Feng Jinghui Xie Zhao Song Shilei Wen Xiaofei He Boxi Wu VGen 78 0 0 11 Apr 2025
Marmot: Multi-Agent Reasoning for Multi-Object Self-Correcting in Improving Image-Text Alignment Jiayang Sun H. Wang Jie Cao Huaibo Huang R. He DiffM 71 0 0 10 Apr 2025
PixelFlow: Pixel-Space Generative Models with Flow Shoufa Chen Chongjian Ge Shilong Zhang Peize Sun Ping Luo VLM DRL 33 0 0 10 Apr 2025
ID-Booth: Identity-consistent Face Generation with Diffusion Models Darian Tomašević Fadi Boutros Chenhao Lin Naser Damer Vitomir Štruc Peter Peer DiffM 55 1 0 10 Apr 2025
GenEAva: Generating Cartoon Avatars with Fine-Grained Facial Expressions from Realistic Diffusion-based Faces Hao Yu Rupayan Mallick Margrit Betke Sarah Adel Bargal DiffM 45 0 0 10 Apr 2025
FlexIP: Dynamic Control of Preservation and Personality for Customized Image Generation Linyan Huang Haonan Lin Yanning Zhou Kaiwen Xiao 42 0 0 10 Apr 2025
POEM: Precise Object-level Editing via MLLM control Marco Schouten Mehmet Onurcan Kaya Serge Belongie Dim P. Papadopoulos DiffM 75 0 0 10 Apr 2025
ColorizeDiffusion v2: Enhancing Reference-based Sketch Colorization Through Separating Utilities Dingkun Yan Xinrui Wang Yusuke Iwasawa Yutaka Matsuo Suguru Saito Jiaxian Guo DiffM 25 0 0 09 Apr 2025
MedSegFactory: Text-Guided Generation of Medical Image-Mask Pairs Jiawei Mao Y. Wang Yucheng Tang Daguang Xu Kang Wang Yang Yang Zongwei Zhou Yuyin Zhou MedIm 22 0 0 09 Apr 2025
EIDT-V: Exploiting Intersections in Diffusion Trajectories for Model-Agnostic, Zero-Shot, Training-Free Text-to-Video Generation Diljeet Jagpal Xi Chen Vinay P. Namboodiri DiffM VGen 46 0 0 09 Apr 2025
PosterMaker: Towards High-Quality Product Poster Generation with Accurate Text Rendering Y. Gao Zihang Lin Chuanbin Liu Min Zhou T. Ge Bo Zheng Hongtao Xie DiffM 35 0 0 09 Apr 2025
Probability Density Geodesics in Image Diffusion Latent Space Qingtao Yu Jaskirat Singh Zhaoyuan Yang Peter Tu Jing Zhang Hongdong Li Richard Hartley Dylan Campbell DiffM 60 0 0 09 Apr 2025
Have we unified image generation and understanding yet? An empirical study of GPT-4o's image generation ability Ning Li Jingran Zhang Justin Cui MLLM 70 1 0 09 Apr 2025
SIGMAN:Scaling 3D Human Gaussian Generation with Millions of Assets Yuhang Yang Fengqi Liu Yixing Lu Qin Zhao Pingyu Wu ... Ran Yi Yang Cao Lizhuang Ma Zheng-jun Zha Junting Dong 3DGS 42 0 0 09 Apr 2025
Compass Control: Multi Object Orientation Control for Text-to-Image Generation Rishubh Parihar Vaibhav Agrawal Sachidanand VS R. V. Babu DiffM 28 0 0 09 Apr 2025
Mind the Trojan Horse: Image Prompt Adapter Enabling Scalable and Deceptive Jailbreaking Junxi Chen Junhao Dong Xiaohua Xie 33 0 0 08 Apr 2025
HiFlow: Training-free High-Resolution Image Generation with Flow-Aligned Guidance Jiazi Bu Pengyang Ling Yujie Zhou Pan Zhang Tong Wu Xiaoyi Dong Yuhang Zang Y. Cao D. Lin Jiaqi Wang 19 0 0 08 Apr 2025
Transfer between Modalities with MetaQueries Xichen Pan Satya Narayan Shukla Aashu Singh Zhuokai Zhao Shlok Kumar Mishra ... Jiuhai Chen Kunpeng Li F. Xu Ji Hou Saining Xie DiffM 41 6 0 08 Apr 2025
Parasite: A Steganography-based Backdoor Attack Framework for Diffusion Models J. Chen Yu Pan Yi Du Chunkai Wu Lin Wang DiffM 35 0 0 08 Apr 2025
A Training-Free Style-aligned Image Generation with Scale-wise Autoregressive Model Jihun Park Jongmin Gim Kyoungmin Lee Minseok Oh Minwoo Choi Jaeyeul Kim Woo Chool Park Sunghoon Im DiffM 25 0 0 08 Apr 2025
From Specificity to Generality: Revisiting Generalizable Artifacts in Detecting Face Deepfakes Long Ma Zhiyuan Yan Yize Chen Jin Xu Qinglang Guo Hu Huang Yong Liao Hui Lin CVBM 41 0 0 07 Apr 2025
PartStickers: Generating Parts of Objects for Rapid Prototyping Mo Zhou Josh Myers-Dean Danna Gurari 21 0 0 07 Apr 2025
CREA: A Collaborative Multi-Agent Framework for Creative Content Generation with Diffusion Models Kavana Venkatesh Connor Dunlop Pinar Yanardag DiffM 33 0 0 07 Apr 2025
PanoDreamer: Consistent Text to 360-Degree Scene Generation Zhexiao Xiong Z. Chen Zhong Li Yi Tian Xu Nathan Jacobs 3DGS VGen 26 0 0 07 Apr 2025
Gaussian Mixture Flow Matching Models Hansheng Chen Kai Zhang Hao Tan Zexiang Xu Fujun Luan Leonidas J. Guibas Gordon Wetzstein Sai Bi DiffM 61 0 0 07 Apr 2025
Video-Bench: Human-Aligned Video Generation Benchmark Hui Han Siyuan Li Jiaqi Chen Yiwen Yuan Yuling Wu ... Y. Li J. Zhang Chi Zhang Li Li Yongxin Ni EGVM VGen 68 0 0 07 Apr 2025
Disentangling Instruction Influence in Diffusion Transformers for Parallel Multi-Instruction-Guided Image Editing Hui Liu Bin Zou Suiyun Zhang Kecheng Chen Rui Liu Haoliang Li DiffM 64 0 0 07 Apr 2025
UniToken: Harmonizing Multimodal Understanding and Generation through Unified Visual Encoding Yang Jiao Haibo Qiu Zequn Jie S. Chen Jingjing Chen Lin Ma Yu Jiang 26 2 0 06 Apr 2025
Attributed Synthetic Data Generation for Zero-shot Domain-specific Image Classification Shijian Wang Linxin Song Ryotaro Shimizu M. Goto Hanqian Wu VLM 23 0 0 06 Apr 2025
Multi-identity Human Image Animation with Structural Video Diffusion Zhenzhi Wang Y. Li Yanhong Zeng Yuwei Guo D. Lin Tianfan Xue Bo Dai VGen 24 0 0 05 Apr 2025
Physics-informed 4D X-ray image reconstruction from ultra-sparse spatiotemporal data Zisheng Yao Yuhe Zhang Zhe Hu Robert Klöfkorn Tobias Ritschel Pablo Villanueva-Perez AI4CE 64 1 0 04 Apr 2025
Generating ensembles of spatially-coherent in-situ forecasts using flow matching David Landry C. Monteleoni A. Charantonis 60 0 0 04 Apr 2025
3D Scene Understanding Through Local Random Access Sequence Modeling Wanhee Lee Klemen Kotar R. Venkatesh Jared Watrous Honglin Chen Khai Loong Aw Daniel L. K. Yamins 3DV 34 0 0 04 Apr 2025
LV-MAE: Learning Long Video Representations through Masked-Embedding Autoencoders Ilan Naiman Emanuel Ben-Baruch Oron Anschel Alon Shoshan Igor Kviatkovsky Manoj Aggarwal Gérard Medioni 34 0 0 04 Apr 2025
Concept Lancet: Image Editing with Compositional Representation Transplant Jinqi Luo Tianjiao Ding Kwan Ho Ryan Chan Hancheng Min Chris Callison-Burch René Vidal DiffM KELM 72 0 0 03 Apr 2025
GPT-ImgEval: A Comprehensive Benchmark for Diagnosing GPT4o in Image Generation Zhiyuan Yan Junyan Ye Weijia Li Zilong Huang Shenghai Yuan Xiangyang He Kaiqing Lin Jun-Jian He Conghui He Li Yuan MLLM EGVM 88 8 0 03 Apr 2025
Morpheus: Benchmarking Physical Reasoning of Video Generative Models with Real Physical Experiments Chenyu Zhang Daniil Cherniavskii Andrii Zadaianchuk Antonios Tragoudaras Antonios Vozikis Thijmen Nijdam Derck W. E. Prinzhorn Mark Bodracska N. Sebe E. Gavves EGVM VGen 46 0 0 03 Apr 2025
VARGPT-v1.1: Improve Visual Autoregressive Large Unified Model via Iterative Instruction Tuning and Reinforcement Learning Xianwei Zhuang Yuxin Xie Yufan Deng Dongchao Yang Liming Liang Jinghan Ru Yuguo Yin Yuexian Zou 68 1 0 03 Apr 2025
Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing Xiangyu Zhao Peiyuan Zhang Kexian Tang Hao Li Zicheng Zhang Guangtao Zhai Junchi Yan Hua Yang Xue Yang Haodong Duan VLM LRM 41 0 0 03 Apr 2025
Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets Chuning Zhu Raymond Yu S. Feng Benjamin Burchfiel Paarth Shah Abhishek Gupta VGen 55 0 0 03 Apr 2025
Multi-party Collaborative Attention Control for Image Customization Han Yang Chuanguang Yang Qiuli Wang Zhulin An Weilun Feng Libo Huang Y. Xu DiffM 25 0 0 02 Apr 2025
ILLUME+: Illuminating Unified MLLM with Dual Visual Tokenization and Diffusion Refinement Runhui Huang Chunwei Wang Junwei Yang Guansong Lu Yunlong Yuan ... Lu Hou Wei Zhang Lanqing Hong Hengshuang Zhao Hang Xu MLLM 81 1 0 02 Apr 2025
Training-free Dense-Aligned Diffusion Guidance for Modular Conditional Image Synthesis Zixuan Wang Duo Peng Feng Chen Y. Yang Yinjie Lei DiffM 74 0 0 02 Apr 2025
Random Conditioning with Distillation for Data-Efficient Diffusion Model Compression Dohyun Kim S. Park Geonhee Han Seung Wook Kim Paul Hongsuck Seo DiffM 47 0 0 02 Apr 2025
FreSca: Unveiling the Scaling Space in Diffusion Models Chao Huang Susan Liang Yunlong Tang Li Ma Yapeng Tian Chenliang Xu DiffM 48 0 0 02 Apr 2025
Less-to-More Generalization: Unlocking More Controllability by In-Context Generation Shaojin Wu Mengqi Huang Wenxu Wu Yufeng Cheng Fei Ding Qian He DiffM 50 4 0 02 Apr 2025