SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis

4 July 2023

Papers citing "SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis"

50 / 1,616 papers shown

Title
ILLUME+: Illuminating Unified MLLM with Dual Visual Tokenization and Diffusion Refinement Runhui Huang Chunwei Wang Junwei Yang Guansong Lu Yunlong Yuan ... Lu Hou Wei Zhang Lanqing Hong Hengshuang Zhao Hang Xu MLLM 81 1 0 02 Apr 2025
Training-free Dense-Aligned Diffusion Guidance for Modular Conditional Image Synthesis Zixuan Wang Duo Peng Feng Chen Y. Yang Yinjie Lei DiffM 74 0 0 02 Apr 2025
AnimeGamer: Infinite Anime Life Simulation with Next Game State Prediction Junhao Cheng Yuying Ge Yixiao Ge Jing Liao Ying Shan VGen AI4CE 51 0 0 01 Apr 2025
IntrinsiX: High-Quality PBR Generation using Image Priors Peter Kocsis Lukas Höllein Matthias Nießner 33 0 0 01 Apr 2025
Generalized Tensor-based Parameter-Efficient Fine-Tuning via Lie Group Transformations Chongjie Si Zhiyi Shi Xuehui Wang Yichen Xiao Xiaokang Yang Wei-Ming Shen AI4CE 60 0 0 01 Apr 2025
Prompting Forgetting: Unlearning in GANs via Textual Guidance Piyush Nagasubramaniam Neeraj Karamchandani Chen Wu Sencun Zhu DiffM AILaw MU 54 0 0 01 Apr 2025
The HCI GenAI CO2ST Calculator: A Tool for Calculating the Carbon Footprint of Generative AI Use in Human-Computer Interaction Research Nanna Inie Jeanette Falk Raghavendra Selvan 44 0 0 01 Apr 2025
FakeScope: Large Multimodal Expert Model for Transparent AI-Generated Image Forensics Yixuan Li Yu Tian Yipo Huang Wei Lu Shiqi Wang Weisi Lin Anderson de Rezende Rocha 54 0 0 31 Mar 2025
ORAL: Prompting Your Large-Scale LoRAs via Conditional Recurrent Diffusion Rana Muhammad Shahroz Khan Dongwen Tang Pingzhi Li Kai Wang Tianlong Chen AI4CE 89 0 0 31 Mar 2025
InstructRestore: Region-Customized Image Restoration with Human Instructions S. Liu Jianqi Ma Lingchen Sun Xiangtao Kong Lei Zhang DiffM 44 0 0 31 Mar 2025
Consistent Subject Generation via Contrastive Instantiated Concepts Lee Hsin-Ying Kelvin Chan Ming Yang DiffM 90 0 0 31 Mar 2025
Training-Free Text-Guided Image Editing with Visual Autoregressive Model Yufei Wang Lanqing Guo Z. Li Jiaxing Huang Pichao Wang Bihan Wen J. Wang DiffM 60 1 0 31 Mar 2025
MuseFace: Text-driven Face Editing via Diffusion-based Mask Generation Approach Xin Zhang Siting Huang Xiangyang Luo Yifan Xie Weijiang Yu Heng Chang Fei Ma Fei Richard Yu DiffM 38 0 0 31 Mar 2025
Object Isolated Attention for Consistent Story Visualization Xiangyang Luo Junhao Cheng Yifan Xie Xin Zhang Tao Feng Z. Liu Fei Ma Fei Richard Yu DiffM 39 1 0 30 Mar 2025
AI Agents in Engineering Design: A Multi-Agent Framework for Aesthetic and Aerodynamic Car Design Mohamed Elrefaie Janet Qian Raina Wu Qian Chen Angela Dai Faez Ahmed AI4CE 41 0 0 30 Mar 2025
DASH: Detection and Assessment of Systematic Hallucinations of VLMs Maximilian Augustin Yannic Neuhaus Matthias Hein VLM 47 1 0 30 Mar 2025
DiT4SR: Taming Diffusion Transformer for Real-World Image Super-Resolution Zheng-Peng Duan Jiawei Zhang Xin Jin Z. Zhang Zheng Xiong Dongqing Zou Jimmy S. Ren Chun-Le Guo Chongyi Li 37 0 0 30 Mar 2025
FastVAR: Linear Visual Autoregressive Modeling via Cached Token Pruning Hang Guo Yawei Li Taolin Zhang J. Wang Tao Dai Shu-Tao Xia Luca Benini 67 1 0 30 Mar 2025
TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes Nikai Du Zhennan Chen Z. Chen Shan Gao Xi Chen Zhengkai Jiang Jian Yang Ying Tai DiffM 38 0 0 30 Mar 2025
Enhancing Creative Generation on Stable Diffusion-based Models Jiyeon Han Dahee Kwon Gayoung Lee Junho Kim Jaesik Choi DiffM 42 1 0 30 Mar 2025
On Geometrical Properties of Text Token Embeddings for Strong Semantic Binding in Text-to-Image Generation H. Seo Junseo Bang Haechang Lee Joohoon Lee Byung Hyun Lee Se Young Chun 46 0 0 29 Mar 2025
SupertonicTTS: Towards Highly Scalable and Efficient Text-to-Speech System H. Kim Jinhyeok Yang Yechan Yu Seunghun Ji Jacob Morton Frederik Bous Joon Byun Juheon Lee 49 0 0 29 Mar 2025
Semantix: An Energy Guided Sampler for Semantic Style Transfer Huiang He Minghui Hu C. Zheng Chaoyue Wang Tat-Jen Cham DiffM 39 0 0 28 Mar 2025
Meta-LoRA: Meta-Learning LoRA Components for Domain-Aware ID Personalization Barış Batuhan Topal Umut Özyurt Zafer Doğan Budak Ramazan Gokberk Cinbis 45 0 0 28 Mar 2025
Concept-Aware LoRA for Domain-Aligned Segmentation Dataset Generation Minho Park S. Park Jungsoo Lee Hyojin Park Kyuwoong Hwang Fatih Porikli Jaegul Choo Sungha Choi 34 0 0 28 Mar 2025
Mono2Stereo: A Benchmark and Empirical Study for Stereo Conversion S. Yu Yuxin Chen Zhongang Qi Zeke Xie Yifan Wang Lijun Wang Ying Shan Huchuan Lu 39 0 0 28 Mar 2025
Optimal Stepsize for Diffusion Sampling Jianning Pei Han Hu Shuyang Gu 48 0 0 27 Mar 2025
LeX-Art: Rethinking Text Generation via Scalable High-Quality Data Synthesis Shitian Zhao Qilong Wu Xinyue Li Bo Zhang Ming-xing Li ... H. Li Yu Qiao Peng Gao Bin Fu Zhen Li EGVM 43 0 0 27 Mar 2025
VBench-2.0: Advancing Video Generation Benchmark Suite for Intrinsic Faithfulness Dian Zheng Ziqi Huang Hongbo Liu Kai Zou Yinan He ... Y. Zhang Jingwen He Wei-Shi Zheng Yu Qiao Ziwei Liu EGVM VGen 48 3 0 27 Mar 2025
Harmonizing Visual Representations for Unified Multimodal Understanding and Generation Size Wu W. Zhang Lumin Xu Sheng Jin Zhonghua Wu Qingyi Tao Wentao Liu Wei Li Chen Change Loy VGen 103 2 0 27 Mar 2025
AGILE: A Diffusion-Based Attention-Guided Image and Label Translation for Efficient Cross-Domain Plant Trait Identification Earl Ranario Lars Lundqvist Heesup Yun Brian N Bailey J. M. Earles VLM 38 0 0 27 Mar 2025
Evaluating Text-to-Image Synthesis with a Conditional Fréchet Distance Jaywon Koo J. Hernandez Moayed Haji-Ali Ziyan Yang Vicente Ordonez EGVM 67 0 0 27 Mar 2025
Efficient Multi-Instance Generation with Janus-Pro-Dirven Prompt Parsing Fan Qi Yu Duan Changsheng Xu DiffM 50 0 0 27 Mar 2025
Forensic Self-Descriptions Are All You Need for Zero-Shot Detection, Open-Set Source Attribution, and Clustering of AI-generated Images Tai D. Nguyen Aref Azizpour Matthew C. Stamm 46 1 0 26 Mar 2025
Latent Beam Diffusion Models for Decoding Image Sequences Guilherme Fernandes Vasco Ramos Regev Cohen Idan Szpektor João Magalhães 76 0 0 26 Mar 2025
Unconditional Priors Matter! Improving Conditional Generation of Fine-Tuned Diffusion Models Prin Phunyaphibarn Phillip Y. Lee Jaihoon Kim Minhyuk Sung DiffM 84 0 0 26 Mar 2025
TeLL Me what you cant see Saverio Cavasin Pietro Biasetton Mattia Tamiazzo Mauro Conti Simone Milani DiffM 40 0 0 25 Mar 2025
Reverse Prompt: Cracking the Recipe Inside Text-to-Image Generation Zhiyao Ren Yibing Zhan B. Yu Dacheng Tao DiffM 67 0 0 25 Mar 2025
AvatarArtist: Open-Domain 4D Avatarization Hongyu Liu Xuan Wang Ziyu Wan Yue Ma Jingye Chen Yanbo Fan Yujun Shen Yibing Song Qifeng Chen 41 0 0 25 Mar 2025
LayerCraft: Enhancing Text-to-Image Generation with CoT Reasoning and Layered Object Integration Yuyao Zhang Jinghao Li Yu-Wing Tai DiffM 64 0 0 25 Mar 2025
ImageGen-CoT: Enhancing Text-to-Image In-context Learning with Chain-of-Thought Reasoning Jiaqi Liao Z. Yang Linjie Li Dianqi Li Kevin Qinghong Lin Yu-Xi Cheng Lijuan Wang MLLM LRM 57 0 0 25 Mar 2025
FireEdit: Fine-grained Instruction-based Image Editing via Region-aware Vision Language Model Jun Zhou J. Li Zunnan Xu Hanhui Li Yiji Cheng Fa-Ting Hong Qin Lin Qinglin Lu Xiaodan Liang DiffM 65 1 0 25 Mar 2025
PCM : Picard Consistency Model for Fast Parallel Sampling of Diffusion Models Junhyuk So Jiwoong Shin Chaeyeon Jang Eunhyeok Park DiffM 48 0 0 25 Mar 2025
IPGO: Indirect Prompt Gradient Optimization on Text-to-Image Generative Models with High Data Efficiency Jianping Ye Michel Wedel Kunpeng Zhang 37 0 0 25 Mar 2025
A Multi-Agent Framework Integrating Large Language Models and Generative AI for Accelerated Metamaterial Design Jie Tian Martin Taylor Sobczak Dhanush Patil Jixin Hou Lin Pang ... Yuval Golan Xiaoming Zhai Hongyue Sun Kenan Song X. U. Wang LLMAG AI4CE 53 0 0 25 Mar 2025
Panorama Generation From NFoV Image Done Right Dian Zheng Cheng Zhang Xiao-Ming Wu Cao Li Chengfei Lv Jian-Fang Hu Wei-Shi Zheng DiffM 79 0 0 24 Mar 2025
Coeff-Tuning: A Graph Filter Subspace View for Tuning Attention-Based Large Models Zichen Miao Wei Chen Qiang Qiu 90 1 0 24 Mar 2025
Color Conditional Generation with Sliced Wasserstein Guidance Alexander Lobashev Maria Larchenko Dmitry Guskov DiffM 43 0 0 24 Mar 2025
Hiding Images in Diffusion Models by Editing Learned Score Functions Haoyu Chen Yunqiao Yang Nan Zhong Kede Ma DiffM 63 0 0 24 Mar 2025
Instruct-CLIP: Improving Instruction-Guided Image Editing with Automated Data Refinement Using Contrastive Learning Sherry X Chen Misha Sra Pradeep Sen 50 0 0 24 Mar 2025