BoxDiff: Text-to-Image Synthesis with Training-Free Box-Constrained Diffusion

20 July 2023

Papers citing "BoxDiff: Text-to-Image Synthesis with Training-Free Box-Constrained Diffusion"

50 / 166 papers shown

Title
HCMA: Hierarchical Cross-model Alignment for Grounded Text-to-Image Generation Hang Wang Zhi-Qi Cheng Chenhao Lin Chao Shen Lei Zhang DiffM 32 0 0 10 May 2025
Photovoltaic Defect Image Generator with Boundary Alignment Smoothing Constraint for Domain Shift Mitigation Dongying Li Binyi Su Hua Zhang Yong Li Haiyong Chen 59 0 0 09 May 2025
InstanceGen: Image Generation with Instance-level Instructions Etai Sella Yanir Kleiman Hadar Averbuch-Elor 26 0 0 08 May 2025
CountDiffusion: Text-to-Image Synthesis with Training-Free Counting-Guidance Diffusion Y. Li Pencheng Wan Liang Han Yaowei Wang Liqiang Nie Min Zhang 41 0 0 07 May 2025
Lay-Your-Scene: Natural Scene Layout Generation with Diffusion Transformers Divyansh Srivastava Xiang Zhang He Wen Chenru Wen Zhuowen Tu DiffM 26 0 0 07 May 2025
PiCo: Enhancing Text-Image Alignment with Improved Noise Selection and Precise Mask Control in Diffusion Models Chang Xie Chenyi Zhuang Pan Gao VLM 30 0 0 06 May 2025
Towards Dataset Copyright Evasion Attack against Personalized Text-to-Image Diffusion Models Kuofeng Gao Yufei Zhu Yiming Li Jiawang Bai Yong-Liang Yang Z. Li Shu-Tao Xia 34 0 0 05 May 2025
MCCD: Multi-Agent Collaboration-based Compositional Diffusion for Complex Text-to-Image Generation Mingcheng Li Xiaolu Hou Ziyang Liu Dingkang Yang Ziyun Qian Jiawei Chen Jinjie Wei Y. Jiang Qingyao Xu L. Zhang DiffM 71 0 0 05 May 2025
Improving Editability in Image Generation with Layer-wise Memory Daneul Kim Jaeah Lee Jaesik Park DiffM KELM 53 0 0 02 May 2025
Text-to-Image Alignment in Denoising-Based Models through Step Selection P. Grimal Hervé Le Borgne Olivier Ferret DiffM EGVM 48 0 0 24 Apr 2025
Hierarchical and Step-Layer-Wise Tuning of Attention Specialty for Multi-Instance Synthesis in Diffusion Transformers Chunyang Zhang Zhenhong Sun Zhicheng Zhang Junyan Wang Yu Zhang Dong Gong H. Mo Daoyi Dong 33 0 0 14 Apr 2025
Marmot: Multi-Agent Reasoning for Multi-Object Self-Correcting in Improving Image-Text Alignment Jiayang Sun H. Wang Jie Cao Huaibo Huang R. He DiffM 68 0 0 10 Apr 2025
Tuning-Free Image Editing with Fidelity and Editability via Unified Latent Diffusion Model Qi Mao L. Chen Yuchao Gu Mike Zheng Shou Ming-Hsuan Yang DiffM 39 0 0 08 Apr 2025
Disentangling Instruction Influence in Diffusion Transformers for Parallel Multi-Instruction-Guided Image Editing Hui Liu Bin Zou Suiyun Zhang Kecheng Chen Rui Liu Haoliang Li DiffM 64 0 0 07 Apr 2025
Training-free Dense-Aligned Diffusion Guidance for Modular Conditional Image Synthesis Zixuan Wang Duo Peng Feng Chen Y. Yang Yinjie Lei DiffM 74 0 0 02 Apr 2025
$A$^\text{T}$A: Adaptive Transformation Agent for Text-Guided Subject-Position Variable Background Inpainting$ A $^\text{T}$ A: Adaptive Transformation Agent for Text-Guided Subject-Position Variable Background Inpainting Yizhe Tang Zhimin Sun Yuzhen Du Ran Yi Guangben Lu T. Hu Luying Li Lizhuang Ma Fangyuan Zou DiffM 35 0 0 02 Apr 2025
TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes Nikai Du Zhennan Chen Z. Chen Shan Gao Xi Chen Zhengkai Jiang Jian Yang Ying Tai DiffM 38 0 0 30 Mar 2025
On Geometrical Properties of Text Token Embeddings for Strong Semantic Binding in Text-to-Image Generation H. Seo Junseo Bang Haechang Lee Joohoon Lee Byung Hyun Lee Se Young Chun 46 0 0 29 Mar 2025
MMGen: Unified Multi-modal Image Generation and Understanding in One Go Jiepeng Wang Zhaoqing Wang H. Pan Yuan Liu Dongdong Yu Changhu Wang Wenping Wang DiffM 76 0 0 26 Mar 2025
BizGen: Advancing Article-level Visual Text Rendering for Infographics Generation Yuyang Peng Shishi Xiao Keming Wu Qisheng Liao Bohan Chen Kevin Lin Danqing Huang Ji Li Yuhui Yuan DiffM 66 1 0 26 Mar 2025
LayerCraft: Enhancing Text-to-Image Generation with CoT Reasoning and Layered Object Integration Yuyao Zhang Jinghao Li Yu-Wing Tai DiffM 64 0 0 25 Mar 2025
Target-Aware Video Diffusion Models Taeksoo Kim Hanbyul Joo DiffM VGen 89 1 0 24 Mar 2025
ComfyGPT: A Self-Optimizing Multi-Agent System for Comprehensive ComfyUI Workflow Generation Oucheng Huang Yuhang Ma Zeng Zhao Mingrui Wu Jiayi Ji Rongsheng Zhang Z. Hu Xiaoshuai Sun Rongrong Ji 41 0 0 22 Mar 2025
VerbDiff: Text-Only Diffusion Models with Enhanced Interaction Awareness SeungJu Cha Kwanyoung Lee Ye-Chan Kim Hyunwoo Oh Dong-Jin Kim 46 0 0 20 Mar 2025
Reflect-DiT: Inference-Time Scaling for Text-to-Image Diffusion Transformers via In-Context Reflection Shufan Li Konstantinos Kallidromitis Akash Gokul Arsh Koneru Yusuke Kato Kazuki Kozuka Aditya Grover VLM 56 1 0 15 Mar 2025
DriveGEN: Generalized and Robust 3D Detection in Driving via Controllable Text-to-Image Diffusion Generation Hongbin Lin Zilu Guo Y. Zhang Shuaicheng Niu Yafeng Li R. Zhang Shuguang Cui Zhen Li DiffM 51 0 0 14 Mar 2025
PlanGen: Towards Unified Layout Planning and Image Generation in Auto-Regressive Vision Language Models Runze He Bo Cheng Yuhang Ma Qingxiang Jia Shanyuan Liu Ao Ma Xiaoyu Wu Liebucha Wu Dawei Leng Yuhui Yin DiffM VLM 47 0 0 13 Mar 2025
InteractEdit: Zero-Shot Editing of Human-Object Interactions in Images Jiun Tian Hoe Weipeng Hu Wei Zhou Chao Xie Ziwei Wang Chee Seng Chan Xudong Jiang Y. Tan 61 0 0 12 Mar 2025
Consistent Image Layout Editing with Diffusion Models Tao Xia Yudi Zhang Ting Liu Lei Zhang DiffM 54 1 0 09 Mar 2025
PixelPonder: Dynamic Patch Adaptation for Enhanced Multi-Conditional Text-to-Image Generation Yanjie Pan Q. He Zhengkai Jiang P. Xu Chaoyi Wang ... Yun Cao Zhenye Gan M. Chi Bo Peng Y. Wang DiffM 61 0 0 09 Mar 2025
StageDesigner: Artistic Stage Generation for Scenography via Theater Scripts Zhaoxing Gan Mengtian Li Ruhua Chen Zhongxia Ji Sichen Guo Huanling Hu Guangnan Ye Zuo Hu DiffM VGen 80 0 0 04 Mar 2025
ToLo: A Two-Stage, Training-Free Layout-To-Image Generation Framework For High-Overlap Layouts Linhao Huang Jing Yu DiffM 40 0 0 03 Mar 2025
MotionMatcher: Motion Customization of Text-to-Video Diffusion Models via Motion Feature Matching Yen-Siang Wu Chi-Pin Huang Fu-En Yang Yu-Jie Wang DiffM VGen 54 1 0 18 Feb 2025
SketchFlex: Facilitating Spatial-Semantic Coherence in Text-to-Image Generation with Region-Based Sketches Haichuan Lin Yilin Ye Jiazhi Xia Wei Zeng DiffM 68 0 0 11 Feb 2025
PAID: A Framework of Product-Centric Advertising Image Design Hongyu Chen Min Zhou Jing Jiang Jiale Chen Yang Lu Bo Xiao T. Ge Bo Zheng DiffM VLM 38 0 0 24 Jan 2025
ComposeAnyone: Controllable Layout-to-Human Generation with Decoupled Multimodal Conditions Shiyue Zhang Zheng Chong Xi Lu Wenqing Zhang Haoxiang Li Xujie Zhang Jiehui Huang Xiao Dong Xiaodan Liang DiffM 40 0 0 21 Jan 2025
Isolated Diffusion: Optimizing Multi-Concept Text-to-Image Generation Training-Freely with Isolated Diffusion Guidance Jin Zhu Huimin Ma Jiansheng Chen Jian Yuan 71 4 0 20 Jan 2025
Grounding Text-to-Image Diffusion Models for Controlled High-Quality Image Generation Ahmad Süleyman Göksel Biricik 41 2 0 15 Jan 2025
GCA-3D: Towards Generalized and Consistent Domain Adaptation of 3D Generators Hengjia Li Yang Liu Yibo Zhao Haoran Cheng Yang Yang ... Qibo Qiu Boxi Wu Tu Zheng Zheng Yang D. Cai 87 0 0 20 Dec 2024
StyleMaster: Stylize Your Video with Artistic Generation and Translation Zixuan Ye Huijuan Huang Xintao Wang Pengfei Wan Di Zhang Wenhan Luo DiffM VGen 92 4 0 10 Dec 2024
DynamicControl: Adaptive Condition Selection for Improved Text-to-Image Generation Q. He Jinlong Peng P. Xu Boyuan Jiang Xiaobin Hu ... Y. Liu Y. Wang Chengjie Wang X. Li J. Zhang DiffM 120 1 0 04 Dec 2024
SimuScope: Realistic Endoscopic Synthetic Dataset Generation through Surgical Simulation and Diffusion Models Sabina Martyniak Joanna Kaleta Diego DallÁlba Michał Naskręt Szymon Płotka Przemysław Korzeniowski MedIm 66 0 0 03 Dec 2024
Self-Cross Diffusion Guidance for Text-to-Image Synthesis of Similar Subjects Weimin Qiu Jieke Wang Meng Tang DiffM 79 0 0 28 Nov 2024
Relations, Negations, and Numbers: Looking for Logic in Generative Text-to-Image Models C. Conwell Rupert Tawiah-Quashie T. Ullman 74 2 0 26 Nov 2024
Imagine and Seek: Improving Composed Image Retrieval with an Imagined Proxy Y. Li Fan Ma Yi Yang 133 2 0 24 Nov 2024
AnySynth: Harnessing the Power of Image Synthetic Data Generation for Generalized Vision-Language Tasks Y. Li Fan Ma Yi Yang DiffM 144 2 0 24 Nov 2024
Leapfrog Latent Consistency Model (LLCM) for Medical Images Generation Lakshmikar R. Polamreddy Kalyan Roy Sheng-Han Yueh Deepshikha Mahato Shilpa Kuppili Jialu Li Youshan Zhang MedIm 80 1 0 22 Nov 2024
Generating Compositional Scenes via Text-to-image RGBA Instance Generation Alessandro Fontanella Petru-Daniel Tudosiu Yongxin Yang Shifeng Zhang Sarah Parisot 29 1 0 16 Nov 2024
Boundary Attention Constrained Zero-Shot Layout-To-Image Generation Huancheng Chen Jingtao Li Weiming Zhuang H. Vikalo Lingjuan Lyu DiffM 24 0 0 15 Nov 2024
Token Merging for Training-Free Semantic Binding in Text-to-Image Synthesis Taihang Hu Linxuan Li Joost van de Weijer Hongcheng Gao Fahad Shahbaz Khan Jian Yang Ming-Ming Cheng Kai Wang Yaxing Wang DiffM 46 4 0 11 Nov 2024