Training-free Subject-Enhanced Attention Guidance for Compositional
Text-to-image Generation

Training-free Subject-Enhanced Attention Guidance for Compositional Text-to-image Generation

11 May 2024

Papers citing "Training-free Subject-Enhanced Attention Guidance for Compositional Text-to-image Generation"

12 / 12 papers shown

Title
AnomalyPainter: Vision-Language-Diffusion Synergy for Zero-Shot Realistic and Diverse Industrial Anomaly Synthesis Zhangyu Lai Yilin Lu Xinyang Li Jianghang Lin Yansong Qu Liujuan Cao Ming Li Rongrong Ji DiffM 65 0 0 10 Mar 2025
Kandinsky: an Improved Text-to-Image Synthesis with Image Prior and Latent Diffusion Anton Razzhigaev Arseniy Shakhmatov Anastasia Maltseva V.Ya. Arkhipkin Igor Pavlov Ilya Ryabov Angelina Kuts Alexander Panchenko Andrey Kuznetsov Denis Dimitrov 40 76 0 05 Oct 2023
InstantBooth: Personalized Text-to-Image Generation without Test-Time Finetuning Jing Shi Wei Xiong Zhe-nan Lin H. J. Jung DiffM 119 272 0 06 Apr 2023
Training-Free Layout Control with Cross-Attention Guidance Minghao Chen Iro Laina Andrea Vedaldi DiffM 124 217 0 06 Apr 2023
Cones: Concept Neurons in Diffusion Models for Customized Generation Zhiheng Liu Ruili Feng Kai Zhu Yifei Zhang Kecheng Zheng Yu Liu Deli Zhao Jingren Zhou Yang Cao DiffM 100 116 0 09 Mar 2023
Re-Imagen: Retrieval-Augmented Text-to-Image Generator Wenhu Chen Hexiang Hu Chitwan Saharia William W. Cohen VLM 114 159 0 29 Sep 2022
DetCLIP: Dictionary-Enriched Visual-Concept Paralleled Pre-training for Open-world Detection Lewei Yao Jianhua Han Youpeng Wen Xiaodan Liang Dan Xu Wei Zhang Zhenguo Li Chunjing Xu Hang Xu CLIP VLM 115 151 0 20 Sep 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 301 11,730 0 04 Mar 2022
Emerging Properties in Self-Supervised Vision Transformers Mathilde Caron Hugo Touvron Ishan Misra Hervé Jégou Julien Mairal Piotr Bojanowski Armand Joulin 283 5,723 0 29 Apr 2021
Open-vocabulary Object Detection via Vision and Language Knowledge Distillation Xiuye Gu Tsung-Yi Lin Weicheng Kuo Yin Cui VLM ObjD 223 897 0 28 Apr 2021
A Style-Based Generator Architecture for Generative Adversarial Networks Tero Karras S. Laine Timo Aila 262 10,183 0 12 Dec 2018
Image-to-Image Translation with Conditional Adversarial Networks Phillip Isola Jun-Yan Zhu Tinghui Zhou Alexei A. Efros SSeg 212 19,191 0 21 Nov 2016