StyleT2I: Toward Compositional and High-Fidelity Text-to-Image Synthesis

29 March 2022

Papers citing "StyleT2I: Toward Compositional and High-Fidelity Text-to-Image Synthesis"

30 / 30 papers shown

Title
MedUnifier: Unifying Vision-and-Language Pre-training on Medical Data with Vision Generation Task using Discrete Visual Representations Ziyang Zhang Yang Yu Yucheng Chen Xulei Yang S. Yeo MedIm 51 1 0 02 Mar 2025
ABHINAW: A method for Automatic Evaluation of Typography within AI-Generated Images Abhinaw Jagtap Nachiket Tapas R. G. Brajesh EGVM 20 0 0 18 Sep 2024
FacEnhance: Facial Expression Enhancing with Recurrent DDPMs Hamza Bouzid Lahoucine Ballihi DiffM 34 1 0 13 Jun 2024
Iteratively Prompting Multimodal LLMs to Reproduce Natural and AI-Generated Images Ali Naseh Katherine Thai Mohit Iyyer Amir Houmansadr 28 5 0 21 Apr 2024
Attention Calibration for Disentangled Text-to-Image Personalization Yanbing Zhang Mengping Yang Qin Zhou Zhe Wang 22 15 0 27 Mar 2024
Effective pruning of web-scale datasets based on complexity of concept clusters Amro Abbas E. Rusak Kushal Tirumala Wieland Brendel Kamalika Chaudhuri Ari S. Morcos VLM CLIP 21 22 0 09 Jan 2024
ECLIPSE: A Resource-Efficient Text-to-Image Prior for Image Generations Maitreya Patel Changhoon Kim Sheng Cheng Chitta Baral Yezhou Yang VLM 27 18 0 07 Dec 2023
Reason out Your Layout: Evoking the Layout Master from Large Language Models for Text-to-Image Synthesis Xiaohui Chen Yongfei Liu Yingxiang Yang Jianbo Yuan Quanzeng You Liping Liu Hongxia Yang DiffM 39 11 0 28 Nov 2023
SAIR: Learning Semantic-aware Implicit Representation Canyu Zhang Xiaoguang Li Qing-Wu Guo Song Wang 23 3 0 13 Oct 2023
DeltaSpace: A Semantic-aligned Feature Space for Flexible Text-guided Image Editing Yueming Lyu Kang Zhao Bo Peng Yue Jiang Yingya Zhang Jing Dong 17 2 0 12 Oct 2023
TP2O: Creative Text Pair-to-Object Generation using Balance Swap-Sampling Jun Li Zedong Zhang Jian Yang DiffM 30 6 0 03 Oct 2023
VideoGen: A Reference-Guided Latent Diffusion Approach for High Definition Text-to-Video Generation Xin Li Wenqing Chu Ye Wu Weihang Yuan Fanglong Liu Qi Zhang Fu Li Haocheng Feng Errui Ding Jingdong Wang VGen 35 51 0 01 Sep 2023
Efficient Text-Guided 3D-Aware Portrait Generation with Score Distillation Sampling on Distribution Yiji Cheng Fei Yin Xiaoke Huang Xintong Yu Jiaxiang Liu Shi Feng Yujiu Yang Yansong Tang DiffM 15 4 0 03 Jun 2023
Conditioning Diffusion Models via Attributes and Semantic Masks for Face Generation Nico Giambi G. Lisanti DiffM 17 7 0 01 Jun 2023
Are Diffusion Models Vision-And-Language Reasoners? Benno Krojer Elinor Poole-Dayan Vikram S. Voleti Christopher Pal Siva Reddy 29 12 0 25 May 2023
Vision + Language Applications: A Survey Yutong Zhou N. Shimada VLM 18 5 0 24 May 2023
LLMScore: Unveiling the Power of Large Language Models in Text-to-Image Synthesis Evaluation Yujie Lu Xianjun Yang Xiujun Li X. Wang William Yang Wang EGVM 38 73 0 18 May 2023
Collaborative Diffusion for Multi-Modal Face Generation and Editing Ziqi Huang Kelvin C. K. Chan Yuming Jiang Ziwei Liu DiffM 26 104 0 20 Apr 2023
Not Only Generative Art: Stable Diffusion for Content-Style Disentanglement in Art Analysis Yankun Wu Yuta Nakashima Noa Garcia CoGe DiffM 19 26 0 20 Apr 2023
Toward Verifiable and Reproducible Human Evaluation for Text-to-Image Generation Mayu Otani Riku Togashi Yu Sawai Ryosuke Ishigami Yuta Nakashima Esa Rahtu J. Heikkilä Shiníchi Satoh 20 62 0 04 Apr 2023
Conditional Image-to-Video Generation with Latent Flow Diffusion Models Haomiao Ni Changhao Shi Kaican Li Sharon X. Huang Martin Renqiang Min VGen DiffM 16 162 0 24 Mar 2023
MODIFY: Model-driven Face Stylization without Style Images Yuhe Ding Jian Liang Jie Cao A. Zheng R. He CVBM 25 2 0 17 Mar 2023
DeltaEdit: Exploring Text-free Training for Text-Driven Image Manipulation Yueming Lyu Tianwei Lin Fu Li Dongliang He Jing Dong Tien-Ping Tan 33 38 0 11 Mar 2023
Attribute-Centric Compositional Text-to-Image Generation Yuren Cong Martin Renqiang Min Erran L. Li Bodo Rosenhahn M. Yang 61 11 0 04 Jan 2023
CREPE: Can Vision-Language Foundation Models Reason Compositionally? Zixian Ma Jerry Hong Mustafa Omer Gul Mona Gandhi Irena Gao Ranjay Krishna CoGe 18 125 0 13 Dec 2022
Text-Free Learning of a Natural Language Interface for Pretrained Face Generators Xiaodan Du Raymond A. Yeh Nicholas I. Kolkin Eli Shechtman Gregory Shakhnarovich CLIP 16 1 0 08 Sep 2022
Recurrent Transformer Variational Autoencoders for Multi-Action Motion Synthesis Rania Briq Chuhang Zou L. Pishchulin Christopher Broaddus Juergen Gall 16 1 0 14 Jun 2022
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 253 4,764 0 24 Feb 2021
A Style-Based Generator Architecture for Generative Adversarial Networks Tero Karras S. Laine Timo Aila 262 10,320 0 12 Dec 2018
Learning Deep Representations of Fine-grained Visual Descriptions Scott E. Reed Zeynep Akata Bernt Schiele Honglak Lee OCL VLM 160 841 0 17 May 2016