TextDiffuser-2: Unleashing the Power of Language Models for Text Rendering

28 November 2023

Papers citing "TextDiffuser-2: Unleashing the Power of Language Models for Text Rendering"

50 / 54 papers shown

Title
HDGlyph: A Hierarchical Disentangled Glyph-Based Framework for Long-Tail Text Rendering in Diffusion Models Shuhan Zhuang Mengqi Huang Fengyi Fu Nan Chen Bohan Lei Zhendong Mao DiffM 13 0 0 10 May 2025
FLUX-Text: A Simple and Advanced Diffusion Transformer Baseline for Scene Text Editing Rui Lan Y. Bai Xu Duan M. Li Lei Sun X. Chu DiffM 31 0 0 06 May 2025
Visual Text Processing: A Comprehensive Review and Unified Evaluation Yan Shu Weichao Zeng Fangmin Zhao Zeyu Chen Z. Li ... Paolo Rota Xiang Bai Lianwen Jin Xu-Cheng Yin N. Sebe CoGe 52 0 0 30 Apr 2025
RepText: Rendering Visual Text via Replicating H. Wang Y. Xu Y. Li J. Li Chaowei Zhang J. Wang Kejia Yang Z. Chen VLM 66 0 0 28 Apr 2025
ViMo: A Generative Visual GUI World Model for App Agent Dezhao Luo Bohan Tang Kang Li Georgios Papoudakis Jifei Song S. Gong Jianye Hao Jun Wang Kun Shao LM&Ro VGen 39 0 0 15 Apr 2025
Relation-Rich Visual Document Generator for Visual Information Extraction Zi-Han Jiang Chien-Wei Lin Wei-Hua Li Hsuan-Tung Liu Yi-Ren Yeh Chu-Song Chen 28 0 0 14 Apr 2025
TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes Nikai Du Zhennan Chen Z. Chen Shan Gao Xi Chen Zhengkai Jiang Jian Yang Ying Tai DiffM 33 0 0 30 Mar 2025
LeX-Art: Rethinking Text Generation via Scalable High-Quality Data Synthesis Shitian Zhao Qilong Wu Xinyue Li Bo Zhang Ming-xing Li ... H. Li Yu Qiao Peng Gao Bin Fu Zhen Li EGVM 38 0 0 27 Mar 2025
BizGen: Advancing Article-level Visual Text Rendering for Infographics Generation Yuyang Peng Shishi Xiao Keming Wu Qisheng Liao Bohan Chen Kevin Lin Danqing Huang Ji Li Yuhui Yuan DiffM 58 1 0 26 Mar 2025
Beyond Words: Advancing Long-Text Image Generation via Multimodal Autoregressive Models Alex Jinpeng Wang Linjie Li Z. Yang Lijuan Wang Min Li DiffM 68 0 0 26 Mar 2025
POSTA: A Go-to Framework for Customized Artistic Poster Generation Haoyu Chen Xiaojie Xu Wenbo Li Jingjing Ren Tian Ye Songhua Liu Ying Chen Lei Zhu Xinchao Wang DiffM 49 1 0 19 Mar 2025
TextInVision: Text and Prompt Complexity Driven Visual Text Generation Benchmark Forouzan Fallah Maitreya Patel Agneet Chatterjee Vlad I. Morariu Chitta Baral Yezhou Yang CoGe 59 0 0 17 Mar 2025
Seedream 2.0: A Native Chinese-English Bilingual Image Generation Foundation Model Lixue Gong Xiaoxia Hou Fanshi Li Liang Li Xiaochen Lian ... Qi Zhang Yuwei Zhang Shijia Zhao Jianchao Yang Weilin Huang DiffM VLM 47 5 0 10 Mar 2025
DesignDiffusion: High-Quality Text-to-Design Image Generation with Diffusion Models Zhendong Wang Jianmin Bao Shuyang Gu Dong Chen Wengang Zhou H. Li DiffM 42 0 0 03 Mar 2025
ControlText: Unlocking Controllable Fonts in Multilingual Text Rendering without Font Annotations Bowen Jiang Yuan Yuan Xinyi Bai Zhuoqun Hao Alyson Yin Yaojie Hu Wenyu Liao Lyle Ungar Camillo J. Taylor DiffM 38 1 0 16 Feb 2025
Beyond Flat Text: Dual Self-inherited Guidance for Visual Text Generation Minxing Luo Zixun Xia L. Chen Zhenhang Li Weichao Zeng J. T. Wang Wentao Cheng Yaxing Wang Yu Zhou Jian Yang DiffM 44 1 0 10 Jan 2025
SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild Jiawei Liu Yuanzhi Zhu Feiyu Gao Z. Yang P. Wang Junyang Lin X. Wang Wenyu Liu DiffM 43 0 0 08 Jan 2025
CharGen: High Accurate Character-Level Visual Text Generation Model with MultiModal Encoder Lichen Ma Tiezhu Yue Pei Fu Yujie Zhong Kai Zhou Xiaoming Wei Jie Hu DiffM 57 2 0 23 Dec 2024
TextSSR: Diffusion-based Data Synthesis for Scene Text Recognition Xingsong Ye Yongkun Du Yunbo Tao Z. Chen DiffM 96 0 0 02 Dec 2024
Type-R: Automatically Retouching Typos for Text-to-Image Generation Wataru Shimoda Naoto Inoue Daichi Haraguchi Hayato Mitani S. Uchida Kota Yamaguchi DiffM 89 0 0 27 Nov 2024
AnyText2: Visual Text Generation and Editing With Customizable Attributes Yuxiang Tuo Yifeng Geng Liefeng Bo VLM 80 6 0 22 Nov 2024
GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts Junwen He Yifan Wang Lijun Wang Huchuan Lu Jun-Yan He C. Li Hanyuan Chen Jin-Peng Lan Bin Luo Yifeng Geng 64 1 0 18 Nov 2024
TypeScore: A Text Fidelity Metric for Text-to-Image Generative Models Georgia Gabriela Sampaio Ruixiang Zhang Shuangfei Zhai Jiatao Gu J. Susskind Navdeep Jaitly Yizhe Zhang DiffM CLIP 30 0 0 02 Nov 2024
Can GPTs Evaluate Graphic Design Based on Design Principles? Daichi Haraguchi Naoto Inoue Wataru Shimoda Hayato Mitani Seiichi Uchida Kota Yamaguchi 16 3 0 11 Oct 2024
TextLap: Customizing Language Models for Text-to-Layout Planning Jian Chen Ruiyi Zhang Yufan Zhou Jennifer Healey J. Gu Zhiqiang Xu C. L. P. Chen VLM 39 3 0 09 Oct 2024
A Reflection on the Impact of Misspecifying Unidentifiable Causal Inference Models in Surrogate Endpoint Evaluation Gokce Deliorman Florian Stijven Wim Van der Elst Maria del Carmen Pardo Ariel Alonso CML 21 0 0 06 Oct 2024
A Spark of Vision-Language Intelligence: 2-Dimensional Autoregressive Transformer for Efficient Finegrained Image Generation Liang Chen Sinan Tan Zefan Cai Weichu Xie Haozhe Zhao Yichi Zhang Junyang Lin Jinze Bai Tianyu Liu Baobao Chang ViT 42 3 0 02 Oct 2024
VitaGlyph: Vitalizing Artistic Typography with Flexible Dual-branch Diffusion Models Kailai Feng Yabo Zhang Haodong Yu Zhilong Ji Jinfeng Bai Hongzhi Zhang W. Zuo DiffM 22 0 0 02 Oct 2024
Multimodal Pragmatic Jailbreak on Text-to-image Models Tong Liu Zhixin Lai Gengyuan Zhang Philip H. S. Torr Vera Demberg Volker Tresp Jindong Gu 30 2 0 27 Sep 2024
JoyType: A Robust Design for Multilingual Visual Text Creation Chao Li Chen Jiang Xiaolong Liu Jun Zhao Guoxin Wang DiffM 19 5 0 26 Sep 2024
Elucidating Optimal Reward-Diversity Tradeoffs in Text-to-Image Diffusion Models Rohit Jena Ali Taghibakhshi Sahil Jain Gerald Shen Nima Tajbakhsh Arash Vahdat 25 3 0 09 Sep 2024
Harmonizing Visual Text Comprehension and Generation Zhen Zhao Jingqun Tang Binghong Wu Chunhui Lin Shubo Wei Hao Liu Xin Tan Zhizhong Zhang Can Huang Yuan Xie VLM 26 21 0 23 Jul 2024
Intelligent Artistic Typography: A Comprehensive Review of Artistic Text Design and Generation Yuhang Bai Zichuan Huang Wenshuo Gao Shuai Yang Jiaying Liu 20 5 0 20 Jul 2024
Visual Text Generation in the Wild Yuanzhi Zhu Jiawei Liu Feiyu Gao Wenyu Liu Xinggang Wang Peng Wang Fei Huang Cong Yao Zhibo Yang DiffM 19 0 0 19 Jul 2024
LogoSticker: Inserting Logos into Diffusion Models for Customized Generation Mingkang Zhu Xi Chen Zhongdao Wang Hengshuang Zhao Jiaya Jia DiffM 32 2 0 18 Jul 2024
How Control Information Influences Multilingual Text Image Generation and Editing? Boqiang Zhang Zuan Gao Yadong Qu Hongtao Xie DiffM 29 5 0 16 Jul 2024
Kinetic Typography Diffusion Model Seonmi Park Inhwan Bae Seunghyun Shin Hae-Gon Jeon DiffM 65 2 0 15 Jul 2024
GenArtist: Multimodal LLM as an Agent for Unified Image Generation and Editing Zhenyu Wang Aoxue Li Zhenguo Li Xihui Liu MLLM DiffM 28 25 0 08 Jul 2024
GlyphDraw2: Automatic Generation of Complex Glyph Posters with Diffusion Models and Large Language Models Jian Ma Yonglin Deng Chen Chen H. Lu Zhenyu Yang Zhenyu Yang VLM DiffM 70 6 0 02 Jul 2024
ARTIST: Improving the Generation of Text-rich Images by Disentanglement Jianyi Zhang Yufan Zhou Jiuxiang Gu Curtis Wigington Tong Yu Yiran Chen Tong Sun Ruiyi Zhang 52 0 0 17 Jun 2024
AnyTrans: Translate AnyText in the Image with Large Scale Models Zhipeng Qian Pei Zhang Baosong Yang Kai Fan Yiwei Ma Derek F. Wong Xiaoshuai Sun Rongrong Ji VLM 23 1 0 17 Jun 2024
Glyph-ByT5-v2: A Strong Aesthetic Baseline for Accurate Multilingual Visual Text Rendering Zeyu Liu Weicong Liang Yiming Zhao Bohan Chen Lin Liang Lijuan Wang Ji Li Yuhui Yuan 25 10 0 14 Jun 2024
PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM Tao Yang Yingmin Luo Zhongang Qi Yang Wu Ying Shan Chang Wen Chen 3DV MLLM 23 8 0 05 Jun 2024
Improving Text Generation on Images with Synthetic Captions Jun Young Koh Sang Hyun Park Joy Song DiffM 41 2 0 01 Jun 2024
TextCenGen: Attention-Guided Text-Centric Background Adaptation for Text-to-Image Generation Tianyi Liang Jiangqi Liu Sicheng Song Shiqi Jiang Yifei Huang Changbo Wang Chenhui Li 32 0 0 18 Apr 2024
Refining Text-to-Image Generation: Towards Accurate Training-Free Glyph-Enhanced Image Generation Sanyam Lakhanpal Shivang Chopra Vinija Jain Aman Chadha Man Luo 19 9 0 25 Mar 2024
Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering Zeyu Liu Weicong Liang Zhanhao Liang Chong Luo Ji Li Gao Huang Yuhui Yuan DiffM 56 23 0 14 Mar 2024
Controllable Generation with Text-to-Image Diffusion Models: A Survey Pu Cao Feng Zhou Qing-Huang Song Lu Yang 64 35 0 07 Mar 2024
DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning Abhaysinh Zala Han Lin Jaemin Cho Mohit Bansal 16 3 0 18 Oct 2023
Discovering the Hidden Vocabulary of DALLE-2 Giannis Daras A. Dimakis 104 53 0 01 Jun 2022