Character-Aware Models Improve Visual Text Rendering

20 December 2022

Sharan Narang

Papers citing "Character-Aware Models Improve Visual Text Rendering"

50 / 59 papers shown

Title
Visual Text Processing: A Comprehensive Review and Unified Evaluation Yan Shu Weichao Zeng Fangmin Zhao Zeyu Chen Z. Li ... Paolo Rota Xiang Bai Lianwen Jin Xu-Cheng Yin N. Sebe CoGe 59 0 0 30 Apr 2025
BizGen: Advancing Article-level Visual Text Rendering for Infographics Generation Yuyang Peng Shishi Xiao Keming Wu Qisheng Liao Bohan Chen Kevin Lin Danqing Huang Ji Li Yuhui Yuan DiffM 74 1 0 26 Mar 2025
Beyond Words: Advancing Long-Text Image Generation via Multimodal Autoregressive Models Alex Jinpeng Wang Linjie Li Z. Yang Lijuan Wang Min Li DiffM 73 0 0 26 Mar 2025
TextInVision: Text and Prompt Complexity Driven Visual Text Generation Benchmark Forouzan Fallah Maitreya Patel Agneet Chatterjee Vlad I. Morariu Chitta Baral Yezhou Yang CoGe 61 0 0 17 Mar 2025
DesignDiffusion: High-Quality Text-to-Design Image Generation with Diffusion Models Zhendong Wang Jianmin Bao Shuyang Gu Dong Chen Wengang Zhou H. Li DiffM 53 0 0 03 Mar 2025
ControlText: Unlocking Controllable Fonts in Multilingual Text Rendering without Font Annotations Bowen Jiang Yuan Yuan Xinyi Bai Zhuoqun Hao Alyson Yin Yaojie Hu Wenyu Liao Lyle Ungar Camillo J. Taylor DiffM 51 1 0 16 Feb 2025
Beyond Flat Text: Dual Self-inherited Guidance for Visual Text Generation Minxing Luo Zixun Xia L. Chen Zhenhang Li Weichao Zeng J. T. Wang Wentao Cheng Yaxing Wang Yu Zhou Jian Yang DiffM 44 1 0 10 Jan 2025
SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild Jiawei Liu Yuanzhi Zhu Feiyu Gao Z. Yang P. Wang Junyang Lin X. Wang Wenyu Liu DiffM 45 0 0 08 Jan 2025
CharGen: High Accurate Character-Level Visual Text Generation Model with MultiModal Encoder Lichen Ma Tiezhu Yue Pei Fu Yujie Zhong Kai Zhou Xiaoming Wei Jie Hu DiffM 67 2 0 23 Dec 2024
Type-R: Automatically Retouching Typos for Text-to-Image Generation Wataru Shimoda Naoto Inoue Daichi Haraguchi Hayato Mitani S. Uchida Kota Yamaguchi DiffM 99 0 0 27 Nov 2024
AnyText2: Visual Text Generation and Editing With Customizable Attributes Yuxiang Tuo Yifeng Geng Liefeng Bo VLM 93 6 0 22 Nov 2024
TextDestroyer: A Training- and Annotation-Free Diffusion Method for Destroying Anomal Text from Images Mengcheng Li Mingbao Lin Fei Chao Chia-Wen Lin Rongrong Ji DiffM 51 0 0 01 Nov 2024
Scalable Ranked Preference Optimization for Text-to-Image Generation Shyamgopal Karthik Huseyin Coskun Zeynep Akata Sergey Tulyakov J. Ren Anil Kag EGVM 52 4 0 23 Oct 2024
TextCtrl: Diffusion-based Scene Text Editing with Prior Guidance Control Weichao Zeng Yan Shu Zhenhang Li Dongbao Yang Yu Zhou DiffM 24 7 0 14 Oct 2024
A Reflection on the Impact of Misspecifying Unidentifiable Causal Inference Models in Surrogate Endpoint Evaluation Gokce Deliorman Florian Stijven Wim Van der Elst Maria del Carmen Pardo Ariel Alonso CML 34 4 0 06 Oct 2024
Multimodal Pragmatic Jailbreak on Text-to-image Models Tong Liu Zhixin Lai Gengyuan Zhang Philip H. S. Torr Vera Demberg Volker Tresp Jindong Gu 35 4 0 27 Sep 2024
Text Image Generation for Low-Resource Languages with Dual Translation Learning Chihiro Noguchi Shun Fukuda Shoichiro Mihara Masao Yamanaka DiffM 26 0 0 26 Sep 2024
Elucidating Optimal Reward-Diversity Tradeoffs in Text-to-Image Diffusion Models Rohit Jena Ali Taghibakhshi Sahil Jain Gerald Shen Nima Tajbakhsh Arash Vahdat 38 3 0 09 Sep 2024
ARTIST: Improving the Generation of Text-rich Images by Disentanglement Jianyi Zhang Yufan Zhou Jiuxiang Gu Curtis Wigington Tong Yu Yiran Chen Tong Sun Ruiyi Zhang 75 0 0 17 Jun 2024
Glyph-ByT5-v2: A Strong Aesthetic Baseline for Accurate Multilingual Visual Text Rendering Zeyu Liu Weicong Liang Yiming Zhao Bohan Chen Lin Liang Lijuan Wang Ji Li Yuhui Yuan 38 14 0 14 Jun 2024
TRINS: Towards Multimodal Language Models that Can Read Ruiyi Zhang Yanzhe Zhang Jian Chen Yufan Zhou Jiuxiang Gu Changyou Chen Tong Sun VLM 31 6 0 10 Jun 2024
Layout-Agnostic Scene Text Image Synthesis with Diffusion Models Qilong Zhangli Jindong Jiang Di Liu Licheng Yu Xiaoliang Dai Ankit Ramchandani Guan Pang Dimitris N. Metaxas Praveen Krishnan DiffM 45 8 0 03 Jun 2024
Greedy Growing Enables High-Resolution Pixel-Based Diffusion Models C. N. Vasconcelos Abdullah Rashwan Austin Waters Trevor Walker Keyang Xu Jimmy Yan ... Wenlei Zhou Kevin Swersky David J. Fleet Jason Baldridge Oliver Wang 44 3 0 27 May 2024
Revisiting Text-to-Image Evaluation with Gecko: On Metrics, Prompts, and Human Ratings Olivia Wiles Chuhan Zhang Isabela Albuquerque Ivana Kajić Su Wang ... Jordi Pont-Tuset Aida Nematzadeh Anant Nawalgaria Jordi Pont-Tuset Aida Nematzadeh EGVM 127 14 0 25 Apr 2024
LTOS: Layout-controllable Text-Object Synthesis via Adaptive Cross-attention Fusions Xiaoran Zhao Tianhao Wu Yu Lai Zhiliang Tian Zhen Huang Yahui Liu Zejiang He Dongsheng Li DiffM 36 1 0 21 Apr 2024
Training LLMs over Neurally Compressed Text Brian Lester Jaehoon Lee A. Alemi Jeffrey Pennington Adam Roberts Jascha Narain Sohl-Dickstein Noah Constant 32 6 0 04 Apr 2024
Confidence-aware Reward Optimization for Fine-tuning Text-to-Image Models Kyuyoung Kim Jongheon Jeong Minyong An Mohammad Ghavamzadeh Krishnamurthy Dvijotham Jinwoo Shin Kimin Lee EGVM 37 6 0 02 Apr 2024
PosterLlama: Bridging Design Ability of Langauge Model to Contents-Aware Layout Generation Jaejung Seol Seojun Kim Jaejun Yoo 3DV VLM 34 7 0 01 Apr 2024
Refining Text-to-Image Generation: Towards Accurate Training-Free Glyph-Enhanced Image Generation Sanyam Lakhanpal Shivang Chopra Vinija Jain Aman Chadha Man Luo 32 9 0 25 Mar 2024
Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering Zeyu Liu Weicong Liang Zhanhao Liang Chong Luo Ji Li Gao Huang Yuhui Yuan DiffM 69 25 0 14 Mar 2024
SELMA: Learning and Merging Skill-Specific Text-to-Image Experts with Auto-Generated Data Jialu Li Jaemin Cho Yi-Lin Sung Jaehong Yoon Mohit Bansal MoMe DiffM 39 8 0 11 Mar 2024
Controllable Generation with Text-to-Image Diffusion Models: A Survey Pu Cao Feng Zhou Qing-Huang Song Lu Yang 72 35 0 07 Mar 2024
Tokenization counts: the impact of tokenization on arithmetic in frontier LLMs Aaditya K. Singh DJ Strouse 38 46 0 22 Feb 2024
Typographic Text Generation with Off-the-Shelf Diffusion Model KhayTze Peong Seiichi Uchida Daichi Haraguchi DiffM 33 4 0 22 Feb 2024
Visual Text Meets Low-level Vision: A Comprehensive Survey on Visual Text Processing Yan Shu Weichao Zeng Zhenhang Li Fangmin Zhao Yu Zhou 32 3 0 05 Feb 2024
UDiffText: A Unified Framework for High-quality Text Synthesis in Arbitrary Images via Character-aware Diffusion Models Yiming Zhao Zhouhui Lian 71 27 0 08 Dec 2023
DreamSync: Aligning Text-to-Image Generation with Image Understanding Feedback Jiao Sun Deqing Fu Yushi Hu Su Wang Royi Rassin ... Dana Alon Charles Herrmann Sjoerd van Steenkiste Ranjay Krishna Cyrus Rashtchian EGVM 32 40 0 29 Nov 2023
Enhancing Scene Text Detectors with Realistic Text Image Synthesis Using Diffusion Models Ling Fu Zijie Wu Yingying Zhu Yuliang Liu Xiang Bai 26 0 0 28 Nov 2023
TextDiffuser-2: Unleashing the Power of Language Models for Text Rendering Jingye Chen Yupan Huang Tengchao Lv Lei Cui Qifeng Chen Furu Wei DiffM 27 60 0 28 Nov 2023
Enhancing Diffusion Models with Text-Encoder Reinforcement Learning Chaofeng Chen Annan Wang Haoning Wu Liang Liao Wenxiu Sun Qiong Yan Weisi Lin 28 10 0 27 Nov 2023
AnyText: Multilingual Visual Text Generation And Editing Yuxiang Tuo Wangmeng Xiang Jun-Yan He Yifeng Geng Xuansong Xie DiffM 24 75 0 06 Nov 2023
Davidsonian Scene Graph: Improving Reliability in Fine-grained Evaluation for Text-to-Image Generation Jaemin Cho Yushi Hu Roopal Garg Peter Anderson Ranjay Krishna Jason Baldridge Mohit Bansal Jordi Pont-Tuset Su Wang EGVM 31 66 0 27 Oct 2023
DiagrammerGPT: Generating Open-Domain, Open-Platform Diagrams via LLM Planning Abhaysinh Zala Han Lin Jaemin Cho Mohit Bansal 35 12 0 18 Oct 2023
Towards Diverse and Consistent Typography Generation Wataru Shimoda Daichi Haraguchi Seiichi Uchida Kota Yamaguchi 24 9 0 05 Sep 2023
Divide, Evaluate, and Refine: Evaluating and Improving Text-to-Image Alignment with Iterative VQA Feedback Jaskirat Singh Liang Zheng 26 18 0 10 Jul 2023
SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis Dustin Podell Zion English Kyle Lacey A. Blattmann Tim Dockhorn Jonas Muller Joe Penna Robin Rombach 86 2,127 0 04 Jul 2023
Grounded Text-to-Image Synthesis with Attention Refocusing Quynh Phung Songwei Ge Jia-Bin Huang DiffM 25 104 0 08 Jun 2023
Wuerstchen: An Efficient Architecture for Large-Scale Text-to-Image Diffusion Models Pablo Pernias Dominic Rampas Mats L. Richter Christopher Pal Marc Aubreville DiffM VLM 18 42 0 01 Jun 2023
GlyphControl: Glyph Conditional Control for Visual Text Generation Yukang Yang Dongnan Gui Yuhui Yuan Weicong Liang Haisong Ding Hang-Rui Hu Kai Chen DiffM 27 77 0 29 May 2023
DPOK: Reinforcement Learning for Fine-tuning Text-to-Image Diffusion Models Ying Fan Olivia Watkins Yuqing Du Hao Liu Moonkyung Ryu Craig Boutilier Pieter Abbeel Mohammad Ghavamzadeh Kangwook Lee Kimin Lee 41 135 0 25 May 2023