An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2015

21 July 2015

Papers citing "An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition"

50 / 680 papers shown

CustomText: Customized Textual Image Generation using Diffusion Models

132

21 May 2024

HAAP: Vision-context Hierarchical Attention Autoregressive with Adaptive Permutation for Scene Text Recognition

193

15 May 2024

Self-Supervised Pre-training with Symmetric Superimposition Modeling for Scene Text RecognitionInternational Joint Conference on Artificial Intelligence (IJCAI), 2024

197

09 May 2024

Align, Minimize and Diversify: A Source-Free Unsupervised Domain Adaptation Method for Handwritten Text Recognition

María Alfaro-Contreras

Jorge Calvo-Zaragoza

214

28 Apr 2024

GatedLexiconNet: A Comprehensive End-to-End Handwritten Paragraph Text Recognition System

164

22 Apr 2024

A Dataset and Model for Realistic License Plate Deblurring

161

21 Apr 2024

JSTR: Judgment Improves Scene Text Recognition

Masato Fujitake

239

09 Apr 2024

NAF-DPM: A Nonlinear Activation-Free Diffusion Probabilistic Model for Document Enhancement

Giordano Cicchetti

Danilo Comminiello

158

08 Apr 2024

LayoutLLM: Layout Instruction Tuning with Large Language Models for Document Understanding

370

08 Apr 2024

Bridging the Gap Between End-to-End and Two-Step Text Spotting

Mingxin Huang

Hongliang Li

Yuliang Liu

Xiang Bai

Lianwen Jin

213

06 Apr 2024

OmniParser: A Unified Framework for Text Spotting, Key Information Extraction and Table Recognition

Yuliang Liu

Fei Huang

277

28 Mar 2024

Global License Plate Dataset

Siddharth Agrawal

156

22 Mar 2024

Practical End-to-End Optical Music Recognition for Pianoform Music

121

20 Mar 2024

HierCode: A Lightweight Hierarchical Codebook for Zero-shot Chinese Text Recognition

Lianwen Jin

193

20 Mar 2024

Efficient scene text image super-resolution with semantic guidance

181

20 Mar 2024

From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation ModelsIEEE Transactions on Knowledge and Data Engineering (TKDE), 2024

467

18 Mar 2024

OCR is All you need: Importing Multi-Modality into Image-based Defect Detection System

Chih-Chung Hsu

Chia-Ming Lee

Chun-Hung Sun

Kuang-Ming Wu

181

18 Mar 2024

TextBlockV2: Towards Precise-Detection-Free Scene Text Spotting with Pre-trained Language Model

294

15 Mar 2024

IndicSTR12: A Dataset for Indic Scene Text Recognition

Harsh Lunia

Ajoy Mondal

C. V. Jawahar

168

12 Mar 2024

Open-Vocabulary Scene Text Recognition via Pseudo-Image Labeling and Margin Loss

242

12 Mar 2024

LOCR: Location-Guided Transformer for Optical Character Recognition

Wanli Ouyang

297

04 Mar 2024

Efficiently Leveraging Linguistic Priors for Scene Text Spotting

Nguyen Nguyen

Yapeng Tian

Chenliang Xu

270

27 Feb 2024

Sequential Visual and Semantic Consistency for Semi-supervised Text Recognition

292

24 Feb 2024

Class-Aware Mask-Guided Feature Refinement for Scene Text Recognition

243

21 Feb 2024

VATr++: Choose Your Words Wisely for Handwritten Text Generation

Nick Michiels

194

16 Feb 2024

Sheet Music Transformer: End-To-End Optical Music Recognition Beyond Monophonic TranscriptionIEEE International Conference on Document Analysis and Recognition (ICDAR), 2024

Antonio Ríos-Vila

Jorge Calvo-Zaragoza

Thierry Paquet

275

12 Feb 2024

Visual Text Meets Low-level Vision: A Comprehensive Survey on Visual Text Processing

241

05 Feb 2024

Text Image Inpainting via Global Structure-Guided Diffusion ModelsAAAI Conference on Artificial Intelligence (AAAI), 2024

229

26 Jan 2024

VIPTR: A Vision Permutable Extractor for Fast and Efficient Scene Text Recognition

Xiang Li

Zhoujun Li

359

18 Jan 2024

SwinTextSpotter v2: Towards Better Synergy for Scene Text SpottingInternational Journal of Computer Vision (IJCV), 2024

Yuliang Liu

Lianwen Jin

362

15 Jan 2024

Spatio-Temporal Turbulence Mitigation: A Translational PerspectiveComputer Vision and Pattern Recognition (CVPR), 2024

307

08 Jan 2024

Inverse-like Antagonistic Scene Text Spotting via Reading-Order Estimation and Dynamic SamplingIEEE Transactions on Image Processing (TIP), 2024

Hongfa Wang

297

08 Jan 2024

An Empirical Study of Scaling Law for OCR

427

29 Dec 2023

Word length-aware text spotting: Enhancing detection and recognition in dense text image

205

25 Dec 2023

IPAD: Iterative, Parallel, and Diffusion-based Network for Scene Text Recognition

387

19 Dec 2023

Cross-Lingual Learning in Multilingual Scene Text Recognition

Jeonghun Baek

Yusuke Matsui

Kiyoharu Aizawa

214

17 Dec 2023

Diffusion-based Blind Text Image Super-ResolutionComputer Vision and Pattern Recognition (CVPR), 2023

280

13 Dec 2023

Toward Real Text Manipulation Detection: New Dataset and New Solution

Yuliang Liu

207

12 Dec 2023

IDPL-PFOD2: A New Large-Scale Dataset for Printed Farsi Optical Character Recognition

Fatemeh Asadi-zeydabadi

Ali Afkari-Fahandari

Amin Faraji

Elham Shabaninia

Hossein Nezamabadi-pour

148

02 Dec 2023

Towards Higher Ranks via Adversarial Weight PruningNeural Information Processing Systems (NeurIPS), 2023

231

29 Nov 2023

DSText V2: A Comprehensive Video Text Spotting Dataset for Dense and Small TextPattern Recognition (Pattern Recogn.), 2023

226

29 Nov 2023

PEAN: A Diffusion-Based Prior-Enhanced Attention Network for Scene Text Image Super-ResolutionACM Multimedia (ACM MM), 2023

252

29 Nov 2023

STR-Cert: Robustness Certification for Deep Text Recognition on Deep Learning Pipelines and Vision Transformers

Daqian Shao

Lukas Fesser

Marta Z. Kwiatkowska

188

28 Nov 2023

Vulnerability Analysis of Transformer-based Optical Character Recognition to Adversarial Attacks

Lucas Beerens

D. Higham

207

28 Nov 2023

TextDiffuser-2: Unleashing the Power of Language Models for Text RenderingEuropean Conference on Computer Vision (ECCV), 2023

283

103

28 Nov 2023

Data Generation for Post-OCR correction of Cyrillic handwriting

293

27 Nov 2023

Recognition-Guided Diffusion Model for Scene Text Image Super-ResolutionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

Zhi Tang

213

22 Nov 2023

Towards Detecting, Recognizing, and Parsing the Address Information from Bangla Signboard: A Deep Learning-based Approach

Hasan Murad

Mohammed Eunus Ali

177

22 Nov 2023

DocPedia: Unleashing the Power of Large Multimodal Model in the Frequency Domain for Versatile Document Understanding

Hao Feng

Qi Liu

343

20 Nov 2023

Scene Text Image Super-resolution based on Text-conditional Diffusion Models

228

16 Nov 2023