An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2015

21 July 2015

Papers citing "An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition"

50 / 680 papers shown

Phonological Level wav2vec2-based Mispronunciation Detection and Diagnosis Method

M. Shahin

Julien Epps

Beena Ahmed

116

13 Nov 2023

Exploring OCR Capabilities of GPT-4V(ision) : A Quantitative and In-depth Evaluation

Lianwen Jin

395

25 Oct 2023

Adversarial sample generation and training using geometric masks for accurate and resilient license plate character recognition

186

25 Oct 2023

Convolutional Bidirectional Variational Autoencoder for Image Domain Translation of Dotted Arabic Expiration

Ahmed Zidane

Ghada Soliman

120

21 Oct 2023

EfficientOCR: An Extensible, Open-Source Package for Efficiently Digitizing World Knowledge

197

16 Oct 2023

Symmetrical Linguistic Feature Distillation with CLIP for Scene Text RecognitionACM Multimedia (ACM MM), 2023

322

08 Oct 2023

A Holistic Evaluation of Piano Sound Quality

286

07 Oct 2023

1D-CapsNet-LSTM: A Deep Learning-Based Model for Multi-Step Stock Index ForecastingJournal of King Saud University: Computer and Information Sciences (JSUCIS), 2023

263

03 Oct 2023

Pixel Adapter: A Graph-Based Post-Processing Approach for Scene Text Image Super-ResolutionACM Multimedia (ACM MM), 2023

255

16 Sep 2023

DeNoising-MOT: Towards Multiple Object Tracking with Severe OcclusionsACM Multimedia (ACM MM), 2023

237

09 Sep 2023

Leveraging Model Fusion for Improved License Plate RecognitionIberoamerican Congress on Pattern Recognition (CIARP), 2023

David Menotti

232

08 Sep 2023

STEP -- Towards Structured Scene-Text SpottingIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Sergi Garcia-Bordils

Dimosthenis Karatzas

Marccal Rusinol

283

05 Sep 2023

Chinese Text Recognition with A Pre-Trained CLIP-Like Model Through Image-IDS AligningIEEE International Conference on Computer Vision (ICCV), 2023

251

03 Sep 2023

Orientation-Independent Chinese Text Recognition in Scene ImagesInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

195

03 Sep 2023

DTrOCR: Decoder-only Transformer for Optical Character RecognitionIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Masato Fujitake

429

30 Aug 2023

Enhancing OCR Performance through Post-OCR Models: Adopting Glyph Embedding for Improved Correction

Yung-Hsin Chen

Yuli Zhou

162

29 Aug 2023

Vision Grid Transformer for Document Layout AnalysisIEEE International Conference on Computer Vision (ICCV), 2023

234

29 Aug 2023

High-Resolution Document Shadow Removal via A Large-Scale Real-World Dataset and A Frequency-Aware Shadow Erasing NetIEEE International Conference on Computer Vision (ICCV), 2023

Zinuo Li

Xuhang Chen

Chi-Man Pun

Xiaodong Cun

501

27 Aug 2023

Self-supervised Scene Text Segmentation with Object-centric Layered Representations Augmented by Text RegionsACM Multimedia (ACM MM), 2022

269

25 Aug 2023

LISTER: Neighbor Decoding for Length-Insensitive Scene Text RecognitionIEEE International Conference on Computer Vision (ICCV), 2023

232

24 Aug 2023

Semantic Graph Representation Learning for Handwritten Mathematical Expression RecognitionIEEE International Conference on Document Analysis and Recognition (ICDAR), 2023

164

21 Aug 2023

Self-distillation Regularized Connectionist Temporal Classification Loss for Text Recognition: A Simple Yet Effective ApproachAAAI Conference on Artificial Intelligence (AAAI), 2023

385

17 Aug 2023

Towards Robust Real-Time Scene Text Detection: From Semantic to Instance Representation LearningACM Multimedia (ACM MM), 2023

195

14 Aug 2023

TextDiff: Mask-Guided Residual Diffusion Models for Scene Text Image Super-ResolutionPattern Recognition (Pattern Recogn.), 2023

273

13 Aug 2023

A Benchmark for Chinese-English Scene Text Image Super-resolutionIEEE International Conference on Computer Vision (ICCV), 2023

Lei Zhang

146

07 Aug 2023

One-stage Low-resolution Text Recognition with High-resolution Knowledge TransferACM Multimedia (ACM MM), 2023

145

05 Aug 2023

CTP-Net: Character Texture Perception Network for Document Image Forgery Localization

Xin Liao

04 Aug 2023

HiREN: Towards Higher Supervision Quality for Better Scene Text Image Super-Resolution

261

31 Jul 2023

A Transformer-based Approach for Arabic Offline Handwritten Text RecognitionSignal, Image and Video Processing (SIVP), 2023

Saleh Momeni

B. BabaAli

244

27 Jul 2023

Multi-Granularity Prediction with Learnable Fusion for Scene Text Recognition

Cheng Da

Peng Wang

Cong Yao

259

25 Jul 2023

Context Perception Parallel Decoder for Scene Text RecognitionIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Yongkun Du

Zhineng Chen

Caiyan Jia

284

23 Jul 2023

Physics-Driven Turbulence Image Restoration with Stochastic RefinementIEEE International Conference on Computer Vision (ICCV), 2023

178

20 Jul 2023

Towards Robust Scene Text Image Super-resolution via Explicit Location EnhancementInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

212

19 Jul 2023

Revisiting Scene Text Recognition: A Data PerspectiveIEEE International Conference on Computer Vision (ICCV), 2023

Lianwen Jin

349

17 Jul 2023

Writer adaptation for offline text recognition: An exploration of neural network-based methods

Tobias van der Werff

Maruf A. Dhali

Lambert Schomaker

194

11 Jul 2023

ECG-Image-Kit: A Synthetic Image Generation Toolbox to Facilitate Deep Learning-Based Electrocardiogram DigitizationPhysiological Measurement (PM), 2023

Kshama Kodthalu Shivashankara

Deepanshi

Afagh Mehri Shervedani

358

04 Jul 2023

CNN-BiLSTM model for English Handwriting Recognition: Comprehensive Evaluation on the IAM Dataset

Firat Kizilirmak

Berrin Yanikoglu

200

02 Jul 2023

Fraunhofer SIT at CheckThat! 2023: Mixing Single-Modal Classifiers to Estimate the Check-Worthiness of Multi-Modal Tweets

R. Frick

Inna Vogel

02 Jul 2023

DiffusionSTR: Diffusion Model for Scene Text RecognitionInternational Conference on Information Photonics (ICIP), 2023

Masato Fujitake

DiffM

126

29 Jun 2023

UTRNet: High-Resolution Urdu Text Recognition In Printed DocumentsIEEE International Conference on Document Analysis and Recognition (ICDAR), 2023

Abdur Rahman

Arjun Ghosh

Chetan Arora

214

27 Jun 2023

The Deep Arbitrary Polynomial Chaos Neural Network or how Deep Artificial Neural Networks could benefit from Data-Driven Homogeneous Chaos TheoryNeural Networks (Neural Netw.), 2023

159

26 Jun 2023

Resume Information Extraction via Post-OCR Text Processing

Selahattin Serdar Helli

Senem Tanberk

Sena Nur Cavsak

23 Jun 2023

Document Image Cleaning using Budget-Aware Black-Box Approximation

120

22 Jun 2023

Conditional Text Image Generation with Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2023

288

19 Jun 2023

Looking and Listening: Audio Guided Text Recognition

Yuliang Liu

155

06 Jun 2023

ICDAR 2023 Competition on Structured Text Extraction from Visually-Rich Document ImagesIEEE International Conference on Document Analysis and Recognition (ICDAR), 2023

...

Jingdong Wang

194

05 Jun 2023

ESTISR: Adapting Efficient Scene Text Image Super-resolution for Real-Scenes

185

04 Jun 2023

Perception and Semantic Aware Regularization for Sequential Confidence CalibrationComputer Vision and Pattern Recognition (CVPR), 2023

Shuangping Huang

285

31 May 2023

Masked and Permuted Implicit Context Learning for Scene Text RecognitionIEEE Signal Processing Letters (IEEE SPL), 2023

218

25 May 2023

MRN: Multiplexed Routing Network for Incremental Multilingual Text RecognitionIEEE International Conference on Computer Vision (ICCV), 2023

Tianlun Zheng

Zhineng Chen

Bin Huang

Wei Zhang

Yuran Jiang

354

24 May 2023