v1v2 (latest)

What If We Only Use Real Datasets for Scene Text Recognition? Toward Scene Text Recognition With Fewer Labels

Computer Vision and Pattern Recognition (CVPR), 2021

7 March 2021

Jeonghun Baek

Yusuke Matsui

Kiyoharu Aizawa

ArXiv (abs)PDF HTML Github (180★)

Papers citing "What If We Only Use Real Datasets for Scene Text Recognition? Toward Scene Text Recognition With Fewer Labels"

50 / 57 papers shown

LadderMoE: Ladder-Side Mixture of Experts Adapters for Bronze Inscription Recognition

171

02 Oct 2025

GraDeT-HTR: A Resource-Efficient Bengali Handwritten Text Recognition System utilizing Grapheme-based Tokenizer and Decoder-only Transformer

Md. Mahmudul Hasan

Ahmed Nesar Tahsin Choudhury

Mahmudul Hasan

Md. Mosaddek Khan

159

22 Sep 2025

TEACH: Text Encoding as Curriculum Hints for Scene Text Recognition

Xiahan Yang

Hui Zheng

VLM

143

02 Aug 2025

SemiETS: Integrating Spatial and Content Consistencies for Semi-Supervised End-to-end Text SpottingComputer Vision and Pattern Recognition (CVPR), 2025

381

14 Apr 2025

Linguistics-aware Masked Image Modeling for Self-supervised Scene Text RecognitionComputer Vision and Pattern Recognition (CVPR), 2025

372

24 Mar 2025

Disentanglement and Compositionality of Letter Identity and Letter Position in Variational Auto-Encoder Vision Models

423

11 Dec 2024

TextSSR: Diffusion-based Data Synthesis for Scene Text Recognition

519

02 Dec 2024

Boosting Semi-Supervised Scene Text Recognition via Viewing and SummarizingNeural Information Processing Systems (NeurIPS), 2024

296

23 Nov 2024

Relational Contrastive Learning and Masked Image Modeling for Scene Text Recognition

394

18 Nov 2024

Text Image Generation for Low-Resource Languages with Dual Translation Learning

259

26 Sep 2024

VL-Reader: Vision and Language Reconstructor is an Effective Scene Text RecognizerACM Multimedia (MM), 2024

Humen Zhong

Zhibo Yang

Zhaohai Li

Peng Wang

Jun Tang

Wenqing Cheng

Cong Yao

294

18 Sep 2024

Rethinking HTG Evaluation: Bridging Generation and Recognition

Konstantina Nikolaidou

George Retsinas

Giorgos Sfikas

Marcus Liwicki

251

04 Sep 2024

Decoder Pre-Training with only Text for Scene Text RecognitionACM Multimedia (MM), 2024

Shuai Zhao

Yongkun Du

Zhineng Chen

Yu-Gang Jiang

192

11 Aug 2024

Self-Supervised Learning for Text Recognition: A Critical SurveyInternational Journal of Computer Vision (IJCV), 2024

Carlos Peñarrubia

J. J. Valero-Mas

Jorge Calvo-Zaragoza

534

29 Jul 2024

Visual Text Generation in the Wild

Fei Huang

279

19 Jul 2024

Focus on the Whole Character: Discriminative Character Modeling for Scene Text Recognition

339

08 Jul 2024

HAAP: Vision-context Hierarchical Attention Autoregressive with Adaptive Permutation for Scene Text Recognition

249

15 May 2024

JSTR: Judgment Improves Scene Text Recognition

Masato Fujitake

264

09 Apr 2024

Global License Plate Dataset

Siddharth Agrawal

202

22 Mar 2024

IndicSTR12: A Dataset for Indic Scene Text Recognition

Harsh Lunia

Ajoy Mondal

C. V. Jawahar

209

12 Mar 2024

Sequential Visual and Semantic Consistency for Semi-supervised Text Recognition

347

24 Feb 2024

An Empirical Study of Scaling Law for OCR

565

29 Dec 2023

Cross-Lingual Learning in Multilingual Scene Text Recognition

Jeonghun Baek

Yusuke Matsui

Kiyoharu Aizawa

273

17 Dec 2023

Scene Text Image Super-resolution based on Text-conditional Diffusion Models

272

16 Nov 2023

Symmetrical Linguistic Feature Distillation with CLIP for Scene Text RecognitionACM Multimedia (ACM MM), 2023

351

08 Oct 2023

Harnessing the Power of Multi-Lingual Datasets for Pre-training: Towards Enhancing Text Spotting PerformanceIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Alloy Das

Sanket Biswas

Ayan Banerjee

Josep Lladós

Umapada Pal

Saumik Bhattacharya

372

02 Oct 2023

SCOB: Universal Text Understanding via Character-wise Supervised Contrastive Learning with Online Text Rendering for Bridging Domain GapIEEE International Conference on Computer Vision (ICCV), 2023

429

21 Sep 2023

DTrOCR: Decoder-only Transformer for Optical Character RecognitionIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Masato Fujitake

489

30 Aug 2023

LISTER: Neighbor Decoding for Length-Insensitive Scene Text RecognitionIEEE International Conference on Computer Vision (ICCV), 2023

277

24 Aug 2023

Self-distillation Regularized Connectionist Temporal Classification Loss for Text Recognition: A Simple Yet Effective ApproachAAAI Conference on Artificial Intelligence (AAAI), 2023

446

17 Aug 2023

Relational Contrastive Learning for Scene Text RecognitionACM Multimedia (ACM MM), 2023

292

01 Aug 2023

Multi-Granularity Prediction with Learnable Fusion for Scene Text Recognition

Cheng Da

Peng Wang

Cong Yao

347

25 Jul 2023

Revisiting Scene Text Recognition: A Data PerspectiveIEEE International Conference on Computer Vision (ICCV), 2023

Lianwen Jin

460

17 Jul 2023

DiffusionSTR: Diffusion Model for Scene Text RecognitionInternational Conference on Information Photonics (ICIP), 2023

Masato Fujitake

DiffM

171

29 Jun 2023

Conditional Text Image Generation with Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2023

450

19 Jun 2023

CLIP4STR: A Simple Baseline for Scene Text Recognition with Pre-trained Vision-Language ModelIEEE Transactions on Image Processing (IEEE TIP), 2023

429

23 May 2023

Improving Scene Text Recognition for Character-Level Long-Tailed Distribution

158

31 Mar 2023

Diffusion in the Dark: A Diffusion Model for Low-Light Text RecognitionIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

448

07 Mar 2023

CLIPTER: Looking at the Bigger Picture in Scene Text RecognitionIEEE International Conference on Computer Vision (ICCV), 2023

374

18 Jan 2023

Indian Commercial Truck License Plate Detection and Recognition for Weighbridge AutomationInternational Conference on Mechatronics and Machine Vision in Practice (M2VIP), 2022

Siddharth Agrawal

Keyur D. Joshi

213

23 Nov 2022

Pure Transformer with Integrated Experts for Scene Text RecognitionEuropean Conference on Computer Vision (ECCV), 2022

287

09 Nov 2022

Masked Vision-Language Transformers for Scene Text RecognitionBritish Machine Vision Conference (BMVC), 2022

295

09 Nov 2022

Seq-UPS: Sequential Uncertainty-aware Pseudo-label Selection for Semi-Supervised Text RecognitionIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022

344

31 Aug 2022

SGBANet: Semantic GAN and Balanced Attention Network for Arbitrarily Oriented Scene Text RecognitionEuropean Conference on Computer Vision (ECCV), 2022

304

21 Jul 2022

Scene Text Recognition with Permuted Autoregressive Sequence ModelsEuropean Conference on Computer Vision (ECCV), 2022

Darwin Bautista

Rowel Atienza

291

254

14 Jul 2022

COO: Comic Onomatopoeia Dataset for Recognizing Arbitrary or Truncated TextsEuropean Conference on Computer Vision (ECCV), 2022

Jeonghun Baek

Yusuke Matsui

Kiyoharu Aizawa

276

11 Jul 2022

PP-OCRv3: More Attempts for the Improvement of Ultra Lightweight OCR System

...

Dianhai Yu

469

192

07 Jun 2022

Multimodal Semi-Supervised Learning for Text Recognition

291

08 May 2022

Pushing the Performance Limit of Scene Text Recognizer without Human AnnotationComputer Vision and Pattern Recognition (CVPR), 2022

Peng Wang

270

16 Apr 2022

SimAN: Exploring Self-Supervised Representation Learning of Scene Text via Similarity-Aware NormalizationComputer Vision and Pattern Recognition (CVPR), 2022

Canjie Luo

Lianwen Jin

Jingdong Chen

SSL AI4TS

290

20 Mar 2022