ICDAR2019 Robust Reading Challenge on Multi-lingual Scene Text Detection and Recognition -- RRC-MLT-2019

IEEE International Conference on Document Analysis and Recognition (ICDAR), 2019

1 July 2019

Nibal Nayef

Yash J. Patel

M. Busta

Pinaki Nath Chowdhury

Papers citing "ICDAR2019 Robust Reading Challenge on Multi-lingual Scene Text Detection and Recognition -- RRC-MLT-2019"

50 / 135 papers shown

Bharat Scene Text: A Novel Comprehensive Dataset and Benchmark for Indian Language Scene Text Understanding

145

28 Nov 2025

Evaluating Multimodal Large Language Models on Vertically Written Japanese Text

Keito Sasagawa

Shuhei Kurita

Daisuke Kawahara

19 Nov 2025

A Large-scale Dataset for Robust Complex Anime Scene Text Detection

09 Oct 2025

VLM-FO1: Bridging the Gap Between High-Level Reasoning and Fine-Grained Perception in VLMs

219

30 Sep 2025

TEACH: Text Encoding as Curriculum Hints for Scene Text Recognition

Xiahan Yang

Hui Zheng

VLM

111

02 Aug 2025

SAViL-Det: Semantic-Aware Vision-Language Model for Multi-Script Text Detection

Mohammed-En-Nadhir Zighem

Abdenour Hadid

VLM

27 Jul 2025

MSTAR: Box-free Multi-query Scene Text Retrieval with Attention Recycling

309

12 Jun 2025

The OCR Quest for Generalization: Learning to recognize low-resource alphabets with model editing

Adrià Molina Rodríguez

O. R. Terrades

Josep Lladós

232

07 Jun 2025

SparseMM: Head Sparsity Emerges from Visual Concept Responses in MLLMs

474

05 Jun 2025

TextSR: Diffusion Super-Resolution with Multilingual OCR Guidance

Keren Ye

Ignacio Garcia Dorado

250

29 May 2025

SATORI-R1: Incentivizing Multimodal Reasoning through Explicit Visual Anchoring

444

25 May 2025

The Devil is in Fine-tuning and Long-tailed Problems:A New Benchmark for Scene Text DetectionInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

316

21 May 2025

DanceText: A Training-Free Layered Framework for Controllable Multilingual Text Transformation in Images

Zhenyu Yu

Mohd Yamani Idna Idris

276

18 Apr 2025

DocSAM: Unified Document Image Segmentation via Query Decomposition and Heterogeneous Mixed LearningComputer Vision and Pattern Recognition (CVPR), 2025

Xiao-Hui Li

Fei Yin

Cheng-Lin Liu

313

05 Apr 2025

Accurate Scene Text Recognition with Efficient Model Scaling and Cloze Self-DistillationComputer Vision and Pattern Recognition (CVPR), 2025

407

20 Mar 2025

A Context-Driven Training-Free Network for Lightweight Scene Text Segmentation and Recognition

Ritabrata Chakraborty

Shivakumara Palaiahnakote

Umapada Pal

Cheng-Lin Liu

VLM

277

19 Mar 2025

SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild

361

08 Jan 2025

First-place Solution for Streetscape Shop Sign Recognition Competition

Bin Wang

Li Jing

980

06 Jan 2025

TextSSR: Diffusion-based Data Synthesis for Scene Text Recognition

439

02 Dec 2024

Text Image Generation for Low-Resource Languages with Dual Translation Learning

209

26 Sep 2024

Spotlight Text Detector: Spotlight on Candidate Regions Like a CameraIEEE transactions on multimedia (IEEE TMM), 2024

Xu Han

Junyu Gao

Chuang Yang

Yuan Yuan

Qi Wang

286

25 Sep 2024

Leveraging Text Localization for Scene Text Removal via Text-aware Masked Image ModelingEuropean Conference on Computer Vision (ECCV), 2024

Zixiao Wang

244

20 Sep 2024

VL-Reader: Vision and Language Reconstructor is an Effective Scene Text RecognizerACM Multimedia (MM), 2024

Humen Zhong

Zhibo Yang

Zhaohai Li

Peng Wang

Jun Tang

Wenqing Cheng

Cong Yao

253

18 Sep 2024

FastTextSpotter: A High-Efficiency Transformer for Multilingual Scene Text SpottingInternational Conference on Pattern Recognition (ICPR), 2024

282

27 Aug 2024

Decoder Pre-Training with only Text for Scene Text RecognitionACM Multimedia (MM), 2024

Shuai Zhao

Yongkun Du

Zhineng Chen

Yu-Gang Jiang

156

11 Aug 2024

Focus, Distinguish, and Prompt: Unleashing CLIP for Efficient and Flexible Scene Text RetrievalACM Multimedia (MM), 2024

237

01 Aug 2024

Self-Supervised Learning for Text Recognition: A Critical SurveyInternational Journal of Computer Vision (IJCV), 2024

Carlos Peñarrubia

J. J. Valero-Mas

Jorge Calvo-Zaragoza

427

29 Jul 2024

MOoSE: Multi-Orientation Sharing Experts for Open-set Scene Text Recognition

Chang Liu

Simon Corbillé

Elisa H Barney Smith

197

26 Jul 2024

Out of Length Text Recognition with Sub-String Matching

Yongkun Du

Zhineng Chen

Caiyan Jia

Xieping Gao

Yu-Gang Jiang

510

17 Jul 2024

How Control Information Influences Multilingual Text Image Generation and Editing?

330

16 Jul 2024

AnyTrans: Translate AnyText in the Image with Large Scale Models

Xiaoshuai Sun

Rongrong Ji

VLM

249

17 Jun 2024

A Survey on Multi-modal Machine Translation: Tasks, Methods and Challenges

333

21 May 2024

MTVQA: Benchmarking Multilingual Text-Centric Visual Question Answering

...

788

20 May 2024

The First Swahili Language Scene Text Detection and Recognition DatasetIEEE International Conference on Document Analysis and Recognition (ICDAR), 2024

Fadila Wendigoundi Douamba

Jianjun Song

Ling Fu

Yuliang Liu

Xiang Bai

232

19 May 2024

FPDIoU Loss: A Loss Function for Efficient Bounding Box Regression of Rotated Object DetectionImage and Vision Computing (IVC), 2024

Siliang Ma

Yong Xu

268

16 May 2024

HAAP: Vision-context Hierarchical Attention Autoregressive with Adaptive Permutation for Scene Text Recognition

196

15 May 2024

Self-Supervised Pre-training with Symmetric Superimposition Modeling for Scene Text RecognitionInternational Joint Conference on Artificial Intelligence (IJCAI), 2024

212

09 May 2024

Exploring the Capabilities of Large Multimodal Models on Dense TextIEEE International Conference on Document Analysis and Recognition (ICDAR), 2024

Yuliang Liu

201

09 May 2024

Draw-and-Understand: Leveraging Visual Prompts to Enable MLLMs to Comprehend What You Want

Shanghang Zhang

402

29 Mar 2024

IndicSTR12: A Dataset for Indic Scene Text Recognition

Harsh Lunia

Ajoy Mondal

C. V. Jawahar

171

12 Mar 2024

Open-Vocabulary Scene Text Recognition via Pseudo-Image Labeling and Margin Loss

242

12 Mar 2024

TextMonkey: An OCR-Free Large Multimodal Model for Understanding Document

Yuliang Liu

313

150

07 Mar 2024

Visual Text Meets Low-level Vision: A Comprehensive Survey on Visual Text Processing

241

05 Feb 2024

An Empirical Study of Scaling Law for OCR

430

29 Dec 2023

Cross-Lingual Learning in Multilingual Scene Text Recognition

Jeonghun Baek

Yusuke Matsui

Kiyoharu Aizawa

220

17 Dec 2023

Bridging Synthetic and Real Worlds for Pre-training Scene Text DetectorsEuropean Conference on Computer Vision (ECCV), 2023

Wei Shen

309

08 Dec 2023

Enhancing Scene Text Detectors with Realistic Text Image Synthesis Using Diffusion Models

Yuliang Liu

197

28 Nov 2023

Scene Text Image Super-resolution based on Text-conditional Diffusion Models

233

16 Nov 2023

Exploring OCR Capabilities of GPT-4V(ision) : A Quantitative and In-depth Evaluation

Lianwen Jin

399

25 Oct 2023

Box2Poly: Memory-Efficient Polygon Prediction of Arbitrarily Shaped and Rotated TextAAAI Conference on Artificial Intelligence (AAAI), 2023

250

20 Sep 2023