Synthetic Data for Text Localisation in Natural Images

22 April 2016

Ankush Gupta

Andrea Vedaldi

Andrew Zisserman

ArXiv (abs)PDF HTML

Papers citing "Synthetic Data for Text Localisation in Natural Images"

50 / 607 papers shown

An Empirical Study of Scaling Law for OCR

440

29 Dec 2023

Progressive Evolution from Single-Point to Polygon for Scene Text

Linger Deng

Mingxin Huang

Xudong Xie

Yuliang Liu

Lianwen Jin

Xiang Bai

191

21 Dec 2023

Brush Your Text: Synthesize Any Scene Text on Images via Diffusion Model

Yu Qiao

249

19 Dec 2023

IPAD: Iterative, Parallel, and Diffusion-based Network for Scene Text Recognition

397

19 Dec 2023

Bridging Synthetic and Real Worlds for Pre-training Scene Text DetectorsEuropean Conference on Computer Vision (ECCV), 2023

Wei Shen

315

08 Dec 2023

UDiffText: A Unified Framework for High-quality Text Synthesis in Arbitrary Images via Character-aware Diffusion Models

Yiming Zhao

Zhouhui Lian

260

08 Dec 2023

Compression of end-to-end non-autoregressive image-to-speech system for low-resourced devices

232

30 Nov 2023

DSText V2: A Comprehensive Video Text Spotting Dataset for Dense and Small TextPattern Recognition (Pattern Recogn.), 2023

240

29 Nov 2023

STR-Cert: Robustness Certification for Deep Text Recognition on Deep Learning Pipelines and Vision Transformers

Daqian Shao

Lukas Fesser

Marta Z. Kwiatkowska

192

28 Nov 2023

Enhancing Scene Text Detectors with Realistic Text Image Synthesis Using Diffusion Models

Yuliang Liu

206

28 Nov 2023

Towards Detecting, Recognizing, and Parsing the Address Information from Bangla Signboard: A Deep Learning-based Approach

Hasan Murad

Mohammed Eunus Ali

186

22 Nov 2023

Scene Text Image Super-resolution based on Text-conditional Diffusion Models

238

16 Nov 2023

Image Generation and Learning Strategy for Deep Document Forgery Detection

242

07 Nov 2023

On Manipulating Scene Text in the Wild with Diffusion ModelsIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

224

01 Nov 2023

Hierarchical Text Spotter for Joint Text Spotting and Layout AnalysisIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Yasuhisa Fujii

181

25 Oct 2023

Convolutional Bidirectional Variational Autoencoder for Image Domain Translation of Dotted Arabic Expiration

Ahmed Zidane

Ghada Soliman

124

21 Oct 2023

Deep Aramaic: Towards a Synthetic Data Paradigm Enabling Machine Learning in EpigraphyPLoS ONE (PLoS ONE), 2023

274

11 Oct 2023

Symmetrical Linguistic Feature Distillation with CLIP for Scene Text RecognitionACM Multimedia (ACM MM), 2023

331

08 Oct 2023

AI-Generated Images as Data Source: The Dawn of Synthetic Era

443

03 Oct 2023

Harnessing the Power of Multi-Lingual Datasets for Pre-training: Towards Enhancing Text Spotting PerformanceIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Alloy Das

Sanket Biswas

Ayan Banerjee

Josep Lladós

Umapada Pal

Saumik Bhattacharya

324

02 Oct 2023

SCOB: Universal Text Understanding via Character-wise Supervised Contrastive Learning with Online Text Rendering for Bridging Domain GapIEEE International Conference on Computer Vision (ICCV), 2023

283

21 Sep 2023

Kosmos-2.5: A Multimodal Literate Model

...

267

20 Sep 2023

Pixel Adapter: A Graph-Based Post-Processing Approach for Scene Text Image Super-ResolutionACM Multimedia (ACM MM), 2023

260

16 Sep 2023

Attention Where It Matters: Rethinking Visual Document Understanding with Selective Region ConcentrationIEEE International Conference on Computer Vision (ICCV), 2023

202

03 Sep 2023

Selective Scene Text RemovalBritish Machine Vision Conference (BMVC), 2023

Hayato Mitani

Akisato Kimura

Seiichi Uchida

251

01 Sep 2023

DTrOCR: Decoder-only Transformer for Optical Character RecognitionIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Masato Fujitake

442

30 Aug 2023

Self-supervised Scene Text Segmentation with Object-centric Layered Representations Augmented by Text RegionsACM Multimedia (ACM MM), 2022

284

25 Aug 2023

LISTER: Neighbor Decoding for Length-Insensitive Scene Text RecognitionIEEE International Conference on Computer Vision (ICCV), 2023

238

24 Aug 2023

MixNet: Toward Accurate Detection of Challenging Scene Text in the Wild

298

23 Aug 2023

Turning a CLIP Model into a Scene Text SpotterIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Yuliang Liu

183

21 Aug 2023

Self-distillation Regularized Connectionist Temporal Classification Loss for Text Recognition: A Simple Yet Effective ApproachAAAI Conference on Artificial Intelligence (AAAI), 2023

393

17 Aug 2023

Towards Robust Real-Time Scene Text Detection: From Semantic to Instance Representation LearningACM Multimedia (ACM MM), 2023

203

14 Aug 2023

Rapid Training Data Creation by Synthesizing Medical Images for Classification and Localization

173

09 Aug 2023

Relational Contrastive Learning for Scene Text RecognitionACM Multimedia (ACM MM), 2023

256

01 Aug 2023

CT-Net: Arbitrary-Shaped Text Detection via Contour Transformer

107

25 Jul 2023

Multi-Granularity Prediction with Learnable Fusion for Scene Text Recognition

Cheng Da

Peng Wang

Cong Yao

264

25 Jul 2023

Context Perception Parallel Decoder for Scene Text RecognitionIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Yongkun Du

Zhineng Chen

Caiyan Jia

301

23 Jul 2023

Revisiting Scene Text Recognition: A Data PerspectiveIEEE International Conference on Computer Vision (ICCV), 2023

Lianwen Jin

354

17 Jul 2023

The mapKurator System: A Complete Pipeline for Extracting and Linking Text from Historical Maps

211

29 Jun 2023

DiffusionSTR: Diffusion Model for Scene Text RecognitionInternational Conference on Information Photonics (ICIP), 2023

Masato Fujitake

DiffM

141

29 Jun 2023

Weakly Supervised Scene Text Generation for Low-resource LanguagesExpert systems with applications (ESWA), 2023

Yangchen Xie

Xinyuan Chen

Hongjian Zhan

Palaiahankote Shivakumara

Bing Yin

Cong Liu

Yue Lu

182

25 Jun 2023

ViTEraser: Harnessing the Power of Vision Transformers for Scene Text Removal with SegMIM PretrainingAAAI Conference on Artificial Intelligence (AAAI), 2023

Dezhi Peng

Chongyu Liu

Yuliang Liu

Lianwen Jin

DiffM

210

21 Jun 2023

Conditional Text Image Generation with Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2023

301

19 Jun 2023

FETNet: Feature Erasing and Transferring Network for Scene Text RemovalPattern Recognition (Pattern Recogn.), 2023

245

16 Jun 2023

PSSTRNet: Progressive Segmentation-guided Scene Text Removal NetworkIEEE International Conference on Multimedia and Expo (ICME), 2022

Guangtao Lyu

Anna Zhu

167

13 Jun 2023

Looking and Listening: Audio Guided Text Recognition

Yuliang Liu

163

06 Jun 2023

Bridging the Domain Gap between Synthetic and Real-World Data for Autonomous Driving

291

05 Jun 2023

Perception and Semantic Aware Regularization for Sequential Confidence CalibrationComputer Vision and Pattern Recognition (CVPR), 2023

Shuangping Huang

294

31 May 2023

Masked and Permuted Implicit Context Learning for Scene Text RecognitionIEEE Signal Processing Letters (IEEE SPL), 2023

234

25 May 2023

CLIP4STR: A Simple Baseline for Scene Text Recognition with Pre-trained Vision-Language ModelIEEE Transactions on Image Processing (IEEE TIP), 2023

381

23 May 2023