Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2305.18721
Cited By

LayoutMask: Enhance Text-Layout Interaction in Multi-modal Pre-training
for Document Understanding

v1v2 (latest)

LayoutMask: Enhance Text-Layout Interaction in Multi-modal Pre-training for Document Understanding

Annual Meeting of the Association for Computational Linguistics (ACL), 2023

30 May 2023

ArXiv (abs)PDF HTML Github (75438★)

Papers citing "LayoutMask: Enhance Text-Layout Interaction in Multi-modal Pre-training for Document Understanding"

11 / 11 papers shown

DocPolarBERT: A Pre-trained Model for Document Understanding with Relative Polar Coordinate Encoding of Layout Structures

DocPolarBERT: A Pre-trained Model for Document Understanding with Relative Polar Coordinate Encoding of Layout Structures

Benno Uthayasooriyar

392

0

0

11 Jul 2025

Relation-Rich Visual Document Generator for Visual Information Extraction

Relation-Rich Visual Document Generator for Visual Information ExtractionComputer Vision and Pattern Recognition (CVPR), 2025

301

3

0

14 Apr 2025

TextBite: A Historical Czech Document Dataset for Logical Page Segmentation

TextBite: A Historical Czech Document Dataset for Logical Page Segmentation

Martin Kostelník

237

0

0

20 Mar 2025

ReLayout: Towards Real-World Document Understanding via Layout-enhanced
Pre-training

ReLayout: Towards Real-World Document Understanding via Layout-enhanced Pre-trainingInternational Conference on Computational Linguistics (COLING), 2024

Zhouqiang Jiang

289

5

0

14 Oct 2024

Modeling Layout Reading Order as Ordering Relations for Visually-rich
Document Understanding

Modeling Layout Reading Order as Ordering Relations for Visually-rich Document UnderstandingConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Huan Chen

...

Qi Zhang

244

18

0

29 Sep 2024

DocMamba: Efficient Document Pre-training with State Space Model

DocMamba: Efficient Document Pre-training with State Space ModelAAAI Conference on Artificial Intelligence (AAAI), 2024

Pengfei Hu

Jiefeng Ma

374

4

0

18 Sep 2024

UNER: A Unified Prediction Head for Named Entity Recognition in
Visually-rich Documents

UNER: A Unified Prediction Head for Named Entity Recognition in Visually-rich DocumentsACM Multimedia (MM), 2024

335

5

0

02 Aug 2024

Deep Learning based Visually Rich Document Content Understanding: A Survey

Deep Learning based Visually Rich Document Content Understanding: A Survey

571

23

0

02 Aug 2024

LayoutLLM: Layout Instruction Tuning with Large Language Models for
Document Understanding

LayoutLLM: Layout Instruction Tuning with Large Language Models for Document Understanding

442

123

0

08 Apr 2024

On Task-personalized Multimodal Few-shot Learning for Visually-rich
Document Entity Retrieval

On Task-personalized Multimodal Few-shot Learning for Visually-rich Document Entity RetrievalConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

344

3

0

01 Nov 2023

Reading Order Matters: Information Extraction from Visually-rich
Documents by Token Path Prediction

Reading Order Matters: Information Extraction from Visually-rich Documents by Token Path PredictionConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

285

34

0

17 Oct 2023

Page 1 of 1