ICDAR 2021 Competition on Document VisualQuestion Answering

ICDAR 2021 Competition on Document VisualQuestion Answering

10 November 2021

Rubèn Pérez Tito

Dimosthenis Karatzas

Papers citing "ICDAR 2021 Competition on Document VisualQuestion Answering"

19 / 19 papers shown

Title
Preserving Privacy Without Compromising Accuracy: Machine Unlearning for Handwritten Text Recognition Lei Kang Xuanshuo Fu Lluís Gómez Alicia Fornés Ernest Valveny Dimosthenis Karatzas MU 32 0 0 11 Apr 2025
KIEval: Evaluation Metric for Document Key Information Extraction Minsoo Khang Sang Chul Jung Sungrae Park Teakgyu Hong 47 0 0 07 Mar 2025
NeurIPS 2023 Competition: Privacy Preserving Federated Learning Document VQA Marlon Tobaben Mohamed Ali Souibgui Rubèn Pérez Tito Khanh Nguyen Raouf Kerkouche ... Josep Lladós Ernest Valveny Antti Honkela Mario Fritz Dimosthenis Karatzas FedML 28 0 0 06 Nov 2024
DistilDoc: Knowledge Distillation for Visually-Rich Document Applications Jordy Van Landeghem Subhajit Maity Ayan Banerjee Matthew Blaschko Marie-Francine Moens Josep Lladós Sanket Biswas 41 2 0 12 Jun 2024
Federated Document Visual Question Answering: A Pilot Study Khanh Nguyen Dimosthenis Karatzas FedML 28 0 0 10 May 2024
TreeForm: End-to-end Annotation and Evaluation for Form Document Parsing Ran Zmigrod Zhiqiang Ma Armineh Nourbakhsh Sameena Shah 13 4 0 07 Feb 2024
Instruction Makes a Difference Tosin P. Adewumi Nudrat Habib Lama Alkhaled Elisa Barney VLM MLLM 8 1 0 01 Feb 2024
Privacy-Aware Document Visual Question Answering Rubèn Pérez Tito Khanh Nguyen Marlon Tobaben Raouf Kerkouche Mohamed Ali Souibgui ... Lei Kang Ernest Valveny Antti Honkela Mario Fritz Dimosthenis Karatzas 17 13 0 15 Dec 2023
RealCQA: Scientific Chart Question Answering as a Test-bed for First-Order Logic Saleem Ahmed Bhavin Jawade Shubham Pandey S. Setlur Venugopal Govindaraju 13 5 0 03 Aug 2023
Visually-Situated Natural Language Understanding with Contrastive Reading Model and Frozen Large Language Models Geewook Kim Hodong Lee D. Kim Haeji Jung S. Park Yoon Kim Sangdoo Yun Taeho Kil Bado Lee Seunghyun Park VLM 27 4 0 24 May 2023
Document Understanding Dataset and Evaluation (DUDE) Jordy Van Landeghem Rubèn Pérez Tito Łukasz Borchmann Michal Pietruszka Pawel Józiak ... Bertrand Ackaert Ernest Valveny Matthew Blaschko Sien Moens Tomasz Stanislawek VGen 14 52 0 15 May 2023
Hierarchical multimodal transformers for Multi-Page DocVQA Rubèn Pérez Tito Dimosthenis Karatzas Ernest Valveny 11 54 0 07 Dec 2022
On Web-based Visual Corpus Construction for Visual Document Understanding Donghyun Kim Teakgyu Hong Moonbin Yim Yoonsik Kim Geewook Kim 21 3 0 07 Nov 2022
One-Shot Doc Snippet Detection: Powering Search in Document Beyond Text Abhinav Java Shripad Deshmukh Milan Aggarwal Surgan Jandial Mausoom Sarkar Balaji Krishnamurthy 27 3 0 12 Sep 2022
VLCDoC: Vision-Language Contrastive Pre-Training Model for Cross-Modal Document Classification Souhail Bakkali Zuheng Ming Mickael Coustaty Marccal Rusinol O. R. Terrades VLM 35 30 0 24 May 2022
OCR-IDL: OCR Annotations for Industry Document Library Dataset Ali Furkan Biten Rubèn Pérez Tito Lluís Gómez Ernest Valveny Dimosthenis Karatzas 13 26 0 25 Feb 2022
OCR-free Document Understanding Transformer Geewook Kim Teakgyu Hong Moonbin Yim Jeongyeon Nam Jinyoung Park Jinyeong Yim Wonseok Hwang Sangdoo Yun Dongyoon Han Seunghyun Park ViT 44 262 0 30 Nov 2021
LayoutLMv2: Multi-modal Pre-training for Visually-Rich Document Understanding Yang Xu Yiheng Xu Tengchao Lv Lei Cui Furu Wei ... D. Florêncio Cha Zhang Wanxiang Che Min Zhang Lidong Zhou ViT MLLM 142 498 0 29 Dec 2020
COCO-Text: Dataset and Benchmark for Text Detection and Recognition in Natural Images Andreas Veit Tomas Matera Lukás Neumann Jirí Matas Serge J. Belongie 177 515 0 26 Jan 2016