UniLMv2: Pseudo-Masked Language Models for Unified Language Model Pre-Training

International Conference on Machine Learning (ICML), 2020

28 February 2020

Xiaodong Liu

Papers citing "UniLMv2: Pseudo-Masked Language Models for Unified Language Model Pre-Training"

50 / 228 papers shown

A Framework for Generating Artificial Datasets to Validate Absolute and Relative Position Concepts

George Correa de Araujo

H. Maia

Hélio Pedrini

189

17 Sep 2025

FormGym: Doing Paperwork with Agents

Matthew Toles

Rattandeep Singh

Isaac Song Zhou Yu

Zhou Yu

175

17 Jun 2025

Information Extraction from Visually Rich Documents using LLM-based Organization of Documents into Independent Textual SegmentsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

248

18 May 2025

Generative Sign-description Prompts with Multi-positive Contrastive Learning for Sign Language RecognitionItalian National Conference on Sensors (INS), 2025

348

05 May 2025

Robust Asymmetric Heterogeneous Federated Learning with Corrupted ClientsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

507

12 Mar 2025

A Survey of Large Language Models for Healthcare: from Data, Technology, and Applications to Accountability and EthicsInformation Fusion (Inf. Fusion), 2023

889

298

28 Jan 2025

Can bidirectional encoder become the ultimate winner for downstream applications of foundation models?

354

27 Nov 2024

SIRA: Scalable Inter-frame Relation and Association for Radar PerceptionComputer Vision and Pattern Recognition (CVPR), 2024

384

04 Nov 2024

Future Token Prediction -- Causal Language Modelling with Per-Token Semantic State Vector for Multi-Token Prediction

Nicholas Walker

204

23 Oct 2024

ReLayout: Towards Real-World Document Understanding via Layout-enhanced Pre-trainingInternational Conference on Computational Linguistics (COLING), 2024

282

14 Oct 2024

A Novel LLM-based Two-stage Summarization Approach for Long DialoguesAsia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), 2024

Yuan-Jhe Yin

Bo-Yu Chen

Berlin Chen

212

09 Oct 2024

Towards Robust Vision Transformer via Masked Adaptive Ensemble

350

22 Jul 2024

KEHRL: Learning Knowledge-Enhanced Language Representations with Hierarchical Reinforcement Learning

Hui Xue

234

24 Jun 2024

Capturing Temporal Components for Time Series Classification

Venkata Ragavendra Vavilthota

Ranjith Ramanathan

Sathyanarayanan N. Aakur

186

20 Jun 2024

Large Language Models for Education: A Survey

Wensheng Gan

Philip S. Yu

360

12 May 2024

Multi-Head Mixture-of-Experts

306

23 Apr 2024

An Experimental Study on Exploring Strong Lightweight Vision Transformers via Masked Image Modeling Pre-Training

355

18 Apr 2024

Navigating the Landscape of Large Language Models: A Comprehensive Review and Analysis of Paradigms and Fine-Tuning Strategies

Benjue Weng

LM&MA

337

13 Apr 2024

Emerging Property of Masked Token for Effective Pre-training

Hyesong Choi

Hunsang Lee

Seyoung Joung

Hyejin Park

Jiyeong Kim

Dongbo Min

199

12 Apr 2024

Salience-Based Adaptive Masking: Revisiting Token Dynamics for Enhanced Pre-training

Hyesong Choi

Hyejin Park

Kwang Moo Yi

Sungmin Cha

Dongbo Min

339

12 Apr 2024

Can Language Beat Numerical Regression? Language-Based Multimodal Trajectory Prediction

Inhwan Bae

Junoh Lee

Hae-Gon Jeon

422

27 Mar 2024

Transformers and Language Models in Form Understanding: A Comprehensive Review of Scanned Document Analysis

272

06 Mar 2024

Masked Thought: Simply Masking Partial Reasoning Steps Can Improve Mathematical Reasoning Learning of Language Models

Ting-En Lin

Rui Yan

278

04 Mar 2024

Leveraging Large Language Models for Learning Complex Legal Concepts through Storytelling

...

Deb Roy

402

26 Feb 2024

On Leveraging Encoder-only Pre-trained Language Models for Effective Keyphrase Generation

Di Wu

Wasi Uddin Ahmad

Kai-Wei Chang

296

21 Feb 2024

Language Model Adaptation to Specialized Domains through Selective Masking based on Genre and Topical Characteristics

307

19 Feb 2024

Text-to-Code Generation with Modality-relative Pre-training

327

08 Feb 2024

ELLA-V: Stable Neural Codec Language Modeling with Alignment-guided Sequence ReorderingAAAI Conference on Artificial Intelligence (AAAI), 2024

Xie Chen

265

14 Jan 2024

xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering the Language of ProteinbioRxiv (bioRxiv), 2024

...

Yuxiao Dong

306

143

11 Jan 2024

BIM: Block-Wise Self-Supervised Learning with Masked Image Modeling

Yixuan Luo

Mengye Ren

Sai Qian Zhang

242

28 Nov 2023

Enhancing Document Information Analysis with Multi-Task Pre-training: A Robust Approach for Information Extraction in Visually-Rich DocumentsIEEE International Joint Conference on Neural Network (IJCNN), 2023

Tofik Ali

Partha Pratim Roy

256

25 Oct 2023

GenKIE: Robust Generative Multimodal Document Key Information ExtractionConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

225

24 Oct 2023

Vision-Enhanced Semantic Entity Recognition in Document Images via Visually-Asymmetric Consistency LearningConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

257

23 Oct 2023

InferDPT: Privacy-Preserving Inference for Black-box Large Language Model

774

18 Oct 2023

Multi-Stage Pre-training Enhanced by ChatGPT for Multi-Scenario Multi-Domain Dialogue SummarizationConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

Zhoujun Li

225

16 Oct 2023

Surveying the Landscape of Text Summarization with Deep Learning: A Comprehensive Review

Guanghua Wang

Weili Wu

AI4TS AILaw

262

13 Oct 2023

PolyTask: Learning Unified Policies through Behavior Distillation

Siddhant Haldar

Lerrel Pinto

363

12 Oct 2023

Fast-ELECTRA for Efficient Pre-trainingInternational Conference on Learning Representations (ICLR), 2023

Xiaodong Liu

289

11 Oct 2023

MelodyGLM: Multi-task Pre-training for Symbolic Melody Generation

Kejun Zhang

249

19 Sep 2023

MMST-ViT: Climate Change-aware Crop Yield Prediction via Multi-Modal Spatial-Temporal Vision TransformerIEEE International Conference on Computer Vision (ICCV), 2023

...

339

16 Sep 2023

Learning to Predict Concept Ordering for Common Sense GenerationInternational Joint Conference on Natural Language Processing (IJCNLP), 2023

160

12 Sep 2023

Multi-party Goal Tracking with LLMs: Comparing Pre-training, Fine-tuning, and Prompt EngineeringSIGDIAL Conferences (SIGDIAL), 2023

Angus Addlesee

Weronika Sieiñska

Nancie Gunson

Daniel Hernández García

Christian Dondrup

Oliver Lemon

301

29 Aug 2023

Artificial-Spiking Hierarchical Networks for Vision-Language Representation Learning

268

18 Aug 2023

Challenges and Opportunities of Using Transformer-Based Multi-Task Learning in NLP Through ML Lifecycle: A Survey

265

16 Aug 2023

Large Language Models for Information Retrieval: A Survey

777

513

14 Aug 2023

Empowering NLG: Offline Reinforcement Learning for Informal Summarization in Online Domains

Zhiwei Tai

Po-Chuan Chen

OffRL

213

17 Jun 2023

Recipes for Sequential Pre-training of Multilingual Encoder and Seq2Seq ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

259

14 Jun 2023

UniPoll: A Unified Social Media Poll Generation Framework via Multi-Objective OptimizationIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2023

209

12 Jun 2023

How Can Recommender Systems Benefit from Large Language Models: A Survey

Jianghao Lin

Xinyi Dai

...

Yong Yu

Ruiming Tang

Weinan Zhang

LRM

588

340

09 Jun 2023

DocFormerv2: Local Features for Document UnderstandingAAAI Conference on Artificial Intelligence (AAAI), 2023

272

02 Jun 2023