v1v2v3v4v5v6 (latest)

ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

International Conference on Learning Representations (ICLR), 2019

26 September 2019

ArXiv (abs)PDF HTML Github (3271★)

Papers citing "ALBERT: A Lite BERT for Self-supervised Learning of Language Representations"

50 / 3,049 papers shown

The Future of Combating Rumors? Retrieval, Discrimination, and Generation

161

29 Mar 2024

New Semantic Task for the French Spoken Language Understanding MEDIA Benchmark

320

28 Mar 2024

A Benchmark Evaluation of Clinical Named Entity Recognition in French

174

28 Mar 2024

mALBERT: Is a Compact Multilingual BERT Model Still Worth It?

Christophe Servan

Sahar Ghannay

Sophie Rosset

164

27 Mar 2024

GPTs and Language Barrier: A Cross-Lingual Legal QA Examination

107

26 Mar 2024

REFeREE: A REference-FREE Model-Based Metric for Text Simplification

Yichen Huang

Ekaterina Kochmar

204

26 Mar 2024

A Survey on Deep Learning and State-of-the-art Applications

Mohd Halim Mohd Noor

A. O. Ige

AILaw MLAU

211

26 Mar 2024

Opportunities and challenges in the application of large artificial intelligence models in radiology

272

24 Mar 2024

VLUE: A New Benchmark and Multi-task Knowledge Transfer Learning for Vietnamese Natural Language Understanding

Phong Nguyen-Thuan Do

232

23 Mar 2024

Enhancing Traffic Incident Management with Large Language Models: A Hybrid Machine Learning Approach for Severity Classification

Artur Grigorev

Khaled Saleh

Yuming Ou

Adriana-Simona Mihaita

252

20 Mar 2024

How Gender Interacts with Political Values: A Case Study on Czech BERT Models

Adnan Al Ali

Jindvrich Libovický

161

20 Mar 2024

Adaptive Ensembles of Fine-Tuned Transformers for LLM-Generated Text Detection

193

20 Mar 2024

WaterVG: Waterway Visual Grounding based on Text-Guided Vision and mmWave Radar

Shanliang Yao

...

378

19 Mar 2024

Simple Hack for Transformers against Heavy Long-Text Classification on a Time- and Memory-Limited GPU Service

Mirza Alim Mutasodirin

157

19 Mar 2024

Improving Generalizability of Extracting Social Determinants of Health Using Large Language Models through Prompt-tuning

Zehao Yu

Jiang Bian

146

19 Mar 2024

Large language models in 6G security: challenges and opportunities

Athanasios V. Vasilakos

Panos Kostakos

ELM

274

18 Mar 2024

SSCAE -- Semantic, Syntactic, and Context-aware natural language Adversarial Examples generatorIEEE Transactions on Dependable and Secure Computing (IEEE TDSC), 2024

190

18 Mar 2024

Metaphor Understanding Challenge Dataset for LLMsAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

174

18 Mar 2024

Semantic-Enhanced Representation Learning for Road Networks with Temporal DynamicsIEEE Transactions on Mobile Computing (IEEE TMC), 2024

203

18 Mar 2024

A Modified Word Saliency-Based Adversarial Attack on Text Classification Models

202

17 Mar 2024

Rethinking Multi-view Representation Learning via Distilled Disentangling

378

16 Mar 2024

ATOM: Asynchronous Training of Massive Models for Deep Learning in a Decentralized Environment

Xiaofeng Wu

Jia Rao

Wei Chen

213

15 Mar 2024

ST-LDM: A Universal Framework for Text-Grounded Object Generation in Real ImagesEuropean Conference on Computer Vision (ECCV), 2024

149

15 Mar 2024

FBPT: A Fully Binary Point TransformerIEEE International Conference on Robotics and Automation (ICRA), 2024

Zhixing Hou

Yuzhang Shang

Yan Yan

233

15 Mar 2024

depyf: Open the Opaque Box of PyTorch Compiler for Machine Learning Researchers

234

14 Mar 2024

Rethinking Referring Object Removal

203

14 Mar 2024

Language models scale reliably with over-training and on downstream tasksInternational Conference on Learning Representations (ICLR), 2024

...

Niklas Muennighoff

351

13 Mar 2024

Masked AutoDecoder is Effective Multi-Task Vision GeneralistComputer Vision and Pattern Recognition (CVPR), 2024

217

12 Mar 2024

A Logical Pattern Memory Pre-trained Model for Entailment Tree GenerationInternational Conference on Language Resources and Evaluation (LREC), 2024

206

11 Mar 2024

LORS: Low-rank Residual Structure for Parameter-Efficient Network Stacking

Chengjie Wang

239

07 Mar 2024

On the Effectiveness of Distillation in Mitigating Backdoors in Pre-trained Encoder

Yebo Feng

...

Hanwei Qian

Cong Wu

Quanjun Zhang

Yang Liu

Zhenyu Chen

185

06 Mar 2024

A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching

Zhou Zhao

269

05 Mar 2024

Found in the Middle: How Language Models Use Long Contexts Better via Plug-and-Play Positional Encoding

Zhewei Yao

298

05 Mar 2024

A Tutorial on the Pretrain-Finetune Paradigm for Natural Language Processing

Yu Wang

Wen Qu

229

04 Mar 2024

Vision-Language Models for Medical Report Generation and Visual Question Answering: A Review

Iryna Hartsock

Ghulam Rasool

381

170

04 Mar 2024

How does Architecture Influence the Base Capabilities of Pre-trained Language Models? A Case Study Based on FFN-Wider Transformer Models

Xin Lu

Yanyan Zhao

Bing Qin

171

04 Mar 2024

Pseudo-Label Calibration Semi-supervised Multi-Modal Entity Alignment

209

02 Mar 2024

ATP: Enabling Fast LLM Serving via Attention on Top Principal Keys

Yue Niu

Saurav Prakash

Salman Avestimehr

158

01 Mar 2024

Hierarchical Indexing for Retrieval-Augmented Opinion Summarization

Tom Hosking

Hao Tang

Mirella Lapata

315

01 Mar 2024

Rethinking Tokenization: Crafting Better Tokenizers for Large Language Models

Jinbiao Yang

LLMAG

263

01 Mar 2024

Cause and Effect: Can Large Language Models Truly Understand Causality?

Swagata Ashwani

Kshiteesh Hegde

Nishith Reddy Mannuru

Mayank Jindal

Dushyant Singh Sengar

Krishna Chaitanya Rao Kathala

Dishant Banga

Vinija Jain

Vasu Sharma

LRM

284

28 Feb 2024

Securing Reliability: A Brief Overview on Enhancing In-Context Learning for Foundation Models

Zhaorun Chen

232

27 Feb 2024

Fine-Grained Natural Language Inference Based Faithfulness Evaluation for Diverse Summarisation Tasks

Huajian Zhang

Yumo Xu

Laura Perez-Beltrachini

HILM

205

27 Feb 2024

Feature Re-Embedding: Towards Foundation Model-Level Performance in Computational Pathology

397

27 Feb 2024

Generating Effective Ensembles for Sentiment Analysis

Itay Etelis

Avi Rosenfeld

Abraham Itzhak Weinberg

David Sarne

139

26 Feb 2024

Unveiling Vulnerability of Self-Attention

Khai Jiet Liong

Hongqiu Wu

Haizhen Zhao

192

26 Feb 2024

Layer-wise Regularized Dropout for Neural Language Models

Shiwen Ni

Min Yang

Ruifeng Xu

Chengming Li

Xiping Hu

126

26 Feb 2024

QASE Enhanced PLMs: Improved Control in Text Generation for MRC

148

26 Feb 2024

OAG-Bench: A Human-Curated Benchmark for Academic Graph Mining

...

Yuxiao Dong

337

24 Feb 2024

Second-Order Fine-Tuning without Pain for LLMs:A Hessian Informed Zeroth-Order Optimizer

677

23 Feb 2024