v1v2v3v4v5v6 (latest)

ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

International Conference on Learning Representations (ICLR), 2019

26 September 2019

ArXiv (abs)PDF HTML Github (3271★)

Papers citing "ALBERT: A Lite BERT for Self-supervised Learning of Language Representations"

50 / 3,050 papers shown

FlauBERT: Unsupervised Language Model Pre-training for FrenchInternational Conference on Language Resources and Evaluation (LREC), 2019

350

431

11 Dec 2019

MITAS: A Compressed Time-Domain Audio Separation Network with Parameter Sharing

09 Dec 2019

Large-scale Pretraining for Visual Dialog: A Simple State-of-the-Art BaselineEuropean Conference on Computer Vision (ECCV), 2019

Devi Parikh

360

120

05 Dec 2019

Bimodal Speech Emotion Recognition Using Pre-Trained Language Models

164

29 Nov 2019

Low Rank Factorization for Compact Multi-Head Self-Attention

Sneha Mehta

Huzefa Rangwala

Naren Ramakrishnan

149

26 Nov 2019

Efficient Attention Mechanism for Visual Dialog that can Handle All the Interactions between Multiple Inputs

Van-Quang Nguyen

Masanori Suganuma

Takayuki Okatani

294

26 Nov 2019

Pre-Training of Deep Bidirectional Protein Sequence Representations with Structural InformationIEEE Access (IEEE Access), 2019

337

25 Nov 2019

Global Greedy Dependency ParsingAAAI Conference on Artificial Intelligence (AAAI), 2019

Z. Li

Zhao Hai

Kevin Parnow

334

20 Nov 2019

Vision-Language Navigation with Self-Supervised Auxiliary Reasoning TasksComputer Vision and Pattern Recognition (CVPR), 2019

Fengda Zhu

Yi Zhu

Xiaojun Chang

Xiaodan Liang

LRM

457

267

18 Nov 2019

Unsupervised Pre-training for Natural Language Generation: A Literature Review

Yuanxin Liu

Zheng Lin

SSL AI4CE

123

13 Nov 2019

ZiMM: a deep learning model for long term and blurry relapses with non-clinical claims data

151

13 Nov 2019

KEPLER: A Unified Model for Knowledge Embedding and Pre-trained Language RepresentationTransactions of the Association for Computational Linguistics (TACL), 2019

Xiaozhi Wang

Zhengyan Zhang

Jian Tang

395

771

13 Nov 2019

CamemBERT: a Tasty French Language ModelAnnual Meeting of the Association for Computational Linguistics (ACL), 2019

Louis Martin

Eric Villemonte de la Clergerie

Djamé Seddah

Benoît Sagot

543

1,056

10 Nov 2019

ConveRT: Efficient and Accurate Conversational Representations from TransformersFindings (Findings), 2019

433

207

09 Nov 2019

Hierarchical Graph Network for Multi-hop Question AnsweringConference on Empirical Methods in Natural Language Processing (EMNLP), 2019

441

184

09 Nov 2019

MKD: a Multi-Task Knowledge Distillation Approach for Pretrained Language Models

203

09 Nov 2019

SMART: Robust and Efficient Fine-Tuning for Pre-trained Natural Language Models through Principled Regularized OptimizationAnnual Meeting of the Association for Computational Linguistics (ACL), 2019

Xiaodong Liu

651

590

08 Nov 2019

Transforming Wikipedia into Augmented Data for Query-Focused SummarizationIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2019

233

08 Nov 2019

Blockwise Self-Attention for Long Document UnderstandingFindings (Findings), 2019

Hao Ma

Sinong Wang

309

269

07 Nov 2019

Deepening Hidden Representations from Pre-trained Language Models

Junjie Yang

Hai Zhao

128

05 Nov 2019

BAS: An Answer Selection Method Using BERT Language Model

Jamshid Mozafari

A. Fatemi

M. Nematbakhsh

342

04 Nov 2019

CCNet: Extracting High Quality Monolingual Datasets from Web Crawl DataInternational Conference on Language Resources and Evaluation (LREC), 2019

Francisco Guzmán

472

756

01 Nov 2019

A neural document language modeling framework for spoken document retrievalIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2019

106

31 Oct 2019

Parameter Sharing Decoder Pair for Auto Composing

Xu Zhao

MoE

107

31 Oct 2019

Ensembling Strategies for Answering Natural Questions

187

30 Oct 2019

BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and ComprehensionAnnual Meeting of the Association for Computational Linguistics (ACL), 2019

Luke Zettlemoyer

854

12,171

29 Oct 2019

What does BERT Learn from Multiple-Choice Reading Comprehension Datasets?

157

28 Oct 2019

Mockingjay: Unsupervised Speech Representation Learning with Deep Bidirectional Transformer EncodersIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2019

492

393

25 Oct 2019

Exploring the Limits of Transfer Learning with a Unified Text-to-Text TransformerJournal of machine learning research (JMLR), 2019

Sharan Narang

1.6K

23,949

23 Oct 2019

Injecting Hierarchy with U-Net Transformers

139

16 Oct 2019

Structured Pruning of a BERT-based Question Answering Model

J. Scott McCarley

Rishav Chakravarti

Avirup Sil

278

14 Oct 2019

Structured Pruning of Large Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2019

Ziheng Wang

Jeremy Wohlwend

Tao Lei

299

329

10 Oct 2019

On the adequacy of untuned warmup for adaptive optimizationAAAI Conference on Artificial Intelligence (AAAI), 2019

Jerry Ma

Denis Yarats

292

09 Oct 2019

HuggingFace's Transformers: State-of-the-art Natural Language Processing

...

442

3,286

09 Oct 2019

FreeLB: Enhanced Adversarial Training for Natural Language UnderstandingInternational Conference on Learning Representations (ICLR), 2019

686

492

25 Sep 2019

UNITER: UNiversal Image-TExt Representation LearningEuropean Conference on Computer Vision (ECCV), 2019

372

465

25 Sep 2019

Portuguese Named Entity Recognition using BERT-CRF

Fábio Souza

Rodrigo Nogueira

R. Lotufo

275

280

23 Sep 2019

TinyBERT: Distilling BERT for Natural Language UnderstandingFindings (Findings), 2019

Xiaoqi Jiao

Yichun Yin

Lifeng Shang

Xin Jiang

Xiao Chen

Linlin Li

F. Wang

Qun Liu

VLM

632

2,161

23 Sep 2019

Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism

1.3K

2,442

17 Sep 2019

On Identifiability in TransformersInternational Conference on Learning Representations (ICLR), 2019

Gino Brunner

Yang Liu

Damian Pascual

Oliver Richter

Massimiliano Ciaramita

Roger Wattenhofer

ViT

331

202

12 Aug 2019

Semi-supervised Thai Sentence Segmentation Using Local and Distant Word RepresentationsACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), 2019

Chanatip Saetia

Ekapol Chuangsuwanich

Tawunrat Chalothorn

P. Vateekul

242

04 Aug 2019

DeepCABAC: A Universal Compression Algorithm for Deep Neural NetworksIEEE Journal on Selected Topics in Signal Processing (JSTSP), 2019

...

244

107

27 Jul 2019

XLNet: Generalized Autoregressive Pretraining for Language UnderstandingNeural Information Processing Systems (NeurIPS), 2019

928

9,121

19 Jun 2019

Pre-Training with Whole Word Masking for Chinese BERTIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2019

265

233

19 Jun 2019

Survey on Evaluation Methods for Dialogue SystemsArtificial Intelligence Review (AIR), 2019

278

322

10 May 2019

An Attentive Survey of Attention Models

444

723

05 Apr 2019

Recent Advances in Natural Language Inference: A Survey of Benchmarks, Resources, and Approaches

Shane Storks

Qiaozi Gao

J. Chai

476

142

02 Apr 2019

Tensorized Embedding Layers for Efficient Model Compression

248

30 Jan 2019

Sentence transition matrix: An efficient approach that preserves sentence semantics

Myeongjun Jang

Pilsung Kang

103

16 Jan 2019

Impact of Power System Partitioning on the Efficiency of Distributed Multi-Step Optimization

Dongliang Chen

A. Bucchiarone

Zhihan Lv

133

31 May 2016