v1v2v3v4v5v6 (latest)

ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

International Conference on Learning Representations (ICLR), 2019

26 September 2019

ArXiv (abs)PDF HTML Github (3271★)

Papers citing "ALBERT: A Lite BERT for Self-supervised Learning of Language Representations"

50 / 3,048 papers shown

DetoxBench: Benchmarking Large Language Models for Multitask Fraud & Abuse Detection

Joymallya Chakraborty

144

09 Sep 2024

Application Specific Compression of Deep Learning Models

Rohit Raj Rai

Angana Borah

Amit Awekar

182

09 Sep 2024

PriorDrive: Enhancing Online HD Mapping with Unified Vector Priors

390

09 Sep 2024

Expanding Expressivity in Transformer Models with MöbiusAttention

Anna-Maria Halacheva

M. Nayyeri

Steffen Staab

227

08 Sep 2024

Achieving Peak Performance for Large Language Models: A Systematic ReviewIEEE Access (IEEE Access), 2024

Z. R. K. Rostam

Sándor Szénási

Gábor Kertész

321

07 Sep 2024

An Effective Deployment of Diffusion LM for Data Augmentation in Low-Resource Sentiment ClassificationConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

359

05 Sep 2024

Pre-Trained Language Models for Keyphrase Prediction: A ReviewICT express (IE), 2024

Muhammad Umair

Tangina Sultana

Young-Koo Lee

313

02 Sep 2024

From Prediction to Application: Language Model-based Code Knowledge Tracing with Domain Adaptive Pre-Training and Automatic Feedback System with Pedagogical Prompting for Comprehensive Programming Education

...

252

31 Aug 2024

Speaker Tagging Correction With Non-Autoregressive Language Models

Grigor Kirakosyan

Davit Karamyan

3DV

239

30 Aug 2024

Is Personality Prediction Possible Based on Reddit Comments?

148

28 Aug 2024

A Survey of Large Language Models for European Languages

Wazir Ali

S. Pyysalo

385

27 Aug 2024

Shifted Window Fourier Transform And Retention For Image CaptioningInternational Conference on Neural Information Processing (ICONIP), 2024

312

25 Aug 2024

Genetic Approach to Mitigate Hallucination in Generative IR

150

25 Aug 2024

Domain-specific long text classification from sparse relevant informationEuropean Conference on Artificial Intelligence (ECAI), 2024

202

23 Aug 2024

Instruct-DeBERTa: A Hybrid Approach for Aspect-based Sentiment Analysis on Textual Reviews

Sachintha Rajith Ponnamperuma

G. Sandamali

K. L. Sudheera

175

23 Aug 2024

VFM-Det: Towards High-Performance Vehicle Detection via Large Foundation Models

Wentao Wu

Fanghua Hong

Xiao Wang

Chenglong Li

Jin Tang

VLM

278

23 Aug 2024

MedDec: A Dataset for Extracting Medical Decisions from Discharge SummariesAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

218

23 Aug 2024

Internal and External Knowledge Interactive Refinement Framework for Knowledge-Intensive Question Answering

Haowei Du

Dongyan Zhao

KELM

182

23 Aug 2024

Large Language Models are Good Attackers: Efficient and Stealthy Textual Backdoor Attacks

279

21 Aug 2024

BURExtract-Llama: An LLM for Clinical Concept Extraction in Breast Ultrasound Reports

113

21 Aug 2024

Inside the Black Box: Detecting Data Leakage in Pre-trained Language EncodersEuropean Conference on Artificial Intelligence (ECAI), 2024

Ning Yu

Michael Backes

Yang Zhang

PILM MIACV

343

20 Aug 2024

Uniting contrastive and generative learning for event sequences modelsInternational Joint Conference on the Analysis of Images, Social Networks and Texts (AISNT), 2024

Aleksandr Yugay

Alexey Zaytsev

AI4TS

213

19 Aug 2024

MegaFake: A Theory-Driven Dataset of Fake News Generated by Large Language Models

Han Zhu

245

19 Aug 2024

Investigating a Benchmark for Training-set free Evaluation of Linguistic Capabilities in Machine Reading Comprehension

194

09 Aug 2024

A Psychology-based Unified Dynamic Framework for Curriculum LearningComputational Linguistics (CL), 2024

232

09 Aug 2024

Survey: Transformer-based Models in Data Modality Conversion

225

08 Aug 2024

MDT-A2G: Exploring Masked Diffusion Transformers for Co-Speech Gesture GenerationACM Multimedia (MM), 2024

Chengjie Wang

336

06 Aug 2024

Dopamin: Transformer-based Comment Classifiers through Domain Post-Training and Multi-level Layer Aggregation

Nam Le Hai

Nghi D. Q. Bui

249

06 Aug 2024

Modelling Visual Semantics via Image Captioning to extract Enhanced Multi-Level Cross-Modal Semantic Incongruity Representation with Attention for Multimodal Sarcasm Detection

Sajal Aggarwal

Ananya Pandey

Dinesh Kumar Vishwakarma

193

05 Aug 2024

Large Language Model Aided QoS Prediction for Service Recommendation

215

05 Aug 2024

Recent Advances in Multi-Choice Machine Reading Comprehension: A Survey on Methods and Datasets

300

04 Aug 2024

Effective Demonstration Annotation for In-Context Learning via Language Model-Based Determinantal Point ProcessConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Peng Wang

254

04 Aug 2024

Cross-layer Attention Sharing for Pre-trained Large Language Models

...

285

04 Aug 2024

Deep Learning based Visually Rich Document Content Understanding: A Survey

464

02 Aug 2024

Pathway to Secure and Trustworthy ZSM for LLMs: Attacks, Defense, and Opportunities

324

01 Aug 2024

Big Cooperative Learning

Yulai Cong

AI4CE

197

31 Jul 2024

A Generic Review of Integrating Artificial Intelligence in Cognitive Behavioral Therapy

Meng Jiang

Qing Zhao

Jianqiang Li

Guanghui Fu

221

28 Jul 2024

Tracking linguistic information in transformer-based sentence embeddings through targeted sparsification

Vivi Nastase

Paola Merlo

193

25 Jul 2024

Fine-Tuning Large Language Models for Stock Return Prediction Using Newsflow

Tian Guo

E. Hauptmann

AIFin

213

25 Jul 2024

Large Language Models for Anomaly Detection in Computational Workflows: from Supervised Fine-Tuning to In-Context Learning

172

24 Jul 2024

Pre-Training and Prompting for Few-Shot Node Classification on Text-Attributed Graphs

Yuxiao Dong

221

22 Jul 2024

Token-Picker: Accelerating Attention in Text Generation with Minimized Memory Transfer via Probability Estimation

139

21 Jul 2024

Sharpness-diversity tradeoff: improving flat ensembles with SharpBalance

Yujun Yan

Huanrui Yang

Yaoqing Yang

201

17 Jul 2024

ARTEMIS: A Mixed Analog-Stochastic In-DRAM Accelerator for Transformer Neural Networks

190

17 Jul 2024

Evaluating Linguistic Capabilities of Multimodal LLMs in the Lens of Few-Shot Learning

254

17 Jul 2024

Sharif-STR at SemEval-2024 Task 1: Transformer as a Regression Model for Fine-Grained Scoring of Textual Semantic Relations

Seyedeh Fatemeh Ebrahimi

185

17 Jul 2024

InstructAV: Instruction Fine-tuning Large Language Models for Authorship Verification

174

16 Jul 2024

TCM-FTP: Fine-Tuning Large Language Models for Herbal Prescription Prediction

...

184

15 Jul 2024

Mixture-of-Modules: Reinventing Transformers as Dynamic Assemblies of Modules

Huishuai Zhang

Minlie Huang

Dongyan Zhao

Rui Yan

MoE

174

09 Jul 2024

Mobile Edge Intelligence for Large Language Models: A Contemporary Survey

Guanqiao Qu

Qiyuan Chen

Wei Wei

Zheng Lin

Xianhao Chen

Kaibin Huang

544

157

09 Jul 2024