v1v2 (latest)

XLNet: Generalized Autoregressive Pretraining for Language Understanding

Neural Information Processing Systems (NeurIPS), 2019

19 June 2019

Papers citing "XLNet: Generalized Autoregressive Pretraining for Language Understanding"

50 / 3,732 papers shown

DEHYDRATOR: Enhancing Provenance Graph Storage via Hierarchical Encoding and Sequence GenerationIEEE Transactions on Information Forensics and Security (IEEE TIFS), 2024

158

03 Jan 2025

Efficient support ticket resolution using Knowledge Graphs

Sherwin Varghese

James Tian

03 Jan 2025

TED: Turn Emphasis with Dialogue Feature Attention for Emotion Recognition in Conversation

Junya Ono

Hiromi Wakaki

290

03 Jan 2025

A Comprehensive Survey of Large Language Models and Multimodal Large Language Models in MedicineInformation Fusion (Inf. Fusion), 2024

458

31 Dec 2024

Context-Aware Deep Learning for Multi Modal Depression DetectionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2019

Genevieve Lam

Huang Dongyan

Weisi Lin

302

26 Dec 2024

Invisible Textual Backdoor Attacks based on Dual-Trigger

351

23 Dec 2024

ImagePiece: Content-aware Re-tokenization for Efficient Image RecognitionAAAI Conference on Artificial Intelligence (AAAI), 2024

219

21 Dec 2024

Automated CVE Analysis: Harnessing Machine Learning In Designing Question-Answering Models For Cybersecurity Information Extraction

Tanjim Bin Faruk

133

21 Dec 2024

Unlocking LLMs: Addressing Scarce Data and Bias Challenges in Mental Health

Vivek Kumar

Eirini Ntoutsi

Pushpraj Singh Rajawat

Giacomo Medda

Diego Reforgiato Recupero

AI4MH

270

17 Dec 2024

Multi-Head Encoding for Extreme Label ClassificationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

273

13 Dec 2024

TECO: Improving Multimodal Intent Recognition with Text Enhancement through Commonsense Knowledge ExtractionPacific Asia Conference on Language, Information and Computation (PACLIC), 2024

Quynh-Mai Thi Nguyen

Lan-Nhi Thi Nguyen

Cam-Van Thi Nguyen

231

11 Dec 2024

Comateformer: Combined Attention Transformer for Semantic Sentence MatchingEuropean Conference on Artificial Intelligence (ECAI), 2024

Bo Li

Di Liang

Zixin Zhang

265

10 Dec 2024

A Review of Human Emotion Synthesis Based on Generative Technology

...

297

10 Dec 2024

Investigating Acoustic-Textual Emotional Inconsistency Information for Automatic Depression Detection

204

09 Dec 2024

Impromptu Cybercrime Euphemism DetectionInternational Conference on Computational Linguistics (COLING), 2024

350

02 Dec 2024

CPRM: A LLM-based Continual Pre-training Framework for Relevance Modeling in Commercial SearchNorth American Chapter of the Association for Computational Linguistics (NAACL), 2024

...

638

02 Dec 2024

RandAR: Decoder-only Autoregressive Visual Generation in Random OrdersComputer Vision and Pattern Recognition (CVPR), 2024

397

02 Dec 2024

Generative Language Models Potential for Requirement Engineering Applications: Insights into Current Strengths and Limitations

285

01 Dec 2024

Can bidirectional encoder become the ultimate winner for downstream applications of foundation models?

300

27 Nov 2024

What Differentiates Educational Literature? A Multimodal Fusion Approach of Transformers and Computational Linguistics

Jordan J. Bird

412

26 Nov 2024

MolMetaLM: a Physicochemical Knowledge-Guided Molecular Meta Language Model

372

23 Nov 2024

Forecasting Future International Events: A Reliable Dataset for Text-Based Event ModelingConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

260

21 Nov 2024

LEADRE: Multi-Faceted Knowledge Enhanced LLM Empowered Display Advertisement Recommender SystemProceedings of the VLDB Endowment (PVLDB), 2024

...

267

21 Nov 2024

Hysteresis Activation Function for Efficient Inference

471

15 Nov 2024

Unstructured Text Enhanced Open-domain Dialogue System: A Systematic Survey

354

14 Nov 2024

Multi-head Span-based Detector for AI-generated Fragments in Scientific Papers

269

11 Nov 2024

A Retrospective on the Robot Air Hockey Challenge: Benchmarking Robust, Reliable, and Safe Learning Techniques for Real-world RoboticsNeural Information Processing Systems (NeurIPS), 2024

...

193

08 Nov 2024

TrajGPT: Controlled Synthetic Trajectory Generation Using a Multitask Transformer-Based Spatiotemporal Model

Khurram Hassan-Shafique

197

07 Nov 2024

Performance-Guided LLM Knowledge Distillation for Efficient Text Classification at ScaleConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Flavio Di Palo

Prateek Singhi

Bilal Fadlallah

135

07 Nov 2024

Pseudo-labeling with Keyword Refining for Few-Supervised Video CaptioningPattern Recognition (Pattern Recogn.), 2024

215

06 Nov 2024

A Library Perspective on Supervised Text Processing in Digital Libraries: An Investigation in the Biomedical DomainACM/IEEE Joint Conference on Digital Libraries (JCDL), 2024

221

06 Nov 2024

Trustworthy Federated Learning: Privacy, Security, and BeyondKnowledge and Information Systems (KAIS), 2024

294

03 Nov 2024

Randomized Autoregressive Visual Generation

Ju He

329

01 Nov 2024

GigaCheck: Detecting LLM-generated Content

312

31 Oct 2024

Bonafide at LegalLens 2024 Shared Task: Using Lightweight DeBERTa Based Encoder For Legal Violation Detection and Resolution

Shikha Bordia

AILaw

168

30 Oct 2024

DeTeCtive: Detecting AI-generated Text via Multi-Level Contrastive LearningNeural Information Processing Systems (NeurIPS), 2024

317

28 Oct 2024

Beyond Autoregression: Fast LLMs via Self-Distillation Through TimeInternational Conference on Learning Representations (ICLR), 2024

Justin Deschenaux

Çağlar Gülçehre

497

28 Oct 2024

Uncovering Capabilities of Model Pruning in Graph Contrastive LearningACM Multimedia (MM), 2024

Wu Junran

Chen Xueyuan

Li Shangzhe

260

27 Oct 2024

Building Dialogue Understanding Models for Low-resource Language Indonesian from Scratch

303

24 Oct 2024

Deep Insights into Cognitive Decline: A Survey of Leveraging Non-Intrusive Modalities with Deep Learning TechniquesApplied Soft Computing (Appl. Soft Comput.), 2024

David Ortiz-Perez

Manuel Benavent-Lledo

José García Rodríguez

David Tomás

M. Flores Vizcaya-Moreno

242

24 Oct 2024

Dependency Graph Parsing as Sequence LabelingConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Ana Ezquerro

David Vilares

Carlos Gómez-Rodríguez

170

23 Oct 2024

Future Token Prediction -- Causal Language Modelling with Per-Token Semantic State Vector for Multi-Token Prediction

Nicholas Walker

161

23 Oct 2024

BadFair: Backdoored Fairness Attacks with Group-conditioned TriggersConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Jiaqi Xue

Qian Lou

Mengxin Zheng

217

23 Oct 2024

Multi-head Sequence Tagging Model for Grammatical Error CorrectionEngineering applications of artificial intelligence (EAAI), 2024

181

21 Oct 2024

Evaluation Of P300 Speller Performance Using Large Language Models Along With Cross-Subject Training

19 Oct 2024

Controllable Discovery of Intents: Incremental Deep Clustering Using Semi-Supervised Contrastive LearningInternational Joint Conference on Natural Language Processing (IJCNLP), 2024

Mrinal Rawat

Hithesh Sankararaman

Victor Barrès

303

18 Oct 2024

Rationale Behind Essay Scores: Enhancing S-LLM's Multi-Trait Essay Scoring with Rationale Generated by LLMsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2024

471

18 Oct 2024

On the Regularization of Learnable Embeddings for Time Series Forecasting

368

18 Oct 2024

Beyond Autoregression: Discrete Diffusion for Complex Reasoning and PlanningInternational Conference on Learning Representations (ICLR), 2024

644

18 Oct 2024

Fine-Tuning Language Models on Multiple Datasets for Citation Intention ClassificationConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

128

17 Oct 2024