RoBERTa: A Robustly Optimized BERT Pretraining Approach

26 July 2019

Luke Zettlemoyer

Papers citing "RoBERTa: A Robustly Optimized BERT Pretraining Approach"

50 / 2,766 papers shown

Title
Towards Explainable Multimodal Depression Recognition for Clinical Interviews Wenjie Zheng Qiming Xie Zengzhi Wang Jianfei Yu Rui Xia 60 0 0 28 Jan 2025
Merino: Entropy-driven Design for Generative Language Models on IoT Devices Youpeng Zhao Ming Lin Huadong Tang Qiang Wu Jun Wang 75 0 0 28 Jan 2025
Uncovering Latent Arguments in Social Media Messaging by Employing LLMs-in-the-Loop Strategy Tunazzina Islam Dan Goldwasser 79 2 0 28 Jan 2025
A Survey of Large Language Models for Healthcare: from Data, Technology, and Applications to Accountability and Ethics Kai He Rui Mao Qika Lin Yucheng Ruan Xiang Lan Mengling Feng Erik Cambria LM&MA AILaw 93 151 0 28 Jan 2025
DepressionX: Knowledge Infused Residual Attention for Explainable Depression Severity Assessment Yusif Ibrahimov Tarique Anwar Tommy Yuan 44 0 0 28 Jan 2025
Concept-Guided Chain-of-Thought Prompting for Pairwise Comparison Scoring of Texts with Large Language Models Patrick Y. Wu Jonathan Nagler Joshua A. Tucker Solomon Messing LRM 49 2 0 28 Jan 2025
BLoB: Bayesian Low-Rank Adaptation by Backpropagation for Large Language Models Yibin Wang H. Shi Ligong Han Dimitris N. Metaxas Hao Wang BDL UQLM 102 6 0 28 Jan 2025
Tutor CoPilot: A Human-AI Approach for Scaling Real-Time Expertise Rose E. Wang Ana T. Ribeiro Carly Robinson Susanna Loeb Dora Demszky 60 11 0 28 Jan 2025
Survey: Understand the challenges of MachineLearning Experts using Named EntityRecognition Tools Florian Freund Philippe Tamla Matthias Hemmje 33 1 0 27 Jan 2025
Faster Configuration Performance Bug Testing with Neural Dual-level Prioritization Youpeng Ma Tao Chen Ke Li 82 0 0 26 Jan 2025
Decentralized Low-Rank Fine-Tuning of Large Language Models Sajjad Ghiasvand Mahnoosh Alizadeh Ramtin Pedarsani ALM 64 0 0 26 Jan 2025
A Transformer-based Autoregressive Decoder Architecture for Hierarchical Text Classification Younes Yousef Lukas Galke A. Scherp 44 0 0 23 Jan 2025
Unified CNNs and transformers underlying learning mechanism reveals multi-head attention modus vivendi Ella Koresh Ronit D. Gross Yuval Meir Yarden Tzach Tal Halevi Ido Kanter ViT 43 0 0 22 Jan 2025
EDoRA: Efficient Weight-Decomposed Low-Rank Adaptation via Singular Value Decomposition Hamid Nasiri Peter Garraghan 36 1 0 21 Jan 2025
Revisiting Language Models in Neural News Recommender Systems Yuyue Zhao Jin Huang David Vos Maarten de Rijke KELM 65 0 0 20 Jan 2025
Keeping LLMs Aligned After Fine-tuning: The Crucial Role of Prompt Templates Kaifeng Lyu Haoyu Zhao Xinran Gu Dingli Yu Anirudh Goyal Sanjeev Arora ALM 75 44 0 20 Jan 2025
Can AI-Generated Text be Reliably Detected? Vinu Sankar Sadasivan Aounon Kumar S. Balasubramanian Wenxiao Wang S. Feizi DeLMO 54 359 0 20 Jan 2025
AIMA at SemEval-2024 Task 3: Simple Yet Powerful Emotion Cause Pair Analysis Alireza Ghahramani Kure Mahshid Dehghani Mohammad Mahdi Abootorabi Nona Ghazizadeh Seyed Arshan Dalili Ehsaneddin Asgari 41 1 0 19 Jan 2025
AIMA at SemEval-2024 Task 10: History-Based Emotion Recognition in Hindi-English Code-Mixed Conversations Mohammad Mahdi Abootorabi Nona Ghazizadeh Seyed Arshan Dalili Alireza Ghahramani Kure Mahshid Dehghani Ehsaneddin Asgari 37 2 0 19 Jan 2025
AudioBERT: Audio Knowledge Augmented Language Model Hyunjong Ok Suho Yoo Jaeho Lee AuLLM RALM VLM 42 0 0 17 Jan 2025
ReFactor GNNs: Revisiting Factorisation-based Models from a Message-Passing Perspective Yihong Chen Pushkar Mishra Luca Franceschi Pasquale Minervini Pontus Stenetorp Sebastian Riedel 59 20 0 17 Jan 2025
A Comprehensive Survey of Foundation Models in Medicine Wasif Khan Seowung Leem Kyle B. See Joshua K. Wong Shaoting Zhang R. Fang AI4CE LM&MA VLM 97 17 0 17 Jan 2025
AugRefer: Advancing 3D Visual Grounding via Cross-Modal Augmentation and Spatial Relation-based Referring Xinyi Wang Na Zhao Zhiyuan Han D. Guo Xun Yang 46 1 0 17 Jan 2025
Foundation Models at Work: Fine-Tuning for Fairness in Algorithmic Hiring Buse Sibel Korkmaz Rahul Nair Elizabeth M. Daly Evangelos Anagnostopoulos Christos Varytimidis Antonio del Rio Chanona 40 0 0 13 Jan 2025
Event Argument Extraction with Enriched Prompts Chen Liang 36 0 0 12 Jan 2025
Correcting Annotator Bias in Training Data: Population-Aligned Instance Replication (PAIR) Stephanie Eckman Bolei Ma Christoph Kern Rob Chew Barbara Plank Frauke Kreuter 41 0 0 12 Jan 2025
Aggregating Low Rank Adapters in Federated Fine-tuning Evelyn Trautmann Ian Hales Martin F. Volk AI4CE FedML 39 0 0 10 Jan 2025
CognoSpeak: an automatic, remote assessment of early cognitive decline in real-world conversational speech Madhurananda Pahar Fuxiang Tao B. Mirheidari Nathan Pevy Rebecca Bright ... Lise Sproson Dorota Braun Caitlin Illingworth D. Blackburn H. Christensen 33 0 0 10 Jan 2025
Multi-Task Model Merging via Adaptive Weight Disentanglement Feng Xiong Runxi Cheng Wang Chen Zhanqiu Zhang Yiwen Guo Chun Yuan Ruifeng Xu MoMe 92 4 0 10 Jan 2025
IntegrityAI at GenAI Detection Task 2: Detecting Machine-Generated Academic Essays in English and Arabic Using ELECTRA and Stylometry Mohammad AL-Smadi 33 0 0 07 Jan 2025
Leveraging Large Language Models and Machine Learning for Smart Contract Vulnerability Detection S M Mostaq Hossain Amani Altarawneh Jesse Roberts 28 0 0 04 Jan 2025
Efficient support ticket resolution using Knowledge Graphs Sherwin Varghese James Tian 25 0 0 03 Jan 2025
Evaluating Concurrent Robustness of Language Models Across Diverse Challenge Sets Vatsal Gupta Pranshu Pandya Tushar Kataria Vivek Gupta Dan Roth AAML 53 1 0 03 Jan 2025
Mathematical Language Models: A Survey W. Liu Hanglei Hu Jie Zhou Yuyang Ding Junsong Li ... Mengliang He Qin Chen Bo Jiang Aimin Zhou Liang He LRM 79 12 0 03 Jan 2025
Toward Corpus Size Requirements for Training and Evaluating Depression Risk Models Using Spoken Language Tomek Rutowski Amir Harati Elizabeth Shriberg Yang Lu Piotr Chlebek Ricardo Oliveira 32 7 0 03 Jan 2025
U-GIFT: Uncertainty-Guided Firewall for Toxic Speech in Few-Shot Scenario Jiaxin Song Xinyu Wang Yihao Wang Yifan Tang Ru Zhang Jianyi Liu Gongshen Liu AAML 32 0 0 03 Jan 2025
Proof Recommendation System for the HOL4 Theorem Prover Nour Dekhil Adnan Rashid Sofiene Tahar 43 1 0 31 Dec 2024
Disentangling Preference Representation and Text Generation for Efficient Individual Preference Alignment Jianfei Zhang Jun Bai B. Li Yanmeng Wang Rumei Li Chenghua Lin Wenge Rong 41 0 0 31 Dec 2024
Out-of-distribution generalization via composition: a lens through induction heads in Transformers Jiajun Song Zhuoyan Xu Yiqiao Zhong 80 4 0 31 Dec 2024
Deep Neural Networks and Brain Alignment: Brain Encoding and Decoding (Survey) S. Oota Zijiao Chen Manish Gupta R. Bapi G. Jobard F. Alexandre X. Hinaut 3DV AI4CE 44 11 0 31 Dec 2024
Unleashing the Power of Data Tsunami: A Comprehensive Survey on Data Assessment and Selection for Instruction Tuning of Language Models Yulei Qin Yuncheng Yang Pengcheng Guo Gang Li Hang Shao Yuchen Shi Zihan Xu Yun Gu Ke Li Xing Sun ALM 88 11 0 31 Dec 2024
AdaRankGrad: Adaptive Gradient-Rank and Moments for Memory-Efficient LLMs Training and Fine-Tuning Yehonathan Refael Jonathan Svirsky Boris Shustin Wasim Huleihel Ofir Lindenbaum 34 3 0 31 Dec 2024
CodeIP: A Grammar-Guided Multi-Bit Watermark for Large Language Models of Code Batu Guan Yao Wan Zhangqian Bi Zheng Wang Hongyu Zhang Yulei Sui Pan Zhou 32 7 0 31 Dec 2024
Adaptive Batch Size Schedules for Distributed Training of Language Models with Data and Model Parallelism Tim Tsz-Kit Lau Weijian Li Chenwei Xu Han Liu Mladen Kolar 103 0 0 30 Dec 2024
ELECTRA and GPT-4o: Cost-Effective Partners for Sentiment Analysis James P. Beno VLM 28 0 0 29 Dec 2024
LLM Reasoning Engine: Specialized Training for Enhanced Mathematical Reasoning Shuguang Chen Guang Lin LRM 82 0 0 28 Dec 2024
WarriorCoder: Learning from Expert Battles to Augment Code Large Language Models Huawen Feng Pu Zhao Qingfeng Sun Can Xu Fangkai Yang ... Qianli Ma Qingwei Lin Saravan Rajmohan Dongmei Zhang Qi Zhang AAML ALM 62 0 0 23 Dec 2024
Grams: Gradient Descent with Adaptive Momentum Scaling Yang Cao Xiaoyu Li Zhao-quan Song ODL 83 2 0 22 Dec 2024
VaeDiff-DocRE: End-to-end Data Augmentation Framework for Document-level Relation Extraction Khai Phan Tran Wen Hua Xue Li SyDa 85 0 0 18 Dec 2024
Nullu: Mitigating Object Hallucinations in Large Vision-Language Models via HalluSpace Projection Le Yang Ziwei Zheng Boxu Chen Zhengyu Zhao Chenhao Lin Chao Shen VLM 138 3 0 18 Dec 2024