v1v2v3 (latest)

Don't Stop Pretraining: Adapt Language Models to Domains and Tasks

23 April 2020

Kyle Lo

Papers citing "Don't Stop Pretraining: Adapt Language Models to Domains and Tasks"

50 / 1,369 papers shown

Harnessing Diversity for Important Data Selection in Pretraining Large Language ModelsInternational Conference on Learning Representations (ICLR), 2024

Chi Zhang

Huaping Zhong

Kuan Zhang

Chengliang Chai

Rui Wang

...

Lei Cao

Ju Fan

Ye Yuan

Guoren Wang

Conghui He

TDI

252

25 Sep 2024

Decoding Large-Language Models: A Systematic Overview of Socio-Technical Impacts, Constraints, and Emerging Questions

Zeyneb N. Kaya

Souvick Ghosh

129

25 Sep 2024

OSINT Clinic: Co-designing AI-Augmented Collaborative OSINT Investigations for Vulnerability AssessmentInternational Conference on Human Factors in Computing Systems (CHI), 2024

Anirban Mukhopadhyay

Kurt Luther

238

18 Sep 2024

MindGuard: Towards Accessible and Sitgma-free Mental Health First Aid via Edge LLM

Renqi Chen

244

16 Sep 2024

Gaps or Hallucinations? Gazing into Machine-Generated Legal Analysis for Fine-grained Text Evaluations

252

16 Sep 2024

Towards understanding evolution of science through language model series

409

15 Sep 2024

DomURLs_BERT: Pre-trained BERT-based Model for Malicious Domains and URLs Detection and Classification

Abdelkader El Mahdaouy

Salima Lamsiyah

Meryem Janati Idrissi

H. Alami

Zakaria Yartaoui

Ismail Berrada

142

13 Sep 2024

Self-Masking Networks for Unsupervised AdaptationGerman Conference on Pattern Recognition (DAGM), 2024

Alfonso Taboada Warmerdam

Mathilde Caron

Yuki M. Asano

305

11 Sep 2024

Synthetic continued pretrainingInternational Conference on Learning Representations (ICLR), 2024

355

11 Sep 2024

A Practice of Post-Training on Llama-3 70B with Optimal Selection of Additional Language Mixture RatioPacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD), 2024

191

10 Sep 2024

A Comparative Study of Pre-training and Self-training

323

04 Sep 2024

LUK: Empowering Log Understanding with Expert Knowledge from Large Language ModelsIEEE Transactions on Software Engineering (TSE), 2024

Yanghua Xiao

397

03 Sep 2024

Pre-Trained Language Models for Keyphrase Prediction: A ReviewICT express (IE), 2024

Muhammad Umair

Tangina Sultana

Young-Koo Lee

313

02 Sep 2024

From Prediction to Application: Language Model-based Code Knowledge Tracing with Domain Adaptive Pre-Training and Automatic Feedback System with Pedagogical Prompting for Comprehensive Programming Education

...

249

31 Aug 2024

Nexus: Specialization meets Adaptability for Efficiently Training Mixture of Experts

Sara Hooker

213

28 Aug 2024

Language Adaptation on a Tight Academic Compute Budget: Tokenizer Swapping Works and Pure bfloat16 Is Enough

Konstantin Dobler

Gerard de Melo

204

28 Aug 2024

Prior-free Balanced Replay: Uncertainty-guided Reservoir Sampling for Long-Tailed Continual LearningACM Multimedia (MM), 2024

Lei Liu

Li Liu

Yawen Cui

CLL

222

27 Aug 2024

CIPHER: Cybersecurity Intelligent Penetration-testing Helper for Ethical ResearcherItalian National Conference on Sensors (INS), 2024

Derry Pratama

Naufal Suryanto

Andro Aprila Adiputra

Thi-Thu-Huong Le

Ahmada Yusril Kadiptya

Muhammad Iqbal

Howon Kim

210

21 Aug 2024

Predicting Rewards Alongside Tokens: Non-disruptive Parameter Insertion for Efficient Inference Intervention in Large Language ModelConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Chenhan Yuan

Fei Huang

Ru Peng

Keming Lu

Bowen Yu

Chang Zhou

Jingren Zhou

KELM

217

20 Aug 2024

Summarizing long regulatory documents with a multi-step pipeline

180

19 Aug 2024

NoRA: Nested Low-Rank Adaptation for Efficient Fine-Tuning Large Models

Wei Xue

Yike Guo

AI4TS

265

18 Aug 2024

Diffusion Guided Language ModelingAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

294

08 Aug 2024

Automated Review Generation Method Based on Large Language ModelsNational Science Review (NSR), 2024

...

558

30 Jul 2024

Do LLMs Really Adapt to Domains? An Ontology Learning PerspectiveInternational Workshop on the Semantic Web (SW), 2024

Huu Tan Mai

Cuong Xuan Chu

Heiko Paulheim

173

29 Jul 2024

Knowledge Graph Structure as Prompt: Improving Small Language Models Capabilities for Knowledge-based Causal Discovery

Yuni Susanti

Michael Färber

224

26 Jul 2024

ChipExpert: The Open-Source Integrated-Circuit-Design-Specific Large Language Model

Lei Qi

...

125

26 Jul 2024

CMR Scaling Law: Predicting Critical Mixture Ratios for Continual Pre-training of Language Models

309

24 Jul 2024

A Novel Two-Step Fine-Tuning Pipeline for Cold-Start Active Learning in Text Classification Tasks

138

24 Jul 2024

Towards Aligning Language Models with Textual Feedback

374

24 Jul 2024

Structure-aware Domain Knowledge Injection for Large Language Models

Yue Wu

178

23 Jul 2024

Domain-Specific Pretraining of Language Models: A Comparative Study in the Medical Field

Tobias Kerner

ELM LM&MA

306

19 Jul 2024

ChipXplore: Natural Language Exploration of Hardware Designs and Libraries

Manar Abdelatty

Sherief Reda

257

17 Jul 2024

On Large Language Model Continual Unlearning

271

14 Jul 2024

The Sociolinguistic Foundations of Language Modeling

309

12 Jul 2024

Grounding and Evaluation for Large Language Models: Practical Challenges and Lessons Learned (Survey)

220

10 Jul 2024

Reuse, Don't Retrain: A Recipe for Continued Pretraining of Language Models

286

09 Jul 2024

CodeUpdateArena: Benchmarking Knowledge Editing on API Updates

405

08 Jul 2024

BadCLM: Backdoor Attack in Clinical Language Models for Electronic Health Records

Weimin Lyu

Zexin Bi

Fusheng Wang

Chao Chen

253

06 Jul 2024

Using LLMs to label medical papers according to the CIViC evidence model

Markus Hisch

Xing David Wang

196

05 Jul 2024

Multi-Task Domain Adaptation for Language Grounding with 3D Objects

Yaoxian Song

Zhixu Li

Xiaowen Chu

286

03 Jul 2024

Sociocultural Considerations in Monitoring Anti-LGBTQ+ Content on Social Media

Sidney G. -J. Wong

149

01 Jul 2024

M2QA: Multi-domain Multilingual Question Answering

Iryna Gurevych

254

01 Jul 2024

Locate&Edit: Energy-based Text Editing for Efficient, Flexible, and Faithful Controlled Text Generation

Hye Ryung Son

Jay-Yoon Lee

168

30 Jun 2024

KPC-cF: Aspect-Based Sentiment Analysis via Implicit-Feature Alignment with Corpus Filtering

Kibeom Nam

408

29 Jun 2024

SMLT-MUGC: Small, Medium, and Large Texts -- Machine versus User-Generated Content Detection and Comparison

189

28 Jun 2024

ProgressGym: Alignment with a Millennium of Moral Progress

Yaodong Yang

278

28 Jun 2024

CHEW: A Dataset of CHanging Events in Wikipedia

Hsuvas Borkakoty

Luis Espinosa-Anke

234

27 Jun 2024

MPCODER: Multi-user Personalized Code Generator with Explicit and Implicit Style Representation Learning

185

25 Jun 2024

Task Oriented In-Domain Data Augmentation

Yeyun Gong

194

24 Jun 2024

Evaluating the Effectiveness of the Foundational Models for Q&A Classification in Mental Health care

Hassan Alhuzali

Ashwag Alasmari

AI4MH

262

23 Jun 2024