v1v2v3 (latest)

Don't Stop Pretraining: Adapt Language Models to Domains and Tasks

23 April 2020

Kyle Lo

Papers citing "Don't Stop Pretraining: Adapt Language Models to Domains and Tasks"

50 / 1,369 papers shown

Learning the Wrong Lessons: Syntactic-Domain Spurious Correlations in Language Models

172

25 Sep 2025

Policy Compatible Skill Incremental Learning via Lazy Learning Interface

274

24 Sep 2025

Embedding Domain Knowledge for Large Language Models via Reinforcement Learning from Augmented Generation

166

24 Sep 2025

Detoxifying Large Language Models via Autoregressive Reward Guided Representation Editing

152

24 Sep 2025

Memory in Large Language Models: Mechanisms, Evaluation and Evolution

209

23 Sep 2025

Visual Instruction Pretraining for Domain-Specific Foundation Models

289

22 Sep 2025

PG-CE: A Progressive Generation Dataset with Constraint Enhancement for Controllable Text Generation

Yan Zhuang

Yuan Sun

22 Sep 2025

Rethinking the Role of Text Complexity in Language Model Pretraining

Dan John Velasco

M. R

212

20 Sep 2025

Domain-Adaptive Pre-Training for Arabic Aspect-Based Sentiment Analysis: A Comparative Study of Domain Adaptation and Fine-Tuning Strategies

Salha Alyami

A. Jamal

Areej M. Alhothali

109

20 Sep 2025

Optimizing Product Deduplication in E-Commerce with Multimodal Embeddings

156

19 Sep 2025

RoadMind: Towards a Geospatial AI Expert for Disaster Response

18 Sep 2025

Deep learning and abstractive summarisation for radiological reports: an empirical study for adapting the PEGASUS models' family with scarce data

107

18 Sep 2025

Boosting Data Utilization for Multilingual Dense Retrieval

140

11 Sep 2025

Towards EnergyGPT: A Large Language Model Specialized for the Energy Sector

Amal Chebbi

Babajide Kolade

116

08 Sep 2025

Augmented Fine-Tuned LLMs for Enhanced Recruitment Automation

07 Sep 2025

Hierarchical Section Matching Prediction (HSMP) BERT for Fine-Grained Extraction of Structured Data from Hebrew Free-Text Radiology Reports in Crohn's Disease

03 Sep 2025

Linear-Time Demonstration Selection for In-Context Learning via Gradient Estimation

134

27 Aug 2025

Active Domain Knowledge Acquisition with 100-Dollar Budget: Enhancing LLMs via Cost-Efficient, Expert-Involved Interaction in Sensitive Domains

154

24 Aug 2025

ChatGPT-generated texts show authorship traits that identify them as non-human

144

22 Aug 2025

Legal

Δ

: Enhancing Legal Reasoning in LLMs via Reinforcement Learning with Chain-of-Thought Guided Information Gain

188

17 Aug 2025

When Does Language Transfer Help? Sequential Fine-Tuning for Cross-Lingual Euphemism Detection

15 Aug 2025

ALAS: Autonomous Learning Agent for Self-Updating Language Models

Dhruv Atreja

KELM

14 Aug 2025

AnalogSeeker: An Open-source Foundation Language Model for Analog Circuit Design

...

128

14 Aug 2025

Memory Decoder: A Pretrained, Plug-and-Play Memory for Large Language Models

174

13 Aug 2025

Effortless Vision-Language Model Specialization in Histopathology without Annotation

109

11 Aug 2025

Sensitivity of Stability: Theoretical & Empirical Analysis of Replicability for Adaptive Data Selection in Transfer Learning

Prabhav Singh

Jessica Sorrell

132

06 Aug 2025

Multidimensional classification of posts for online course discussion forum curation

Antonio Leandro Martins Candido

Jose Everardo Bessa Maia

05 Aug 2025

LLM-based IR-system for Bank SupervisorsKnowledge-Based Systems (KBS), 2024

Ilias Aarab

117

04 Aug 2025

OpenMed NER: Open-Source, Domain-Adapted State-of-the-Art Transformers for Biomedical NER Across 12 Public Datasets

Maziyar Panahi

MedIm VLM AI4CE

143

03 Aug 2025

Measuring Time-Series Dataset Similarity using Wasserstein Distance

112

29 Jul 2025

Improving Community Detection in Academic Networks by Handling Publication Bias

Md Asaduzzaman Noor

John Sheppard

Jason Clark

28 Jul 2025

AI-Driven Generation of Old English: A Framework for Low-Resource Languages

Rodrigo Gabriel Salazar Alva

Matías Nuñez

Cristian López

Javier Martín Arista

108

27 Jul 2025

AQuilt: Weaving Logic and Self-Inspection into Low-Cost, High-Relevance Data Synthesis for Specialist LLMs

227

24 Jul 2025

CCL-XCoT: An Efficient Cross-Lingual Knowledge Transfer Method for Mitigating Hallucination Generation

111

17 Jul 2025

Simplifying Traffic Anomaly Detection with Video Foundation Models

121

12 Jul 2025

ixi-GEN: Efficient Industrial sLLMs through Domain Adaptive Continual Pretraining

246

09 Jul 2025

Domain adaptation of large language models for geotechnical applications

241

08 Jul 2025

Collaborative Editable Model

189

17 Jun 2025

Just Go Parallel: Improving the Multilingual Capabilities of Large Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

251

16 Jun 2025

SoK: The Privacy Paradox of Large Language Models: Advancements, Privacy Risks, and MitigationACM Asia Conference on Computer and Communications Security (AsiaCCS), 2025

Yashothara Shanmugarasa

Ming Ding

M. Chamikara

Thierry Rakotoarivelo

PILM AILaw

431

15 Jun 2025

GeistBERT: Breathing Life into German NLP

Raphael Scheible-Schmitt

Johann Frei

VLM

383

13 Jun 2025

Curriculum-Guided Layer Scaling for Language Model Pretraining

231

13 Jun 2025

Self-Adapting Language Models

604

12 Jun 2025

Spelling-out is not Straightforward: LLMs' Capability of Tokenization from Token to Characters

Tatsuya Hiraoka

Kentaro Inui

264

12 Jun 2025

Low-resource domain adaptation while minimizing energy and hardware resource consumption

Hernán Maina

Nicolás Wolovick

Luciana Benotti

161

10 Jun 2025

PropMEND: Hypernetworks for Knowledge Propagation in LLMs

148

10 Jun 2025

ZeroVO: Visual Odometry with Minimal AssumptionsComputer Vision and Pattern Recognition (CVPR), 2025

222

09 Jun 2025

Through the Valley: Path to Effective Long CoT Training for Small Language Models

233

09 Jun 2025

Plug-in and Fine-tuning: Bridging the Gap between Small Language Models and Large Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

224

09 Jun 2025

Dynamic and Parametric Retrieval-Augmented GenerationAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025

149

07 Jun 2025