Investigating Task Arithmetic for Zero-Shot Information RetrievalAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025

Marco Braga

Pranav Kasela

Alessandro Raganato

G. Pasi

RALM

387

01 May 2025

Small or Large? Zero-Shot or Finetuned? Guiding Language Model Choice for Specialized Applications in HealthcareMachine Learning and Knowledge Extraction (MLKE), 2025

166

29 Apr 2025

Llama-3.1-FoundationAI-SecurityLLM-Base-8B Technical Report

...

290

28 Apr 2025

Efficient Domain-adaptive Continual Pretraining for the Process Industry in the German LanguageInternational Conference on Text, Speech and Dialogue (TSD), 2025

433

28 Apr 2025

Stabilizing Reasoning in Medical LLMs with Continued Pretraining and Reasoning Preference Optimization

336

25 Apr 2025

TRACE Back from the Future: A Probabilistic Reasoning Approach to Controllable Language Generation

890

25 Apr 2025

Optimizing LLMs for Italian: Reducing Token Fertility and Enhancing Efficiency Through Vocabulary AdaptationNorth American Chapter of the Association for Computational Linguistics (NAACL), 2025

Luca Moroni

Giovanni Puccetti

Pere-Lluís Huguet Cabot

288

23 Apr 2025

T-VEC: A Telecom-Specific Vectorization Model with Enhanced Semantic Understanding via Deep Triplet Loss Fine-Tuning

239

23 Apr 2025

Knowledge Distillation and Dataset Distillation of Large Language Models: Emerging Trends, Challenges, and Future Directions

...

Tianming Liu

Ping Ma

ALM

284

20 Apr 2025

Probing the Subtle Ideological Manipulation of Large Language Models

Demetris Paschalides

G. Pallis

M. Dikaiakos

191

19 Apr 2025

Continual Pre-Training is (not) What You Need in Domain Adaption

...

315

18 Apr 2025

Memorization vs. Reasoning: Updating LLMs with New KnowledgeAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

Aochong Oliver Li

Tanya Goyal

KELM

351

16 Apr 2025

CSPLADE: Learned Sparse Retrieval with Causal Language Models

445

15 Apr 2025

Enhancing Dialogue Systems with Discourse-Level Understanding Using Deep Canonical Correlation Analysis

Akanksha Mehndiratta

Krishna Asawa

12 Apr 2025

Exploring Gradient-Guided Masked Language Model to Detect Textual Adversarial Attacks

240

08 Apr 2025

Mapping biodiversity at very-high resolution in Europe

166

07 Apr 2025

GraphSeg: Segmented 3D Representations via Graph Edge Addition and Contraction

Haozhan Tang

Tianyi Zhang

Oliver Kroemer

Matthew Johnson-Roberson

Weiming Zhi

3DPC

253

04 Apr 2025

On the Connection Between Diffusion Models and Molecular Dynamics

Liam Harcombe

Timothy T. Duignan

DiffM

329

04 Apr 2025

TiC-LM: A Web-Scale Benchmark for Time-Continual LLM PretrainingAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

Jeffrey Li

Mohammadreza Armandpour

...

435

02 Apr 2025

Context-Aware Toxicity Detection in Multiplayer Games: Integrating Domain-Adaptive Pretraining and Match Metadata

200

02 Apr 2025

Beyond Vanilla Fine-Tuning: Leveraging Multistage, Multilingual, and Domain-Specific Methods for Low-Resource Machine Translation

282

28 Mar 2025

Penrose Tiled Low-Rank Compression and Section-Wise Q&A Fine-Tuning: A General Framework for Domain-Specific Large Language Model Adaptation

205

28 Mar 2025