v1v2v3 (latest)

Decoupled Weight Decay Regularization

14 November 2017

I. Loshchilov

Katharina Eggensperger

OffRL

ArXiv (abs)PDF HTML Github (275★)

Papers citing "Decoupled Weight Decay Regularization"

50 / 1,216 papers shown

FAMSeg: Fetal Femur and Cranial Ultrasound Segmentation Using Feature-Aware Attention and Mamba Enhancement

182

09 Jun 2025

Cultural Bias Matters: A Cross-Cultural Benchmark Dataset and Sentiment-Enriched Model for Understanding Multimodal MetaphorsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

207

08 Jun 2025

Debiasing Online Preference Learning via Preference Feature PreservationAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

210

06 Jun 2025

Unleashing the Potential of Consistency Learning for Detecting and Grounding Multi-Modal Media ManipulationComputer Vision and Pattern Recognition (CVPR), 2025

191

06 Jun 2025

When can in-context learning generalize out of task distribution?

Chase Goddard

Lindsay M. Smith

Vudtiwat Ngampruetikorn

David J. Schwab

OOD

157

05 Jun 2025

Vulnerability-Aware Alignment: Mitigating Uneven Forgetting in Harmful Fine-Tuning

314

04 Jun 2025

DS-VTON: An Enhanced Dual-Scale Coarse-to-Fine Framework for Virtual Try-On

235

01 Jun 2025

IVY-FAKE: A Unified Explainable Framework and Benchmark for Image and Video AIGC Detection

...

328

01 Jun 2025

FinBERT2: A Specialized Bidirectional Encoder for Bridging the Gap in Finance-Specific Deployment of Large Language Models

263

31 May 2025

MGS3: A Multi-Granularity Self-Supervised Code Search FrameworkKnowledge Discovery and Data Mining (KDD), 2025

178

30 May 2025

Taming Transformer Without Using Learning Rate WarmupInternational Conference on Learning Representations (ICLR), 2025

173

28 May 2025

Hierarchical Material Recognition from Local Appearance

Matthew Beveridge

Shree K. Nayar

345

28 May 2025

Suitability Filter: A Statistical Framework for Classifier Evaluation in Real-World Deployment Settings

198

28 May 2025

STACI: Spatio-Temporal Aleatoric Conformal Inference

197

27 May 2025

How Do Transformers Learn Variable Binding in Symbolic Programs?

174

27 May 2025

Frictional Agent Alignment Framework: Slow Down and Don't Break ThingsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

305

26 May 2025

Advancing Video Self-Supervised Learning via Image Foundation ModelsPattern Recognition Letters (Pattern Recogn. Lett.), 2025

Jingwei Wu

Zhewei Huang

Chang Liu

208

25 May 2025

Latent Mamba Operator for Partial Differential Equations

300

25 May 2025

What Do You Need for Diverse Trajectory Composition in Diffusion Planning?

Quentin Clark

Florian Shkurti

1.1K

23 May 2025

High-Fidelity Functional Ultrasound Reconstruction via A Visual Auto-Regressive Framework

203

23 May 2025

Generative Latent Coding for Ultra-Low Bitrate Image and Video Compression

525

22 May 2025

PaTH Attention: Position Encoding via Accumulating Householder Transformations

866

22 May 2025

DOVE: Efficient One-Step Diffusion Model for Real-World Video Super-Resolution

443

22 May 2025

CTRAP: Embedding Collapse Trap to Safeguard Large Language Models from Harmful Fine-Tuning

307

22 May 2025

Watch your steps: Dormant Adversarial Behaviors that Activate upon LLM Finetuning

480

22 May 2025

Conditional Panoramic Image Generation via Masked Autoregressive Modeling

320

22 May 2025

From Generic Empathy to Personalized Emotional Support: A Self-Evolution Framework for User Preference Alignment

247

22 May 2025

Bridge the Gap between Past and Future: Siamese Model Optimization for Context-Aware Document RankingInternational Conference on Information and Knowledge Management (CIKM), 2024

319

20 May 2025

Unify Graph Learning with Text: Unleashing LLM Potentials for Session SearchThe Web Conference (WWW), 2024

365

20 May 2025

Flexible-weighted Chamfer Distance: Enhanced Objective Function for Point Cloud Completion

448

20 May 2025

Krikri: Advancing Open Large Language Models for Greek

Dimitris Roussis

Leon Voukoutis

Georgios Paraskevopoulos

Sokratis Sofianopoulos

Prokopis Prokopidis

Vassilis Papavasileiou

Athanasios Katsamanis

Stelios Piperidis

Vassilis Katsouros

ALM

409

19 May 2025

A Multi-Task Benchmark for Abusive Language Detection in Low-Resource Settings

221

17 May 2025

X-Edit: Detecting and Localizing Edits in Images Altered by Text-Guided Diffusion Models

259

16 May 2025

LLM4CD: Leveraging Large Language Models for Open-World Knowledge Augmented Cognitive Diagnosis

176

14 May 2025

Contactless Cardiac Pulse Monitoring Using Event Cameras

Mohamed Moustafa

Joseph Lemley

Peter Corcoran

199

14 May 2025

ExEBench: Benchmarking Foundation Models on Extreme Earth Events

229

13 May 2025

Adaptive Latent-Space Constraints in Personalized Federated Learning

256

12 May 2025

MedEIR: A Specialized Medical Embedding Model for Enhanced Information Retrieval

Anand Selvadurai

Jasheen Shaik

Girish Chandrasekar

ShriRadhaKrishnan Balamurugan

Eswara Reddy

RALM

12 May 2025

Bi-directional Self-Registration for Misaligned Infrared-Visible Image Fusion

218

11 May 2025

Building-Guided Pseudo-Label Learning for Cross-Modal Building Damage Mapping

228

08 May 2025

Quiet Feature Learning in Algorithmic Tasks

337

06 May 2025

Variational diffusion transformers for conditional sampling of supernovae spectra

Yunyi Shen

Alexander T. Gagliano

DiffM

200

05 May 2025

MISE: Meta-knowledge Inheritance for Social Media-Based Stressor EstimationThe Web Conference (WWW), 2025

322

03 May 2025

GENMO: A GENeralist Model for Human MOtion

301

02 May 2025

Enhancing Health Mention Classification Performance: A Study on Advancements in Parameter Efficient Tuning

Reem Abdel-Salam

M. Adewunmi

299

30 Apr 2025

Grokking in the Wild: Data Augmentation for Real-World Multi-Hop Reasoning with Transformers

Roman Abramov

Felix Steinbauer

Gjergji Kasneci

896

29 Apr 2025

MERA: Multimodal and Multiscale Self-Explanatory Model with Considerably Reduced Annotation for Lung Nodule Diagnosis

274

27 Apr 2025

PCF-Grasp: Converting Point Completion to Geometry Feature to Enhance 6-DoF Grasp

306

22 Apr 2025

HFBRI-MAE: Handcrafted Feature Based Rotation-Invariant Masked Autoencoder for 3D Point Cloud Analysis

235

19 Apr 2025

CheXWorld: Exploring Image World Modeling for Radiograph Representation LearningComputer Vision and Pattern Recognition (CVPR), 2025

325

18 Apr 2025