Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
1711.05101
Cited By

Decoupled Weight Decay Regularization

v1v2v3 (latest)

Decoupled Weight Decay Regularization

14 November 2017

Katharina Eggensperger

ArXiv (abs)PDF HTML Github (275★)

Papers citing "Decoupled Weight Decay Regularization"

50 / 1,216 papers shown

MoAngelo: Motion-Aware Neural Surface Reconstruction for Dynamic Scenes

MoAngelo: Motion-Aware Neural Surface Reconstruction for Dynamic Scenes

99

0

0

19 Sep 2025

Positional Encoding via Token-Aware Phase Attention

Positional Encoding via Token-Aware Phase Attention

191

0

0

16 Sep 2025

Towards Foundational Models for Single-Chip Radar

Towards Foundational Models for Single-Chip Radar

Akarsh Prabhakara

Matthew O'Toole

Anthony G. Rowe

191

1

0

15 Sep 2025

Weakly Supervised Vulnerability Localization via Multiple Instance Learning

Weakly Supervised Vulnerability Localization via Multiple Instance LearningACM Transactions on Software Engineering and Methodology (TOSEM), 2025

138

0

0

14 Sep 2025

Semantic Causality-Aware Vision-Based 3D Occupancy Prediction

Semantic Causality-Aware Vision-Based 3D Occupancy Prediction

124

3

0

10 Sep 2025

Collaborate, Deliberate, Evaluate: How LLM Alignment Affects Coordinated Multi-Agent Outcomes

Collaborate, Deliberate, Evaluate: How LLM Alignment Affects Coordinated Multi-Agent Outcomes

Nikhil Krishnaswamy

161

3

0

07 Sep 2025

Empowering Large Language Model for Sequential Recommendation via Multimodal Embeddings and Semantic IDs

Empowering Large Language Model for Sequential Recommendation via Multimodal Embeddings and Semantic IDs

162

2

0

02 Sep 2025

Succeed or Learn Slowly: Sample Efficient Off-Policy Reinforcement Learning for Mobile App Control

Succeed or Learn Slowly: Sample Efficient Off-Policy Reinforcement Learning for Mobile App Control

Georgios Papoudakis

277

0

0

01 Sep 2025

Mamba-CNN: A Hybrid Architecture for Efficient and Accurate Facial Beauty Prediction

Mamba-CNN: A Hybrid Architecture for Efficient and Accurate Facial Beauty Prediction

Djamel Eddine Boukhari

141

5

0

01 Sep 2025

Clustering-based Feature Representation Learning for Oracle Bone Inscriptions Detection

Clustering-based Feature Representation Learning for Oracle Bone Inscriptions Detection

81

3

0

26 Aug 2025

RoofSeg: An edge-aware transformer-based network for end-to-end roof plane segmentation

RoofSeg: An edge-aware transformer-based network for end-to-end roof plane segmentation

120

0

0

26 Aug 2025

UniSino: Physics-Driven Foundational Model for Universal CT Sinogram Standardization

UniSino: Physics-Driven Foundational Model for Universal CT Sinogram Standardization

97

0

0

25 Aug 2025

DeltaFlow: An Efficient Multi-frame Scene Flow Estimation Method

DeltaFlow: An Efficient Multi-frame Scene Flow Estimation Method

Patric Jensfelt

259

0

0

23 Aug 2025

CLAIRE-DSA: Fluoroscopic Image Classification for Quality Assurance of Computer Vision Pipelines in Acute Ischemic Stroke

CLAIRE-DSA: Fluoroscopic Image Classification for Quality Assurance of Computer Vision Pipelines in Acute Ischemic Stroke

Cristo J. van den Berg

Frank G. te Nijenhuis

Mirre J. Blaauboer

Daan T. W. van Erp

Carlijn M. Keppels

...

Sandra A. P. Cornelissen

50

0

0

18 Aug 2025

OVG-HQ: Online Video Grounding with Hybrid-modal Queries

OVG-HQ: Online Video Grounding with Hybrid-modal Queries

161

0

0

16 Aug 2025

CPO: Addressing Reward Ambiguity in Role-playing Dialogue via Comparative Policy Optimization

CPO: Addressing Reward Ambiguity in Role-playing Dialogue via Comparative Policy Optimization

147

4

0

12 Aug 2025

FetFIDS: A Feature Embedding Attention based Federated Network Intrusion Detection Algorithm

FetFIDS: A Feature Embedding Attention based Federated Network Intrusion Detection Algorithm

Abu Shafin Mohammad Mahdee Jameel

28

0

0

12 Aug 2025

Gradient Surgery for Safe LLM Fine-Tuning

Gradient Surgery for Safe LLM Fine-Tuning

Tiansheng Huang

122

2

0

10 Aug 2025

MobileViCLIP: An Efficient Video-Text Model for Mobile Devices

MobileViCLIP: An Efficient Video-Text Model for Mobile Devices

197

0

0

10 Aug 2025

AdvDINO: Domain-Adversarial Self-Supervised Representation Learning for Spatial Proteomics

AdvDINO: Domain-Adversarial Self-Supervised Representation Learning for Spatial Proteomics

66

2

0

07 Aug 2025

Learning to See and Act: Task-Aware Virtual View Exploration for Robotic Manipulation

Learning to See and Act: Task-Aware Virtual View Exploration for Robotic Manipulation

...

300

1

0

07 Aug 2025

Bidding-Aware Retrieval for Multi-Stage Consistency in Online Advertising

Bidding-Aware Retrieval for Multi-Stage Consistency in Online Advertising

87

0

0

07 Aug 2025

Audio Does Matter: Importance-Aware Multi-Granularity Fusion for Video Moment Retrieval

Audio Does Matter: Importance-Aware Multi-Granularity Fusion for Video Moment Retrieval

318

0

0

06 Aug 2025

Speech-to-LaTeX: New Models and Datasets for Converting Spoken Equations and Sentences

Speech-to-LaTeX: New Models and Datasets for Converting Spoken Equations and Sentences

Dmitrii Tarasov

Matvey Skripkin

Andrey Kuznetsov

172

0

0

05 Aug 2025

Injecting Measurement Information Yields a Fast and Noise-Robust Diffusion-Based Inverse Problem Solver

Injecting Measurement Information Yields a Fast and Noise-Robust Diffusion-Based Inverse Problem Solver

332

0

0

05 Aug 2025

Trainable Dynamic Mask Sparse Attention

Trainable Dynamic Mask Sparse Attention

354

3

0

04 Aug 2025

The Art of Breaking Words: Rethinking Multilingual Tokenizer Design

The Art of Breaking Words: Rethinking Multilingual Tokenizer Design

Atharva Savarkar

Kundeshwar Pundalik

Piyush Sawarkar

Maunendra Sankar Desarkar

Ganesh Ramakrishnan

107

2

0

03 Aug 2025

InspectVLM: Unified in Theory, Unreliable in Practice

InspectVLM: Unified in Theory, Unreliable in Practice

Jonathan Lwowski

111

0

0

03 Aug 2025

Versatile Transition Generation with Image-to-Video Diffusion

Versatile Transition Generation with Image-to-Video Diffusion

233

3

0

03 Aug 2025

Hyperbolic Cycle Alignment for Infrared-Visible Image Fusion

Hyperbolic Cycle Alignment for Infrared-Visible Image Fusion

135

0

0

31 Jul 2025

SCANet: Split Coordinate Attention Network for Building Footprint Extraction

SCANet: Split Coordinate Attention Network for Building Footprint ExtractionInternational Conference on Neural Information Processing (ICONIP), 2025

133

0

0

28 Jul 2025

Regularizing Subspace Redundancy of Low-Rank Adaptation

Regularizing Subspace Redundancy of Low-Rank Adaptation

...

200

0

0

28 Jul 2025

MambaMap: Online Vectorized HD Map Construction using State Space Model

MambaMap: Online Vectorized HD Map Construction using State Space Model

166

0

0

27 Jul 2025

FinDPO: Financial Sentiment Analysis for Algorithmic Trading through Preference Optimization of LLMs

FinDPO: Financial Sentiment Analysis for Algorithmic Trading through Preference Optimization of LLMs

Giorgos Iacovides

151

4

0

24 Jul 2025

DNT: a Deeply Normalized Transformer that can be trained by Momentum SGD

DNT: a Deeply Normalized Transformer that can be trained by Momentum SGD

141

0

0

23 Jul 2025

FW-VTON: Flattening-and-Warping for Person-to-Person Virtual Try-on

FW-VTON: Flattening-and-Warping for Person-to-Person Virtual Try-on

155

0

0

21 Jul 2025

TriCLIP-3D: A Unified Parameter-Efficient Framework for Tri-Modal 3D Visual Grounding based on CLIP

TriCLIP-3D: A Unified Parameter-Efficient Framework for Tri-Modal 3D Visual Grounding based on CLIP

220

0

0

20 Jul 2025

Supervised Fine Tuning on Curated Data is Reinforcement Learning (and can be improved)

Supervised Fine Tuning on Curated Data is Reinforcement Learning (and can be improved)

Jost Tobias Springenberg

211

12

0

17 Jul 2025

Hashed Watermark as a Filter: Defeating Forging and Overwriting Attacks in Weight-based Neural Network Watermarking

Hashed Watermark as a Filter: Defeating Forging and Overwriting Attacks in Weight-based Neural Network Watermarking

208

1

0

15 Jul 2025

Pre-Training LLMs on a budget: A comparison of three optimizers

Pre-Training LLMs on a budget: A comparison of three optimizers

Joel Schlotthauer

Christian Kroos

201

0

0

11 Jul 2025

Tractable Representation Learning with Probabilistic Circuits

Tractable Representation Learning with Probabilistic Circuits

Antonio Vergari

Kristian Kersting

385

0

0

06 Jul 2025

Don't Trust Generative Agents to Mimic Communication on Social Networks Unless You Benchmarked their Empirical Realism

Don't Trust Generative Agents to Mimic Communication on Social Networks Unless You Benchmarked their Empirical Realism

Achim Rettinger

221

0

0

27 Jun 2025

DuET: Dual Incremental Object Detection via Exemplar-Free Task Arithmetic

DuET: Dual Incremental Object Detection via Exemplar-Free Task Arithmetic

Vishal M. Chudasama

Biplab Banerjee

533

0

0

26 Jun 2025

Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity

Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity

Samin Yeasar Arnob

227

0

0

20 Jun 2025

Enhanced Dermatology Image Quality Assessment via Cross-Domain Training

Enhanced Dermatology Image Quality Assessment via Cross-Domain Training

Ignacio Hernández Montilla

Taig Mac Carthy

Gerardo Fernández

Antonio Martorell

82

0

0

19 Jun 2025

Sysformer: Safeguarding Frozen Large Language Models with Adaptive System Prompts

Sysformer: Safeguarding Frozen Large Language Models with Adaptive System Prompts

228

0

0

18 Jun 2025

The Butterfly Effect: Neural Network Training Trajectories Are Highly Sensitive to Initial Conditions

The Butterfly Effect: Neural Network Training Trajectories Are Highly Sensitive to Initial Conditions

Gül Sena Altıntaş

424

2

0

16 Jun 2025

GFRIEND: Generative Few-shot Reward Inference through EfficieNt DPO

GFRIEND: Generative Few-shot Reward Inference through EfficieNt DPO

182

0

0

10 Jun 2025

G-Sim: Generative Simulations with Large Language Models and Gradient-Free Calibration

Max Ruiz Luyten

Antonin Berthon

202

4

0

10 Jun 2025

Flow Diverse and Efficient: Learning Momentum Flow Matching via Stochastic Velocity Field Sampling

235

2

0

10 Jun 2025

1 2 3 4 5...23 24 25