SGDR: Stochastic Gradient Descent with Warm Restarts

13 August 2016

Papers citing "SGDR: Stochastic Gradient Descent with Warm Restarts"

50 / 1,273 papers shown

Title
Provably Near-Optimal Federated Ensemble Distillation with Negligible Overhead Won-Jun Jang Hyeon-Seo Park Si-Hyeon Lee FedML 155 0 0 10 Feb 2025
CANeRV: Content Adaptive Neural Representation for Video Compression Lv Tang Jun Zhu Xinfeng Zhang L. Zhang Siwei Ma Qingming Huang 62 1 0 10 Feb 2025
EquiTabPFN: A Target-Permutation Equivariant Prior Fitted Networks Michael Arbel David Salinas Frank Hutter 65 2 0 10 Feb 2025
Advancing Weight and Channel Sparsification with Enhanced Saliency Xinglong Sun Maying Shen Hongxu Yin Lei Mao Pavlo Molchanov Jose M. Alvarez 46 1 0 05 Feb 2025
Deep Weight Factorization: Sparse Learning Through the Lens of Artificial Symmetries Chris Kolb T. Weber Bernd Bischl David Rügamer 102 0 0 04 Feb 2025
SimBEV: A Synthetic Multi-Task Multi-Sensor Driving Data Generation Tool and Dataset Goodarz Mehr A. Eskandarian 61 1 0 04 Feb 2025
Target-driven Self-Distillation for Partial Observed Trajectories Forecasting Pengfei Zhu Peng Shu Mengshi Qi Liang Liu Huadong Ma 71 0 0 28 Jan 2025
DiffSplat: Repurposing Image Diffusion Models for Scalable Gaussian Splat Generation Chenguo Lin Panwang Pan Bangbang Yang Zeming Li Yadong Mu 3DGS 76 7 0 28 Jan 2025
FIT-Print: Towards False-claim-resistant Model Ownership Verification via Targeted Fingerprint Shuo Shao Haozhe Zhu Hongwei Yao Yiming Li Tianwei Zhang Z. Qin Kui Ren 137 0 0 28 Jan 2025
Learning the Regularization Strength for Deep Fine-Tuning via a Data-Emphasized Variational Objective Ethan Harvey Mikhail Petrov Michael C. Hughes 40 0 0 28 Jan 2025
Towards Scalable Topological Regularizers Hiu-Tung Wong Darrick Lee Hong Yan BDL 57 0 0 24 Jan 2025
Learning Versatile Optimizers on a Compute Diet A. Moudgil Boris Knyazev Guillaume Lajoie Eugene Belilovsky 126 0 0 22 Jan 2025
FOCUS: First Order Concentrated Updating Scheme Yizhou Liu Ziming Liu Jeff Gore ODL 108 1 0 21 Jan 2025
ENTIRE: Learning-based Volume Rendering Time Prediction Zikai Yin Hamid Gadirov Jiri Kosinka Steffen Frey 3DH 31 0 0 21 Jan 2025
Text-guided Synthetic Geometric Augmentation for Zero-shot 3D Understanding Kohei Torimi Ryosuke Yamada Daichi Otsuka Kensho Hara Yuki M. Asano Hirokatsu Kataoka Y. Aoki 3DV 36 0 0 20 Jan 2025
WaveDH: Wavelet Sub-bands Guided ConvNet for Efficient Image Dehazing Seongmin Hwang Daeyoung Han Cheolkon Jung Moongu Jeon 70 5 0 20 Jan 2025
A Heterogeneous Multimodal Graph Learning Framework for Recognizing User Emotions in Social Networks Sree Bhattacharyya Shuhua Yang James Z. Wang 38 0 0 13 Jan 2025
A Hessian-informed hyperparameter optimization for differential learning rate Shiyun Xu Zhiqi Bu Yiliang Zhang Ian J. Barnett 39 1 0 12 Jan 2025
Tensor Product Attention Is All You Need Yifan Zhang Yifeng Liu Huizhuo Yuan Zhen Qin Yang Yuan Q. Gu Andrew Chi-Chih Yao 77 9 0 11 Jan 2025
CURing Large Models: Compression via CUR Decomposition Sanghyeon Park Soo-Mook Moon 38 0 0 08 Jan 2025
Noise-Tolerant Hybrid Prototypical Learning with Noisy Web Data Chao Liang Linchao Zhu Zongxin Yang Wei Chen Yi Yang NoLa 55 0 0 05 Jan 2025
Passive Non-Line-of-Sight Imaging with Light Transport Modulation Jiarui Zhang Ruixu Geng Xiaolong Du Yan Chen Houqiang Li Yang Hu 62 1 0 03 Jan 2025
Instruction-Guided Scene Text Recognition Yongkun Du Z. Chen Yuchen Su Caiyan Jia Yu-Gang Jiang 71 3 0 03 Jan 2025
VideoRefer Suite: Advancing Spatial-Temporal Object Understanding with Video LLM Yuqian Yuan Hang Zhang Wentong Li Zesen Cheng Boqiang Zhang ... Deli Zhao Wenqiao Zhang Yueting Zhuang Jianke Zhu Lidong Bing 70 5 0 31 Dec 2024
$ReFlow6D: Refraction-Guided Transparent Object 6D Pose Estimation via Intermediate Representation Learning$ ReFlow6D: Refraction-Guided Transparent Object 6D Pose Estimation via Intermediate Representation Learning Hrishikesh Gupta S. Thalhammer Jean-Baptiste Weibel Alexander Haberl Markus Vincze 29 0 0 31 Dec 2024
B-STaR: Monitoring and Balancing Exploration and Exploitation in Self-Taught Reasoners Weihao Zeng Yuzhen Huang Lulu Zhao Yijun Wang Zifei Shan Junxian He LRM 35 7 0 23 Dec 2024
VaeDiff-DocRE: End-to-end Data Augmentation Framework for Document-level Relation Extraction Khai Phan Tran Wen Hua Xue Li SyDa 88 0 0 18 Dec 2024
RaCFormer: Towards High-Quality 3D Object Detection via Query-based Radar-Camera Fusion Xiaomeng Chu Jiajun Deng Guoliang You Yifan Duan Houqiang Li Yanyong Zhang 160 0 0 17 Dec 2024
Neural Port-Hamiltonian Differential Algebraic Equations for Compositional Learning of Electrical Networks Cyrus Neary Nathan Tsao Ufuk Topcu 72 1 0 15 Dec 2024
PGD-Imp: Rethinking and Unleashing Potential of Classic PGD with Dual Strategies for Imperceptible Adversarial Attacks Jin Li Zitong Yu Ziqiang He Zhong Wang Xiangui Kang AAML 77 0 0 15 Dec 2024
On the Performance Analysis of Momentum Method: A Frequency Domain Perspective Xianliang Li Jun Luo Zhiwei Zheng Hanxiao Wang Li Luo Lingkun Wen Linlong Wu Sheng Xu 72 0 0 29 Nov 2024
Distributed Sign Momentum with Local Steps for Training Transformers Shuhua Yu Ding Zhou Cong Xie An Xu Zhi-Li Zhang Xin Liu S. Kar 64 0 0 26 Nov 2024
UNOPose: Unseen Object Pose Estimation with an Unposed RGB-D Reference Image Xingyu Liu Gu Wang Ruida Zhang Chenyangguang Zhang F. Tombari Xiangyang Ji 177 2 0 25 Nov 2024
EfficientViM: Efficient Vision Mamba with Hidden State Mixer based State Space Duality Sanghyeok Lee Joonmyung Choi Hyunwoo J. Kim 110 3 0 22 Nov 2024
Unlocking State-Tracking in Linear RNNs Through Negative Eigenvalues Riccardo Grazzi Julien N. Siems Jörg K.H. Franke Arber Zela Frank Hutter Massimiliano Pontil 86 11 0 19 Nov 2024
TDSM: Triplet Diffusion for Skeleton-Text Matching in Zero-Shot Action Recognition Jeonghyeok Do Munchurl Kim 44 1 0 16 Nov 2024
C-DiffSET: Leveraging Latent Diffusion for SAR-to-EO Image Translation with Confidence-Guided Reliable Object Generation Jeonghyeok Do Jaehyup Lee Munchurl Kim DiffM 48 1 0 16 Nov 2024
Deep Convolutional Neural Networks on Multiclass Classification of Three-Dimensional Brain Images for Parkinson's Disease Stage Prediction Guan-Hua Huang Wan-Chen Lai Tai-Been Chen Chien-Chin Hsu Huei-Yung Chen Yi-Chen Wu Li-Ren Yeh MedIm 34 2 0 31 Oct 2024
Driving by the Rules: A Benchmark for Integrating Traffic Sign Regulations into Vectorized HD Map Xinyuan Chang Maixuan Xue Xinran Liu Zheng Pan Xing Wei 48 1 0 31 Oct 2024
FRoundation: Are Foundation Models Ready for Face Recognition? Tahar Chettaoui Naser Damer Fadi Boutros CVBM 39 4 0 31 Oct 2024
How Does Critical Batch Size Scale in Pre-training? Hanlin Zhang Depen Morwani Nikhil Vyas Jingfeng Wu Difan Zou Udaya Ghai Dean Phillips Foster Sham Kakade 72 8 0 29 Oct 2024
Relaxed Recursive Transformers: Effective Parameter Sharing with Layer-wise LoRA Sangmin Bae Adam Fisch Hrayr Harutyunyan Ziwei Ji Seungyeon Kim Tal Schuster KELM 76 5 0 28 Oct 2024
Can Large Language Models Invent Algorithms to Improve Themselves? Yoichi Ishibashi Taro Yano Masafumi Oyamada AIFin LRM 34 1 0 21 Oct 2024
MoH: Multi-Head Attention as Mixture-of-Head Attention Peng Jin Bo Zhu Li Yuan Shuicheng Yan MoE 29 13 0 15 Oct 2024
Rethinking the Role of Infrastructure in Collaborative Perception Hyunchul Bae Minhee Kang Minwoo Song Heejin Ahn 72 0 0 15 Oct 2024
Towards Understanding Why FixMatch Generalizes Better Than Supervised Learning Jingyang Li Jiachun Pan Vincent Y. F. Tan Kim-Chuan Toh Pan Zhou AAML MLT 43 0 0 15 Oct 2024
HASN: Hybrid Attention Separable Network for Efficient Image Super-resolution Weifeng Cao Xiaoyan Lei Jun Shi Wanyong Liang Jie Liu Zongfei Bai SupR 24 0 0 13 Oct 2024
Alberta Wells Dataset: Pinpointing Oil and Gas Wells from Satellite Imagery Pratinav Seth Michelle Lin Brefo Dwamena Yaw Jade Boutot Mary Kang David Rolnick 33 0 0 11 Oct 2024
radarODE-MTL: A Multi-Task Learning Framework with Eccentric Gradient Alignment for Robust Radar-Based ECG Reconstruction Y. Zhang Rui Yang Yutao Yue Eng Gee Lim 31 1 0 11 Oct 2024
Enhancing Performance of Point Cloud Completion Networks with Consistency Loss Christofel Rio Goenawan Kevin Tirta Wijaya Seung-Hyun Kong 3DPC 117 1 0 09 Oct 2024