v1v2v3 (latest)

Optimization Methods for Large-Scale Machine Learning

15 June 2016

Papers citing "Optimization Methods for Large-Scale Machine Learning"

50 / 1,491 papers shown

Quantized Convolutional Neural Networks Through the Lens of Partial Differential EquationsResearch in the Mathematical Sciences (Res. Math. Sci.), 2021

277

31 Aug 2021

Approximate Bayesian Optimisation for Neural Networks

N. Hassen

Irina Rish

128

27 Aug 2021

The Number of Steps Needed for Nonconvex Optimization of a Deep Learning Optimizer is a Rational Function of Batch Size

Hideaki Iiduka

222

26 Aug 2021

Adaptive shot allocation for fast convergence in variational quantum algorithms

179

23 Aug 2021

Anarchic Federated LearningInternational Conference on Machine Learning (ICML), 2021

Haibo Yang

213

23 Aug 2021

Mobility-Aware Cluster Federated Learning in Hierarchical Wireless Networks

Chenyuan Feng

243

111

20 Aug 2021

Cross-Silo Federated Learning for Multi-Tier Networks with Vertical and Horizontal Data Partitioning

330

19 Aug 2021

A proof of convergence for the gradient descent optimization method with random initializations in the training of neural networks with ReLU activation for piecewise linear target functionsJournal of machine learning research (JMLR), 2021

Arnulf Jentzen

Adrian Riekert

227

10 Aug 2021

On the Hyperparameters in Stochastic Gradient Descent with MomentumJournal of machine learning research (JMLR), 2021

Bin Shi

248

09 Aug 2021

Uniform Sampling over Episode Difficulty

Sébastien M. R. Arnold

Guneet Singh Dhillon

Avinash Ravichandran

Stefano Soatto

194

03 Aug 2021

Numerical Solution of Stiff ODEs with Physics-Informed RPNNs

208

03 Aug 2021

Coordinate descent on the orthogonal group for recurrent neural network trainingAAAI Conference on Artificial Intelligence (AAAI), 2021

E. Massart

V. Abrol

222

30 Jul 2021

DQ-SGD: Dynamic Quantization in SGD for Communication-Efficient Distributed LearningIEEE International Conference on Mobile Adhoc and Sensor Systems (MASS), 2021

Guangfeng Yan

Shao-Lun Huang

Tian-Shing Lan

Linqi Song

125

30 Jul 2021

Decentralized Federated Learning: Balancing Communication and Computing CostsIEEE Transactions on Signal and Information Processing over Networks (TSIPN), 2021

380

140

26 Jul 2021

A general sample complexity analysis of vanilla policy gradientInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2021

Rui Yuan

Robert Mansel Gower

A. Lazaric

460

23 Jul 2021

Improved Learning Rates for Stochastic Optimization: Two Theoretical Viewpoints

Shaojie Li

Yong Liu

329

19 Jul 2021

Differentially Private Bayesian Neural Networks on Accuracy, Privacy and Reliability

222

18 Jul 2021

Globally Convergent Multilevel Training of Deep Residual Networks

Alena Kopanicáková

Rolf Krause

343

15 Jul 2021

Chimera: Efficiently Training Large-Scale Neural Networks with Bidirectional Pipelines

Shigang Li

Torsten Hoefler

AI4CE LRM GNN

498

165

14 Jul 2021

Nonlinear Least Squares for Large-Scale Machine Learning using Stochastic Jacobian Estimates

Johannes J Brust

199

12 Jul 2021

The Bayesian Learning RuleJournal of machine learning research (JMLR), 2021

Mohammad Emtiyaz Khan

Håvard Rue

BDL

546

105

09 Jul 2021

Activated Gradients for Deep Neural NetworksIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2021

165

198

09 Jul 2021

KOALA: A Kalman Optimization Algorithm with Loss Adaptivity

403

07 Jul 2021

KAISA: An Adaptive Second-Order Optimizer Framework for Deep Neural Networks

J. G. Pauloski

Qi Huang

Lei Huang

Shivaram Venkataraman

Kyle Chard

Ian Foster

Zhao-jie Zhang

260

04 Jul 2021

A Comparison of the Delta Method and the Bootstrap in Deep Learning Classification

119

04 Jul 2021

Stochastic Gradient Descent-Ascent and Consensus Optimization for Smooth Games: Convergence Analysis under Expected Co-coercivityNeural Information Processing Systems (NeurIPS), 2021

Nicolas Loizou

Hugo Berard

Gauthier Gidel

Alexia Jolicoeur-Martineau

Damien Scieur

382

30 Jun 2021

Never Go Full Batch (in Stochastic Convex Optimization)Neural Information Processing Systems (NeurIPS), 2021

225

29 Jun 2021

The Convergence Rate of SGD's Final Iterate: Analysis on Dimension Dependence

Daogao Liu

Zhou Lu

LRM

28 Jun 2021

A Stochastic Sequential Quadratic Optimization Algorithm for Nonlinear Equality Constrained Optimization with Rank-Deficient Jacobians

200

24 Jun 2021

Finite-Sample Analysis of Off-Policy TD-Learning via Generalized Bellman Operators

Zaiwei Chen

S. T. Maguluri

Sanjay Shakkottai

Karthikeyan Shanmugam

OffRL

171

24 Jun 2021

Numerical influence of ReLU'(0) on backpropagation

David Bertoin

Jérôme Bolte

Sébastien Gerchinovitz

Edouard Pauwels

228

23 Jun 2021

Solving Stochastic Optimization with Expectation Constraints Efficiently by a Stochastic Augmented Lagrangian-Type AlgorithmINFORMS journal on computing (IJOC), 2021

187

22 Jun 2021

Memory Augmented Optimizers for Deep LearningInternational Conference on Learning Representations (ICLR), 2021

Paul-Aymeric McRae

Prasanna Parthasarathi

Mahmoud Assran

Sarath Chandar

ODL

145

20 Jun 2021

STEM: A Stochastic Two-Sided Momentum Algorithm Achieving Near-Optimal Sample and Communication Complexities for Federated LearningNeural Information Processing Systems (NeurIPS), 2021

Haibo Yang

117

19 Jun 2021

Interval and fuzzy physics-informed neural networks for uncertain fieldsProbabilistic Engineering Mechanics (PEM), 2021

224

18 Jun 2021

Algorithmic Bias and Data Bias: Understanding the Relation between Distributionally Robust Optimization and Data Curation

Agnieszka Słowik

Léon Bottou

FaML

217

17 Jun 2021

Masked Training of Neural Networks with Partial Gradients

Amirkeivan Mohtashami

Martin Jaggi

Sebastian U. Stich

373

16 Jun 2021

A Survey on Fault-tolerance in Distributed Optimization and Machine Learning

Shuo Liu

AI4CE OOD

233

16 Jun 2021

On the Sample Complexity and Metastability of Heavy-tailed Policy Search in Continuous Control

Mengdi Wang

177

15 Jun 2021

RCURRENCY: Live Digital Asset Trading Using a Recurrent Neural Network-based Forecasting System

13 Jun 2021

Federated Learning with Buffered Asynchronous AggregationInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2021

396

407

11 Jun 2021

Decoupled Greedy Learning of CNNs for Synchronous and Asynchronous Distributed Learning

169

11 Jun 2021

DG-LMC: A Turn-key and Scalable Synchronous Distributed MCMC Algorithm via Langevin Monte Carlo within GibbsInternational Conference on Machine Learning (ICML), 2021

273

11 Jun 2021

A Decentralized Adaptive Momentum Method for Solving a Class of Min-Max Optimization ProblemsSignal Processing (Signal Process.), 2021

Babak Barazandeh

Tianjian Huang

George Michailidis

238

10 Jun 2021

A Continuized View on Nesterov Acceleration for Stochastic Gradient Descent and Randomized Gossip

Laurent Massoulié

303

10 Jun 2021

The dilemma of quantum neural networksIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2021

165

09 Jun 2021

Asynchronous Distributed Optimization with Redundancy in Cost Functions

Shuo Liu

Nirupam Gupta

Nitin H. Vaidya

269

07 Jun 2021

Dynamics of Stochastic Momentum Methods on Large-scale, Quadratic ModelsNeural Information Processing Systems (NeurIPS), 2021

Courtney Paquette

Elliot Paquette

ODL

197

07 Jun 2021

Stein ICP for Uncertainty Estimation in Point Cloud MatchingIEEE Robotics and Automation Letters (RA-L), 2021

221

07 Jun 2021

SpreadGNN: Serverless Multi-task Federated Learning for Graph Neural Networks

Chaoyang He

Emir Ceyani

Keshav Balasubramanian

M. Annavaram

Salman Avestimehr

FedML

196

04 Jun 2021