A(DP)^2SGD: Asynchronous Decentralized Parallel Stochastic Gradient Descent with Differential Privacy

IEEE Transactions on Pattern Analysis and Machine Intelligence ◽

10.1109/tpami.2021.3107796 ◽

2021 ◽

pp. 1-1 ◽

Author(s):

Jie Xu ◽

Wei Zhang ◽

Fei Wang

Keyword(s):

Gradient Descent ◽

Differential Privacy ◽

Stochastic Gradient ◽

Stochastic Gradient Descent ◽

Parallel Stochastic Gradient Descent

Download Full-text

High Performance Parallel Stochastic Gradient Descent in Shared Memory

2016 IEEE International Parallel and Distributed Processing Symposium (IPDPS) ◽

10.1109/ipdps.2016.107 ◽

2016 ◽

Author(s):

Scott Sallinen ◽

Nadathur Satish ◽

Mikhail Smelyanskiy ◽

Samantika S. Sury ◽

Christopher Re

Keyword(s):

Shared Memory ◽

Gradient Descent ◽

High Performance ◽

Stochastic Gradient ◽

Stochastic Gradient Descent ◽

Parallel Stochastic Gradient Descent

Download Full-text

MindTheStep-AsyncPSGD: Adaptive Asynchronous Parallel Stochastic Gradient Descent

2019 IEEE International Conference on Big Data (Big Data) ◽

10.1109/bigdata47090.2019.9006054 ◽

2019 ◽

Author(s):

Karl Backstrom ◽

Marina Papatriantafilou ◽

Philippas Tsigas

Keyword(s):

Gradient Descent ◽

Stochastic Gradient ◽

Stochastic Gradient Descent ◽

Parallel Stochastic Gradient Descent ◽

Asynchronous Parallel

Download Full-text

Network-Density-Controlled Decentralized Parallel Stochastic Gradient Descent in Wireless Systems

ICC 2020 - 2020 IEEE International Conference on Communications (ICC) ◽

10.1109/icc40277.2020.9149125 ◽

2020 ◽

Author(s):

Koya Sato ◽

Yasuyuki Satoh ◽

Daisuke Sugimura

Keyword(s):

Gradient Descent ◽

Wireless Systems ◽

Stochastic Gradient ◽

Stochastic Gradient Descent ◽

Network Density ◽

Parallel Stochastic Gradient Descent

Download Full-text

Pedestrian Re-identification Based on Hierarchical Attributes Learning via Parallel Stochastic Gradient Descent

2018 5th IEEE International Conference on Cloud Computing and Intelligence Systems (CCIS) ◽

10.1109/ccis.2018.8691153 ◽

2018 ◽

Author(s):

Fei Tao ◽

Keyang Cheng ◽

Jianming Zhang

Keyword(s):

Gradient Descent ◽

Stochastic Gradient ◽

Stochastic Gradient Descent ◽

Parallel Stochastic Gradient Descent

Download Full-text

An Efficient Parallel Stochastic Gradient Descent for Matrix Factorization On GPUS

2020 IEEE Fifth International Conference on Data Science in Cyberspace (DSC) ◽

10.1109/dsc50466.2020.00047 ◽

2020 ◽

Author(s):

Tianyu Xing ◽

Bin Wu ◽

Bai Wang

Keyword(s):

Matrix Factorization ◽

Gradient Descent ◽

Stochastic Gradient ◽

Stochastic Gradient Descent ◽

Parallel Stochastic Gradient Descent

Download Full-text

Efficient and High-quality Recommendations via Momentum-incorporated Parallel Stochastic Gradient Descent-Based Learning

IEEE/CAA Journal of Automatica Sinica ◽

10.1109/jas.2020.1003396 ◽

2021 ◽

Vol 8 (2) ◽

pp. 402-411

Author(s):

Xin Luo ◽

Wen Qin ◽

Ani Dong ◽

Khaled Sedraoui ◽

MengChu Zhou

Keyword(s):

Gradient Descent ◽

Stochastic Gradient ◽

Stochastic Gradient Descent ◽

High Quality ◽

Parallel Stochastic Gradient Descent

Download Full-text

Consistent Lock-free Parallel Stochastic Gradient Descent for Fast and Stable Convergence

2021 IEEE International Parallel and Distributed Processing Symposium (IPDPS) ◽

10.1109/ipdps49936.2021.00051 ◽

2021 ◽

Author(s):

Karl Backstrom ◽

Ivan Walulya ◽

Marina Papatriantafilou ◽

Philippas Tsigas

Keyword(s):

Gradient Descent ◽

Stochastic Gradient ◽

Stochastic Gradient Descent ◽

Stable Convergence ◽

Parallel Stochastic Gradient Descent

Download Full-text

On the Convergence Properties of a K-step Averaging Stochastic Gradient Descent Algorithm for Nonconvex Optimization

Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence ◽

10.24963/ijcai.2018/447 ◽

2018 ◽

Author(s):

Fan Zhou ◽

Guojing Cong

Keyword(s):

Gradient Descent ◽

Large Scale ◽

Stochastic Gradient ◽

Learning Problems ◽

Stochastic Gradient Descent ◽

Convergence Properties ◽

Descent Algorithm ◽

Convergence Results ◽

Gradient Descent Algorithm ◽

Parallel Stochastic Gradient Descent

We adopt and analyze a synchronous K-step averaging stochastic gradient descent algorithm which we call K-AVG for solving large scale machine learning problems. We establish the convergence results of K-AVG for nonconvex objectives. Our analysis of K-AVG applies to many existing variants of synchronous SGD. We explain why the K-step delay is necessary and leads to better performance than traditional parallel stochastic gradient descent which is equivalent to K-AVG with $K=1$. We also show that K-AVG scales better with the number of learners than asynchronous stochastic gradient descent (ASGD). Another advantage of K-AVG over ASGD is that it allows larger stepsizes and facilitates faster convergence. On a cluster of $128$ GPUs, K-AVG is faster than ASGD implementations and achieves better accuracies and faster convergence for training with the CIFAR-10 dataset.

Download Full-text

Hierarchical attributes learning for pedestrian re-identification via parallel stochastic gradient descent combined with momentum correction and adaptive learning rate

Neural Computing and Applications ◽

10.1007/s00521-019-04485-2 ◽

2019 ◽

Vol 32 (10) ◽

pp. 5695-5712 ◽

Author(s):

Keyang Cheng ◽

Fei Tao ◽

Yongzhao Zhan ◽

Maozhen Li ◽

Kenli Li

Keyword(s):

Adaptive Learning ◽

Gradient Descent ◽

Learning Rate ◽

Stochastic Gradient ◽

Stochastic Gradient Descent ◽

Adaptive Learning Rate ◽

Parallel Stochastic Gradient Descent

Download Full-text

Efficient parallel Stochastic Gradient Descent for matrix factorization using GPU

2016 11th International Conference for Internet Technology and Secured Transactions (ICITST) ◽

10.1109/icitst.2016.7856668 ◽

2016 ◽

Author(s):

Mohamed A. Nassar ◽

Layla A. A. El-Sayed ◽

Yousry Taha

Keyword(s):

Matrix Factorization ◽

Gradient Descent ◽

Stochastic Gradient ◽

Stochastic Gradient Descent ◽

Parallel Stochastic Gradient Descent

Download Full-text