v1v2 (latest)

An overview of gradient descent optimization algorithms

15 September 2016

Papers citing "An overview of gradient descent optimization algorithms"

50 / 698 papers shown

Title
Large-Scale Deep Learning Optimizations: A Comprehensive Survey Xiaoxin He Fuzhao Xue Xiaozhe Ren Yang You 90 15 0 01 Nov 2021
Smart(Sampling)Augment: Optimal and Efficient Data Augmentation for Semantic Segmentation Misgana Negassi Diane Wagner A. Reiterer 26 14 0 31 Oct 2021
Multi-Task Learning based Convolutional Models with Curriculum Learning for the Anisotropic Reynolds Stress Tensor in Turbulent Duct Flow Haitz Sáez de Ocáriz Borde David Sondak P. Protopapas AI4CE 52 3 0 30 Oct 2021
Parameter Prediction for Unseen Deep Architectures Boris Knyazev M. Drozdzal Graham W. Taylor Adriana Romero Soriano OOD 122 83 0 25 Oct 2021
CeyMo: See More on Roads -- A Novel Benchmark Dataset for Road Marking Detection Junhui Yin S. Hemachandra Damith Anhettigama Shenali Kariyawasam Zhanyu Ma Jun Guo ObjD 86 26 0 22 Oct 2021
Sinkformers: Transformers with Doubly Stochastic Attention Michael E. Sander Pierre Ablin Mathieu Blondel Gabriel Peyré 89 85 0 22 Oct 2021
Repaint: Improving the Generalization of Down-Stream Visual Tasks by Generating Multiple Instances of Training Examples Amin Banitalebi-Dehkordi Yong Zhang 72 7 0 20 Oct 2021
EmbRace: Accelerating Sparse Communication for Distributed Training of NLP Neural Networks Shengwei Li Zhiquan Lai Dongsheng Li Yiming Zhang Xiangyu Ye Yabo Duan FedML 63 3 0 18 Oct 2021
S-Cyc: A Learning Rate Schedule for Iterative Pruning of ReLU-based Networks Shiyu Liu Chong Min John Tan Mehul Motani CLL 66 4 0 17 Oct 2021
Federated learning and next generation wireless communications: A survey on bidirectional relationship Debaditya Shome Omer Waqar Wali Ullah Khan 88 32 0 14 Oct 2021
DeepOrder: Deep Learning for Test Case Prioritization in Continuous Integration Testing Aizaz Sharif D. Marijan Marius Liaaen 48 32 0 14 Oct 2021
Adaptive Elastic Training for Sparse Deep Learning on Heterogeneous Multi-GPU Servers Yujing Ma Florin Rusu Kesheng Wu A. Sim 102 3 0 13 Oct 2021
Learning to Coordinate in Multi-Agent Systems: A Coordinated Actor-Critic Algorithm and Finite-Time Guarantees Siliang Zeng Tianyi Chen Alfredo García Mingyi Hong 92 11 0 11 Oct 2021
Polygon Area Decomposition Using a Compactness Metric M. Wzorek Cyrille Berger Patrick Doherty 23 2 0 08 Oct 2021
Label Propagation across Graphs: Node Classification using Graph Neural Tangent Kernels Artun Bayer Arindam Chowdhury Santiago Segarra 66 5 0 07 Oct 2021
Ship Performance Monitoring using Machine-learning Prateek Gupta Adil Rasheed S. Steen 21 45 0 07 Oct 2021
Accelerated Componentwise Gradient Boosting using Efficient Data Representation and Momentum-based Optimization Daniel Schalk B. Bischl David Rügamer 73 3 0 07 Oct 2021
Use of Deterministic Transforms to Design Weight Matrices of a Neural Network Pol Grau Jurado Xinyue Liang Alireza M. Javid Saikat Chatterjee 33 0 0 06 Oct 2021
Automated Estimation of Construction Equipment Emission using Inertial Sensors and Machine Learning Models Farid Shahnavaz Reza Akhavian 24 14 0 27 Sep 2021
Speeding-up One-vs-All Training for Extreme Classification via Smart Initialization Erik Schultheis Rohit Babbar 53 2 0 27 Sep 2021
A survey on deep learning approaches for breast cancer diagnosis Timothy C. H. Kwong S. Mazaheri MedIm 59 4 0 18 Sep 2021
FSER: Deep Convolutional Neural Networks for Speech Emotion Recognition Bonaventure F. P. Dossou Yeno K. S. Gbenou 30 8 0 15 Sep 2021
MMCoVaR: Multimodal COVID-19 Vaccine Focused Data Repository for Fake News Detection and a Baseline Architecture for Classification Mingxuan Chen Xinqiao Chu K. P. Subbalakshmi 98 29 0 14 Sep 2021
RobustART: Benchmarking Robustness on Architecture Design and Training Techniques Shiyu Tang Ruihao Gong Yan Wang Aishan Liu Jiakai Wang ... Xianglong Liu Basel Alomair Alan Yuille Philip Torr Dacheng Tao VLM AAML 102 108 0 11 Sep 2021
Multi-Tensor Network Representation for High-Order Tensor Completion Chang Nie Huan Wang Zhihui Lai 66 2 0 09 Sep 2021
EMA: Auditing Data Removal from Trained Models Yangsibo Huang Xiaoxiao Li Kai Li 45 15 0 08 Sep 2021
Backdoor Attack and Defense for Deep Regression Xi Li G. Kesidis David J. Miller V. Lucic AAML 64 6 0 06 Sep 2021
On Faster Convergence of Scaled Sign Gradient Descent Xiuxian Li Kuo-Yi Lin Li Li Yiguang Hong Jie-bin Chen ODL 64 11 0 04 Sep 2021
Deep Learning on Edge TPUs A. Kist Andreas M Kist 88 17 0 31 Aug 2021
When and how epochwise double descent happens Cory Stephenson Tyler Lee 85 15 0 26 Aug 2021
ExamGAN and Twin-ExamGAN for Exam Script Generation Zhengyang Wu Kefeng Deng Judy Qiu Yong Tang 52 2 0 22 Aug 2021
Understanding Data Storage and Ingestion for Large-Scale Deep Recommendation Model Training Mark Zhao Niket Agarwal Aarti Basant B. Gedik Satadru Pan ... Kevin Wilfong Harsha Rastogi Carole-Jean Wu Christos Kozyrakis Parikshit Pol GNN 84 76 0 20 Aug 2021
SplitGuard: Detecting and Mitigating Training-Hijacking Attacks in Split Learning Ege Erdogan Alptekin Kupcu A. E. Cicek AAML 70 34 0 20 Aug 2021
DeepCVA: Automated Commit-level Vulnerability Assessment with Deep Multi-task Learning T. H. Le David Hin Roland Croft Muhammad Ali Babar 64 56 0 18 Aug 2021
Neuron Campaign for Initialization Guided by Information Bottleneck Theory Haitao Mao Xu Chen Qiang Fu Lun Du Shi Han Dongmei Zhang AI4CE 44 10 0 14 Aug 2021
A proof of convergence for the gradient descent optimization method with random initializations in the training of neural networks with ReLU activation for piecewise linear target functions Arnulf Jentzen Adrian Riekert 82 13 0 10 Aug 2021
RCA-IUnet: A residual cross-spatial attention guided inception U-Net model for tumor segmentation in breast ultrasound imaging Narinder Singh Punn Sonali Agarwal 85 63 0 05 Aug 2021
Super Neurons S. Kiranyaz Junaid Malik Mehmet Yamaç Mert Duman Ilke Adalioglu E. Guldogan T. Ince Moncef Gabbouj SupR 75 7 0 03 Aug 2021
On The State of Data In Computer Vision: Human Annotations Remain Indispensable for Developing Deep Learning Models Z. Emam Andrew Kondrich Sasha Harrison Felix Lau Yushi Wang Aerin Kim E. Branson VLM 50 13 0 31 Jul 2021
Robust and Active Learning for Deep Neural Network Regression Xi Li G. Kesidis David J. Miller Maxime Bergeron Ryan Ferguson V. Lucic 49 1 0 28 Jul 2021
MAG-Net: Multi-task attention guided network for brain tumor segmentation and classification S. Gupta Narinder Singh Punn S. K. Sonbhadra Sonali Agarwal 109 8 0 26 Jul 2021
Joint Direction and Proximity Classification of Overlapping Sound Events from Binaural Audio D. Krause Archontis Politis A. Mesaros 46 8 0 26 Jul 2021
A High-Performance Adaptive Quantization Approach for Edge CNN Applications Hsu-Hsun Chin R. Tsay Hsin-I Wu MQ 54 5 0 18 Jul 2021
Neighbor-view Enhanced Model for Vision and Language Navigation Dongyan An Yuankai Qi Yan Huang Qi Wu Liang Wang Tieniu Tan LM&Ro 82 71 0 15 Jul 2021
Disparity Between Batches as a Signal for Early Stopping Mahsa Forouzesh Patrick Thiran 101 8 0 14 Jul 2021
A Convolutional Neural Network Approach to the Classification of Engineering Models Bharadwaj Manda Pranjal Bhaskare Ramanathan Muthuganapathy 47 26 0 14 Jul 2021
BCNet: A Deep Convolutional Neural Network for Breast Cancer Grading Pouya Hallaj Zavareh Atefeh Safayari Hamidreza Bolhasani 62 9 0 11 Jul 2021
Activated Gradients for Deep Neural Networks Mei Liu Liangming Chen Xiaohao Du Long Jin Mingsheng Shang ODL AI4CE 72 145 0 09 Jul 2021
A Multi-modal and Multi-task Learning Method for Action Unit and Expression Recognition Yue Jin Tianqing Zheng Chao Gao Guoqiang Xu 81 38 0 09 Jul 2021
A Leap among Quantum Computing and Quantum Neural Networks: A Survey F. V. Massoli Lucia Vadicamo Giuseppe Amato Fabrizio Falchi 80 34 0 06 Jul 2021