Implicit Regularization of Bregman Proximal Point Algorithm and Mirror
Descent on Separable Data

Implicit Regularization of Bregman Proximal Point Algorithm and Mirror Descent on Separable Data

15 August 2021

Papers citing "Implicit Regularization of Bregman Proximal Point Algorithm and Mirror Descent on Separable Data"

10 / 10 papers shown

Title
Nonconvex Stochastic Bregman Proximal Gradient Method with Application to Deep Learning Kuan-Fu Ding Jingyang Li Kim-Chuan Toh 74 8 0 26 Jun 2023
Overfitting in adversarially robust deep learning Leslie Rice Eric Wong Zico Kolter 85 796 0 26 Feb 2020
Revisiting Knowledge Distillation via Label Smoothing Regularization Li-xin Yuan Francis E. H. Tay Guilin Li Tao Wang Jiashi Feng 45 91 0 25 Sep 2019
Learning and Generalization in Overparameterized Neural Networks, Going Beyond Two Layers Zeyuan Allen-Zhu Yuanzhi Li Yingyu Liang MLT 153 769 0 12 Nov 2018
ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design Ningning Ma Xiangyu Zhang Haitao Zheng Jian Sun 145 4,957 0 30 Jul 2018
Convergence of Gradient Descent on Separable Data Mor Shpigel Nacson Jason D. Lee Suriya Gunasekar Pedro H. P. Savarese Nathan Srebro Daniel Soudry 62 167 0 05 Mar 2018
Don't Decay the Learning Rate, Increase the Batch Size Samuel L. Smith Pieter-Jan Kindermans Chris Ying Quoc V. Le ODL 95 990 0 01 Nov 2017
Overcoming catastrophic forgetting in neural networks J. Kirkpatrick Razvan Pascanu Neil C. Rabinowitz J. Veness Guillaume Desjardins ... A. Grabska-Barwinska Demis Hassabis Claudia Clopath D. Kumaran R. Hadsell CLL 305 7,410 0 02 Dec 2016
On Large-Batch Training for Deep Learning: Generalization Gap and Sharp Minima N. Keskar Dheevatsa Mudigere J. Nocedal M. Smelyanskiy P. T. P. Tang ODL 384 2,922 0 15 Sep 2016
Learning without Forgetting Zhizhong Li Derek Hoiem CLL OOD SSL 269 4,357 0 29 Jun 2016