v1v2 (latest)

Do Sharpness-based Optimizers Improve Generalization in Medical Image Analysis?

7 August 2024

Aleksandar Vakanski

Papers citing "Do Sharpness-based Optimizers Improve Generalization in Medical Image Analysis?"

31 / 31 papers shown

Title
Sharpness-Aware Minimization Revisited: Weighted Sharpness as a Regularization Term Yun Yue Jiadi Jiang Zhiling Ye Ni Gao Yongchao Liu Kecheng Zhang MLAU ODL 78 14 0 25 May 2023
Model Generalization: A Sharpness Aware Optimization Perspective Jozef Marus Coldenhoff Chengkun Li Yurui Zhu 17 2 0 14 Aug 2022
HoVer-Trans: Anatomy-aware HoVer-Transformer for ROI-free Breast Cancer Diagnosis in Ultrasound Images Y. Mo Chu Han Yu Liu Min Liu Zhenwei Shi ... Zeyan Xu Xiaomei Huang Zaiyi Liu Ying Wang C. Liang ViT MedIm 98 56 0 17 May 2022
Surrogate Gap Minimization Improves Sharpness-Aware Training Juntang Zhuang Boqing Gong Liangzhe Yuan Huayu Chen Hartwig Adam Nicha Dvornek S. Tatikonda James Duncan Ting Liu 71 157 0 15 Mar 2022
How Do Vision Transformers Work? Namuk Park Songkuk Kim ViT 83 481 0 14 Feb 2022
MedMNIST v2 -- A large-scale lightweight benchmark for 2D and 3D biomedical image classification Jiancheng Yang Rui Shi D. Wei Zequan Liu Lin Zhao B. Ke Hanspeter Pfister Bingbing Ni VLM 305 699 0 27 Oct 2021
Sharpness-Aware Minimization Improves Language Model Generalization Dara Bahri H. Mobahi Yi Tay 154 103 0 16 Oct 2021
Swin Transformer: Hierarchical Vision Transformer using Shifted Windows Ze Liu Yutong Lin Yue Cao Han Hu Yixuan Wei Zheng Zhang Stephen Lin B. Guo ViT 450 21,439 0 25 Mar 2021
Evaluation of Complexity Measures for Deep Learning Generalization in Medical Image Analysis Aleksandar Vakanski Min Xian 21 7 0 04 Mar 2021
ASAM: Adaptive Sharpness-Aware Minimization for Scale-Invariant Learning of Deep Neural Networks Jungmin Kwon Jeongseop Kim Hyunseong Park I. Choi 96 290 0 23 Feb 2021
An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale Alexey Dosovitskiy Lucas Beyer Alexander Kolesnikov Dirk Weissenborn Xiaohua Zhai ... Matthias Minderer G. Heigold Sylvain Gelly Jakob Uszkoreit N. Houlsby ViT 657 41,103 0 22 Oct 2020
Sharpness-Aware Minimization for Efficiently Improving Generalization Pierre Foret Ariel Kleiner H. Mobahi Behnam Neyshabur AAML 192 1,350 0 03 Oct 2020
The large learning rate phase of deep learning: the catapult mechanism Aitor Lewkowycz Yasaman Bahri Ethan Dyer Jascha Narain Sohl-Dickstein Guy Gur-Ari ODL 194 241 0 04 Mar 2020
Comparing Different Deep Learning Architectures for Classification of Chest Radiographs Keno K. Bressem Lisa Christine Adams C. Erxleben B. Hamm S. Niehues J. Vahldiek 49 168 0 20 Feb 2020
PyHessian: Neural Networks Through the Lens of the Hessian Z. Yao A. Gholami Kurt Keutzer Michael W. Mahoney ODL 58 303 0 16 Dec 2019
Fantastic Generalization Measures and Where to Find Them Yiding Jiang Behnam Neyshabur H. Mobahi Dilip Krishnan Samy Bengio AI4CE 136 607 0 04 Dec 2019
Generalization Error Bounds of Gradient Descent for Learning Over-parameterized Deep ReLU Networks Yuan Cao Quanquan Gu ODL MLT AI4CE 76 157 0 04 Feb 2019
CheXpert: A Large Chest Radiograph Dataset with Uncertainty Labels and Expert Comparison Jeremy Irvin Pranav Rajpurkar M. Ko Yifan Yu Silviana Ciurea-Ilcus ... D. Larson C. Langlotz Bhavik Patel M. Lungren A. Ng 112 2,595 0 21 Jan 2019
SmoothOut: Smoothing Out Sharp Minima to Improve Generalization in Deep Learning W. Wen Yandan Wang Feng Yan Cong Xu Chunpeng Wu Yiran Chen H. Li 61 51 0 21 May 2018
Hessian-based Analysis of Large Batch Training and Robustness to Adversaries Z. Yao A. Gholami Qi Lei Kurt Keutzer Michael W. Mahoney 63 167 0 22 Feb 2018
BUSIS: A Benchmark for Breast Ultrasound Image Segmentation Min Xian Yingtao Zhang H. Cheng Fei Xu Kuan Huang Boyu Zhang Jianrui Ding C. Ning Ying Wang 59 62 0 09 Jan 2018
Visualizing the Loss Landscape of Neural Nets Hao Li Zheng Xu Gavin Taylor Christoph Studer Tom Goldstein 249 1,893 0 28 Dec 2017
Generalization in Deep Learning Kenji Kawaguchi L. Kaelbling Yoshua Bengio ODL 88 460 0 16 Oct 2017
Exploring Generalization in Deep Learning Behnam Neyshabur Srinadh Bhojanapalli David A. McAllester Nathan Srebro FAtt 150 1,256 0 27 Jun 2017
Spectral Norm Regularization for Improving the Generalizability of Deep Learning Yuichi Yoshida Takeru Miyato 79 334 0 31 May 2017
Sharp Minima Can Generalize For Deep Nets Laurent Dinh Razvan Pascanu Samy Bengio Yoshua Bengio ODL 116 772 0 15 Mar 2017
Entropy-SGD: Biasing Gradient Descent Into Wide Valleys Pratik Chaudhari A. Choromańska Stefano Soatto Yann LeCun Carlo Baldassi C. Borgs J. Chayes Levent Sagun R. Zecchina ODL 96 773 0 06 Nov 2016
On Large-Batch Training for Deep Learning: Generalization Gap and Sharp Minima N. Keskar Dheevatsa Mudigere J. Nocedal M. Smelyanskiy P. T. P. Tang ODL 424 2,941 0 15 Sep 2016
Deep Residual Learning for Image Recognition Kaiming He Xinming Zhang Shaoqing Ren Jian Sun MedIm 2.2K 194,020 0 10 Dec 2015
Path-SGD: Path-Normalized Optimization in Deep Neural Networks Behnam Neyshabur Ruslan Salakhutdinov Nathan Srebro ODL 86 309 0 08 Jun 2015
Very Deep Convolutional Networks for Large-Scale Image Recognition Karen Simonyan Andrew Zisserman FAtt MDE 1.6K 100,386 0 04 Sep 2014