v1v2 (latest)

An overview of gradient descent optimization algorithms

15 September 2016

Papers citing "An overview of gradient descent optimization algorithms"

50 / 697 papers shown

Title
LW2G: Learning Whether to Grow for Prompt-based Continual Learning Qian Feng Dawei Zhou Hanbin Zhao Chao Zhang Jiahua Dong Dengxin Dai Hui Qian VLM CLL 83 5 0 01 Jul 2025
Robust Training with Data Augmentation for Medical Imaging Classification Josué Martínez-Martínez Olivia Brown Mostafa Karami S. Nabavi OOD AAML MedIm 19 1 0 20 Jun 2025
Towards Robust Learning to Optimize with Theoretical Guarantees Qingyu Song Wei Lin Juncheng Wang Hong Xu 29 3 0 17 Jun 2025
DeSPITE: Exploring Contrastive Deep Skeleton-Pointcloud-IMU-Text Embeddings for Advanced Point Cloud Human Activity Understanding Thomas Kreutz M. Mühlhäuser Alejandro Sánchez Guinea 43 0 0 16 Jun 2025
FUSE: Measure-Theoretic Compact Fuzzy Set Representation for Taxonomy Expansion Fred Xu Song Jiang Z. Huang Xiao Luo Shichang Zhang Adrian Chen Yizhou Sun 24 3 0 10 Jun 2025
Towards Data-Driven Model-Free Safety-Critical Control Zhe Shen Yitaek Kim Christoffer Sloth 27 0 0 07 Jun 2025
Denoising Programming Knowledge Tracing with a Code Graph-based Tuning Adaptor W. Gao Qi Liu Rui Li Yuze Zhao Hao Wang Linan Yre Fangzhou Yao Zheng Zhang 48 2 0 07 Jun 2025
Enhancing Biomedical Multi-modal Representation Learning with Multi-scale Pre-training and Perturbed Report Discrimination Xinliu Zhong Kayhan Batmanghelich Li Sun 72 1 0 02 Jun 2025
From Street Views to Urban Science: Discovering Road Safety Factors with Multimodal Large Language Models Yihong Tang Ao Qu Xujing Yu Weipeng Deng Jun Ma Jinhua Zhao Lijun Sun 54 0 0 02 Jun 2025
Optimal Density Functions for Weighted Convolution in Learning Models Simone Cammarasana Giuseppe Patané 27 0 0 30 May 2025
SG-Blend: Learning an Interpolation Between Improved Swish and GELU for Robust Neural Representations Gaurav Sarkar Jay Gala Subarna Tripathi 28 0 0 29 May 2025
CrossNAS: A Cross-Layer Neural Architecture Search Framework for PIM Systems Md Hasibul Amin Mohammadreza Mohammadi Jason D. Bakos Ramtin Zand 36 0 0 28 May 2025
PADAM: Parallel averaged Adam reduces the error for stochastic optimization in scientific machine learning Arnulf Jentzen Julian Kranz Adrian Riekert ODL 77 0 0 28 May 2025
Scalable and adaptive prediction bands with kernel sum-of-squares Louis Allain Sébastien Da Veiga B. Staber 37 0 0 27 May 2025
Certainty and Uncertainty Guided Active Domain Adaptation Bardia Safaei Vibashan Vs Vishal M. Patel TTA 57 0 0 26 May 2025
Nonparametric Teaching for Graph Property Learners Chen Zhang Weixin Bu Zhaochun Ren Ziyue Liu Yik-Chung Wu Ngai Wong 147 0 0 20 May 2025
Humble your Overconfident Networks: Unlearning Overfitting via Sequential Monte Carlo Tempered Deep Ensembles Andrew Millard Zheng Zhao Joshua Murphy Simon Maskell UQCV BDL 124 0 0 16 May 2025
ICE-Pruning: An Iterative Cost-Efficient Pruning Pipeline for Deep Neural Networks Wenhao Hu Paul Henderson José Cano 130 0 0 12 May 2025
Injecting Knowledge Graphs into Large Language Models Erica Coppolillo 98 0 0 12 May 2025
am-ELO: A Stable Framework for Arena-based LLM Evaluation Zirui Liu Jiatong Li Yan Zhuang Qiang Liu Shuanghong Shen Jie Ouyang Mingyue Cheng Shijin Wang 188 1 0 06 May 2025
Small-Scale-Fading-Aware Resource Allocation in Wireless Federated Learning Jiacheng Wang Le Liang Hao Ye Chongtao Guo Shi Jin 72 0 0 06 May 2025
Sharp higher order convergence rates for the Adam optimizer Steffen Dereich Arnulf Jentzen Adrian Riekert ODL 94 0 0 28 Apr 2025
Temperature Estimation in Induction Motors using Machine Learning Dinan Li Panagiotis Kakosimos 55 2 0 25 Apr 2025
AlphaGrad: Non-Linear Gradient Normalization Optimizer Soham Sane ODL 149 0 0 22 Apr 2025
Fine-Grained Rib Fracture Diagnosis with Hyperbolic Embeddings: A Detailed Annotation Framework and Multi-Label Classification Model Shripad Pate Aiman Farooq Suvrankar Datta Musadiq Aadil Sheikh Atin Kumar Deepak Mishra 63 0 0 15 Apr 2025
Algorithm Discovery With LLMs: Evolutionary Search Meets Reinforcement Learning Anja Surina Amin Mansouri Lars Quaedvlieg Amal Seddas Maryna Viazovska Emmanuel Abbe Çağlar Gülçehre 116 3 0 07 Apr 2025
LLM-based Automated Grading with Human-in-the-Loop Hang Li Yucheng Chu Kaiqi Yang Yasemin Copur-Gencturk Jiliang Tang AI4Ed ELM 149 3 0 07 Apr 2025
Towards Efficient Training of Graph Neural Networks: A Multiscale Approach Eshed Gal Moshe Eliasof Carola-Bibiane Schönlieb Eldad Haber E. Haber Eran Treister GNN AI4CE 181 1 0 25 Mar 2025
Adaptive Machine Learning for Resource-Constrained Environments Sebastián A. Cajas Ordóñez Jaydeep Samanta Andrés L. Suárez-Cetrulo Ricardo Simón Carbajo 180 0 0 24 Mar 2025
Action-Gradient Monte Carlo Tree Search for Non-Parametric Continuous (PO)MDPs Idan Lev-Yehudi Michael Novitsky Moran Barenboim Ron Benchetrit Vadim Indelman 95 0 0 15 Mar 2025
Hamiltonian Neural Networks for Robust Out-of-Time Credit Scoring Javier Marín 236 0 0 13 Mar 2025
Swift Hydra: Self-Reinforcing Generative Framework for Anomaly Detection with Multiple Mamba Models Nguyen H K. Do Truc Nguyen Malik Hassanaly Raed Alharbi Jung Taek Seo My T. Thai 73 0 0 09 Mar 2025
Wanda++: Pruning Large Language Models via Regional Gradients Yifan Yang Kai Zhen Bhavana Ganesh Aram Galstyan Goeric Huybrechts ... S. Bodapati Nathan Susanj Zheng Zhang Jack FitzGerald Abhishek Kumar 225 3 0 06 Mar 2025
MIDAS: Mixing Ambiguous Data with Soft Labels for Dynamic Facial Expression Recognition Ryosuke Kawamura Hideaki Hayashi Noriko Takemura Hajime Nagahara CVBM 3DH 104 4 0 28 Feb 2025
From Offline to Online Memory-Free and Task-Free Continual Learning via Fine-Grained Hypergradients Nicolas Michel Maorong Wang Jiangpeng He Toshihiko Yamasaki CLL 88 0 0 26 Feb 2025
Beyond the convexity assumption: Realistic tabular data generation under quantifier-free real linear constraints Mihaela C. Stoian Eleonora Giunchiglia 124 3 0 25 Feb 2025
Swarm Characteristics Classification Using Neural Networks Donald W. Peltier Isaac Kaminer Abram H. Clark Marko Orescanin 79 1 0 20 Feb 2025
SEW: Self-calibration Enhanced Whole Slide Pathology Image Analysis Haoming Luo Xiaotian Yu Shengxuming Zhang Jiabin Xia Yang Jian ... Liang Xue Xiuming Zhang Jing Zhang Jing Zhang Zunlei Feng 131 0 0 17 Feb 2025
Preconditioned Inexact Stochastic ADMM for Deep Model Shenglong Zhou Ouya Wang Ziyan Luo Yongxu Zhu Geoffrey Ye Li 92 0 0 15 Feb 2025
Multi-level Supervised Contrastive Learning Naghmeh Ghanooni Barbod Pajoum Harshit Rawal Sophie Fellenz Vo Nguyen Le Duy Marius Kloft 215 0 0 04 Feb 2025
When LLM Meets DRL: Advancing Jailbreaking Efficiency via DRL-guided Search Xuan Chen Yuzhou Nie Wenbo Guo Xiangyu Zhang 219 18 0 28 Jan 2025
Hybrid Firefly-Genetic Algorithm for Single and Multi-dimensional 0-1 Knapsack Problems Aswathi Malanthara Ishaan R Kale 37 0 0 28 Jan 2025
Task Arithmetic in Trust Region: A Training-Free Model Merging Approach to Navigate Knowledge Conflicts Wenju Sun Qingyong Li Wen Wang Yangli-ao Geng Boyang Li 192 5 0 28 Jan 2025
Optimization Landscapes Learned: Proxy Networks Boost Convergence in Physics-based Inverse Problems Girnar Goyal Philipp Holl Sweta Agrawal Nils Thuerey AI4CE 94 0 0 27 Jan 2025
Egoistic MDS-based Rigid Body Localization Niclas Führling Giuseppe Thadeu Freitas de Abreu David González González Osvaldo Gonsa 79 1 0 20 Jan 2025
Most Influential Subset Selection: Challenges, Promises, and Beyond Yuzheng Hu Pingbang Hu Han Zhao Jiaqi W. Ma TDI 217 9 0 10 Jan 2025
FIDLAR: Forecast-Informed Deep Learning Architecture for Flood Mitigation Jimeng Shi Zeda Yin Arturo S. Leon J. Obeysekera Giri Narasimhan AI4CE 65 1 0 08 Jan 2025
Measuring Error Alignment for Decision-Making Systems Binxia Xu Antonis Bikakis Daniel Onah A. Vlachidis Luke Dickens 122 0 0 03 Jan 2025
Grams: Gradient Descent with Adaptive Momentum Scaling Yang Cao Xiaoyu Li Zhao Song ODL 217 3 0 22 Dec 2024
PGD-Imp: Rethinking and Unleashing Potential of Classic PGD with Dual Strategies for Imperceptible Adversarial Attacks Jin Li Zitong Yu Ziqiang He Zhong Wang Xiangui Kang AAML 180 0 0 15 Dec 2024