Splitting Steepest Descent for Growing Neural Architectures

6 October 2019

Papers citing "Splitting Steepest Descent for Growing Neural Architectures"

12 / 12 papers shown

Title
Beyond Uniform Scaling: Exploring Depth Heterogeneity in Neural Architectures Akash Guna R.T Arnav Chavan Deepak Gupta MDE 37 0 0 19 Feb 2024
Loss Landscape of Shallow ReLU-like Neural Networks: Stationary Points, Saddle Escape, and Network Embedding Zhengqing Wu Berfin Simsek Francois Ged ODL 53 0 0 08 Feb 2024
Accelerated Training via Incrementally Growing Neural Networks using Variance Transfer and Learning Rate Adaptation Xin Yuan Pedro H. P. Savarese Michael Maire 18 5 0 22 Jun 2023
The Dormant Neuron Phenomenon in Deep Reinforcement Learning Ghada Sokar Rishabh Agarwal Pablo Samuel Castro Utku Evci CLL 53 90 0 24 Feb 2023
Streamable Neural Fields Junwoo Cho Seungtae Nam Daniel Rho J. Ko Eunbyung Park AI4TS 40 17 0 20 Jul 2022
Sparsity Winning Twice: Better Robust Generalization from More Efficient Training Tianlong Chen Zhenyu Zhang Pengju Wang Santosh Balachandra Haoyu Ma Zehao Wang Zhangyang Wang OOD AAML 100 47 0 20 Feb 2022
bert2BERT: Towards Reusable Pretrained Language Models Cheng Chen Yichun Yin Lifeng Shang Xin Jiang Yujia Qin Fengyu Wang Zhi Wang Xiao Chen Zhiyuan Liu Qun Liu VLM 34 59 0 14 Oct 2021
The Elastic Lottery Ticket Hypothesis Xiaohan Chen Yu Cheng Shuohang Wang Zhe Gan Jingjing Liu Zhangyang Wang OOD 33 34 0 30 Mar 2021
BinaryBERT: Pushing the Limit of BERT Quantization Haoli Bai Wei Zhang Lu Hou Lifeng Shang Jing Jin Xin Jiang Qun Liu Michael Lyu Irwin King MQ 145 221 0 31 Dec 2020
A Differential Game Theoretic Neural Optimizer for Training Residual Networks Guan-Horng Liu T. Chen Evangelos A. Theodorou 26 2 0 17 Jul 2020
Energy-Aware Neural Architecture Optimization with Fast Splitting Steepest Descent Dilin Wang Meng Li Lemeng Wu Vikas Chandra Qiang Liu 46 20 0 07 Oct 2019
Neural Architecture Search with Reinforcement Learning Barret Zoph Quoc V. Le 274 5,331 0 05 Nov 2016