The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks

9 March 2018

Papers citing "The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks"

50 / 729 papers shown

Title
Linguistically Grounded Analysis of Language Models using Shapley Head Values Marcell Richard Fekete Johannes Bjerva 31 0 0 17 Oct 2024
Extracting and Transferring Abilities For Building Multi-lingual Ability-enhanced Large Language Models Zhipeng Chen Liang Song K. Zhou Wayne Xin Zhao Binghui Wang Weipeng Chen Ji-Rong Wen 68 0 0 10 Oct 2024
More Experts Than Galaxies: Conditionally-overlapping Experts With Biologically-Inspired Fixed Routing Sagi Shaier Francisco Pereira K. Wense Lawrence E Hunter Matt Jones MoE 49 0 0 10 Oct 2024
Efficient Source-Free Time-Series Adaptation via Parameter Subspace Disentanglement Gaurav Patel Christopher Sandino Behrooz Mahasseni Ellen L. Zippi Erdrin Azemi Ali Moin Juri Minxha TTA AI4TS 55 3 0 03 Oct 2024
FedPeWS: Personalized Warmup via Subnetworks for Enhanced Heterogeneous Federated Learning Nurbek Tastan Samuel Horváth Martin Takáč Karthik Nandakumar FedML 62 0 0 03 Oct 2024
Dynamic Sparse Training versus Dense Training: The Unexpected Winner in Image Corruption Robustness Boqian Wu Q. Xiao Shunxin Wang N. Strisciuglio Mykola Pechenizkiy M. V. Keulen Decebal Constantin Mocanu Elena Mocanu OOD 3DH 60 0 0 03 Oct 2024
Inferring Thunderstorm Occurrence from Vertical Profiles of Convection-Permitting Simulations: Physical Insights from a Physical Deep Learning Model Kianusch Vahid Yousefnia Tobias Bölle Christoph Metzl 30 0 0 30 Sep 2024
Investigating the Effect of Network Pruning on Performance and Interpretability Jonathan von Rad Florian Seuffert 36 1 0 29 Sep 2024
Multiplicative Logit Adjustment Approximates Neural-Collapse-Aware Decision Boundary Adjustment Naoya Hasegawa Issei Sato 41 0 0 26 Sep 2024
Training Neural Networks for Modularity aids Interpretability Satvik Golechha Dylan R. Cope Nandi Schoots 30 0 0 24 Sep 2024
On Importance of Pruning and Distillation for Efficient Low Resource NLP Aishwarya Mirashi Purva Lingayat Srushti Sonavane Tejas Padhiyar Raviraj Joshi Geetanjali Kale 34 1 0 21 Sep 2024
Monomial Matrix Group Equivariant Neural Functional Networks Hoang V. Tran Thieu N. Vo Tho H. Tran An T. Nguyen Tan M. Nguyen 54 5 0 18 Sep 2024
S-STE: Continuous Pruning Function for Efficient 2:4 Sparse Pre-training Yuezhou Hu Jun-Jie Zhu Jianfei Chen 53 0 0 13 Sep 2024
Self-Masking Networks for Unsupervised Adaptation Alfonso Taboada Warmerdam Mathilde Caron Yuki M. Asano 54 1 0 11 Sep 2024
HESSO: Towards Automatic Efficient and User Friendly Any Neural Network Training and Pruning Tianyi Chen Xiaoyi Qu David Aponte Colby R. Banbury Jongwoo Ko Tianyu Ding Yong Ma Vladimir Lyapunov Ilya Zharkov Luming Liang 83 1 0 11 Sep 2024
Mask in the Mirror: Implicit Sparsification Tom Jacobs R. Burkholz 49 3 0 19 Aug 2024
Compress and Compare: Interactively Evaluating Efficiency and Behavior Across ML Model Compression Experiments Angie Boggust Venkatesh Sivaraman Yannick Assogba Donghao Ren Dominik Moritz Fred Hohman VLM 63 3 0 06 Aug 2024
ThinK: Thinner Key Cache by Query-Driven Pruning Yuhui Xu Zhanming Jie Hanze Dong Lei Wang Xudong Lu Aojun Zhou Amrita Saha Caiming Xiong Doyen Sahoo 75 15 0 30 Jul 2024
LORTSAR: Low-Rank Transformer for Skeleton-based Action Recognition Soroush Oraki Harry Zhuang Jie Liang 49 1 0 19 Jul 2024
The Impact of Quantization and Pruning on Deep Reinforcement Learning Models Heng Lu Mehdi Alemi Reza Rawassizadeh 42 1 0 05 Jul 2024
SAFT: Towards Out-of-Distribution Generalization in Fine-Tuning Bac Nguyen Stefan Uhlich Fabien Cardinaux Lukas Mauch Marzieh Edraki Aaron Courville OODD CLL VLM 57 3 0 03 Jul 2024
LPViT: Low-Power Semi-structured Pruning for Vision Transformers Kaixin Xu Zhe Wang Chunyun Chen Xue Geng Jie Lin Xulei Yang Min-man Wu Min Wu Xiaoli Li Weisi Lin ViT VLM 51 7 0 02 Jul 2024
Neural Networks Trained by Weight Permutation are Universal Approximators Yongqiang Cai Gaohang Chen Zhonghua Qiao 72 1 0 01 Jul 2024
Infinite Width Models That Work: Why Feature Learning Doesn't Matter as Much as You Think Luke Sernau 21 0 0 27 Jun 2024
Trimming the Fat: Efficient Compression of 3D Gaussian Splats through Pruning Muhammad Salman Ali Maryam Qamar Sung-Ho Bae Enzo Tartaglione 3DGS 40 11 0 26 Jun 2024
A Thorough Performance Benchmarking on Lightweight Embedding-based Recommender Systems Hung Vinh Tran Tong Chen Quoc Viet Hung Nguyen Zi-Rui Huang Lizhen Cui Hongzhi Yin 45 1 0 25 Jun 2024
Unlocking Continual Learning Abilities in Language Models Wenyu Du Shuang Cheng Tongxu Luo Zihan Qiu Zeyu Huang Ka Chun Cheung Reynold Cheng Jie Fu KELM CLL 56 7 0 25 Jun 2024
ShadowLLM: Predictor-based Contextual Sparsity for Large Language Models Yash Akhauri Ahmed F. AbouElhamayed Jordan Dotzel Zhiru Zhang Alexander M Rush Safeen Huda Mohamed S. Abdelfattah 23 2 0 24 Jun 2024
Towards Lightweight Graph Neural Network Search with Curriculum Graph Sparsification Beini Xie Heng Chang Ziwei Zhang Zeyang Zhang Simin Wu Xin Wang Yuan Meng Wenwu Zhu 42 2 0 24 Jun 2024
Geometric sparsification in recurrent neural networks Wyatt Mackey Ioannis Schizas Jared Deighton David L. Boothe, Jr. Vasileios Maroulas 38 0 0 10 Jun 2024
Evaluating Zero-Shot Long-Context LLM Compression Chenyu Wang Yihan Wang Kai Li 51 0 0 10 Jun 2024
Federated LoRA with Sparse Communication Kevin Kuo Arian Raje Kousik Rajesh Virginia Smith 46 8 0 07 Jun 2024
Designs for Enabling Collaboration in Human-Machine Teaming via Interactive and Explainable Systems Rohan R. Paleja Michael Munje K. Chang Reed Jensen Matthew C. Gombolay 46 2 0 07 Jun 2024
Optimal Recurrent Network Topologies for Dynamical Systems Reconstruction Christoph Jürgen Hemmer Manuel Brenner Florian Hess Daniel Durstewitz 38 4 0 07 Jun 2024
Light-PEFT: Lightening Parameter-Efficient Fine-Tuning via Early Pruning Naibin Gu Peng Fu Xiyu Liu Bowen Shen Zheng Lin Weiping Wang 38 6 0 06 Jun 2024
Feature contamination: Neural networks learn uncorrelated features and fail to generalize Tianren Zhang Chujie Zhao Guanyu Chen Yizhou Jiang Feng Chen OOD MLT OODD 77 3 0 05 Jun 2024
Effective Interplay between Sparsity and Quantization: From Theory to Practice Simla Burcu Harma Ayan Chakraborty Elizaveta Kostenok Danila Mishin Dongho Ha ... Martin Jaggi Ming Liu Yunho Oh Suvinay Subramanian Amir Yazdanbakhsh MQ 46 6 0 31 May 2024
$Dual sparse training framework: inducing activation map sparsity via Transformed $\ell1$ regularization$ Dual sparse training framework: inducing activation map sparsity via Transformed $\ell1$ regularization Xiaolong Yu Cong Tian 54 0 0 30 May 2024
Survival of the Fittest Representation: A Case Study with Modular Addition Xiaoman Delores Ding Zifan Carl Guo Eric J. Michaud Ziming Liu Max Tegmark 50 3 0 27 May 2024
Scorch: A Library for Sparse Deep Learning Bobby Yan Alexander J. Root Trevor Gale David Broman Fredrik Kjolstad 38 0 0 27 May 2024
Pruning for Robust Concept Erasing in Diffusion Models Tianyun Yang Juan Cao Chang Xu 40 13 0 26 May 2024
How Do Transformers "Do" Physics? Investigating the Simple Harmonic Oscillator Subhash Kantamneni Ziming Liu Max Tegmark 19 2 0 23 May 2024
Combining Relevance and Magnitude for Resource-Aware DNN Pruning C. Chiasserini F. Malandrino Nuria Molner Zhiqiang Zhao 40 0 0 21 May 2024
Knowledge Graph Pruning for Recommendation Fake Lin Xi Zhu Ziwei Zhao Deqiang Huang Yu Yu Xueying Li Zhi Zheng Tong Xu Enhong Chen 31 0 0 19 May 2024
A Systematic Evaluation of Large Language Models for Natural Language Generation Tasks Xuanfan Ni Piji Li ELM LRM 34 8 0 16 May 2024
Unmasking Efficiency: Learning Salient Sparse Models in Non-IID Federated Learning Riyasat Ohib Bishal Thapaliya Gintare Karolina Dziugaite Jingyu Liu Vince D. Calhoun Sergey Plis FedML 32 1 0 15 May 2024
Neural Network Compression for Reinforcement Learning Tasks Dmitry A. Ivanov D. Larionov Oleg V. Maslennikov V. Voevodin OffRL AI4CE 55 0 0 13 May 2024
Fast and Controllable Post-training Sparsity: Learning Optimal Sparsity Allocation with Global Constraint in Minutes Ruihao Gong Yang Yong Zining Wang Jinyang Guo Xiuying Wei Yuqing Ma Xianglong Liu 54 5 0 09 May 2024
Iterative Filter Pruning for Concatenation-based CNN Architectures Svetlana Pavlitska Oliver Bagge Federico Nicolás Peccia Toghrul Mammadov J. Marius Zöllner VLM 3DPC 48 2 0 04 May 2024
Efficient and Flexible Method for Reducing Moderate-size Deep Neural Networks with Condensation Tianyi Chen Zhi-Qin John Xu 40 1 0 02 May 2024