Compression of Neural Machine Translation Models via Pruning

29 June 2016

A. See

Minh-Thang Luong

Christopher D. Manning

MedIm

VLM

ArXiv PDF HTML

Papers citing "Compression of Neural Machine Translation Models via Pruning"

41 / 41 papers shown

Title
The Unreasonable Ineffectiveness of the Deeper Layers Andrey Gromov Kushal Tirumala Hassan Shapourian Paolo Glorioso Daniel A. Roberts 52 83 0 26 Mar 2024
RobWE: Robust Watermark Embedding for Personalized Federated Learning Model Ownership Protection Yang Xu Yunlin Tan Cheng Zhang Kai Chi Peng Sun Wenyuan Yang Ju Ren Hongbo Jiang Yaoxue Zhang FedML 60 3 0 29 Feb 2024
Revisiting Offline Compression: Going Beyond Factorization-based Methods for Transformer Language Models Mohammadreza Banaei Klaudia Bałazy Artur Kasymov R. Lebret Jacek Tabor Karl Aberer OffRL 21 0 0 08 Feb 2023
Compressing Transformer-based self-supervised models for speech processing Tzu-Quan Lin Tsung-Huan Yang Chun-Yao Chang Kuang-Ming Chen Tzu-hsun Feng Hung-yi Lee Hao Tang 40 6 0 17 Nov 2022
Continual Learning of Neural Machine Translation within Low Forgetting Risk Regions Shuhao Gu Bojie Hu Yang Feng CLL 41 12 0 03 Nov 2022
An Embarrassingly Simple Approach for Intellectual Property Rights Protection on Recurrent Neural Networks Zhi Qin Tan H. P. Wong Chee Seng Chan 25 1 0 03 Oct 2022
Don't Complete It! Preventing Unhelpful Code Completion for Productive and Sustainable Neural Code Completion Systems Zhensu Sun Xiaoning Du Fu Song Shangwen Wang Mingze Ni Li Li 29 10 0 13 Sep 2022
Sharp asymptotics on the compression of two-layer neural networks Mohammad Hossein Amani Simone Bombari Marco Mondelli Rattana Pukdee Stefano Rini MLT 27 0 0 17 May 2022
LCS: Learning Compressible Subspaces for Adaptive Network Compression at Inference Time Elvis Nunez Maxwell Horton Anish K. Prabhu Anurag Ranjan Ali Farhadi Mohammad Rastegari 29 4 0 08 Oct 2021
End-to-End Supermask Pruning: Learning to Prune Image Captioning Models J. Tan C. Chan Joon Huang Chuah VLM 51 16 0 07 Oct 2021
Block Pruning For Faster Transformers François Lagunas Ella Charlaix Victor Sanh Alexander M. Rush VLM 21 219 0 10 Sep 2021
MATE: Multi-view Attention for Table Transformer Efficiency Julian Martin Eisenschlos Maharshi Gor Thomas Müller William W. Cohen LMTD 75 95 0 09 Sep 2021
Layer-wise Model Pruning based on Mutual Information Chun Fan Jiwei Li Xiang Ao Fei Wu Yuxian Meng Xiaofei Sun 48 19 0 28 Aug 2021
Pruning-then-Expanding Model for Domain Adaptation of Neural Machine Translation Shuhao Gu Yang Feng Wanying Xie CLL AI4CE 25 27 0 25 Mar 2021
Baseline Pruning-Based Approach to Trojan Detection in Neural Networks P. Bajcsy Michael Majurski AAML 42 8 0 22 Jan 2021
Fully Non-autoregressive Neural Machine Translation: Tricks of the Trade Jiatao Gu X. Kong 31 135 0 31 Dec 2020
Towards Zero-Shot Knowledge Distillation for Natural Language Processing Ahmad Rashid Vasileios Lioutas Abbas Ghaddar Mehdi Rezagholizadeh 21 27 0 31 Dec 2020
Softmax Tempering for Training Neural Machine Translation Models Raj Dabre Atsushi Fujita 28 11 0 20 Sep 2020
Self-Supervised GAN Compression Chong Yu Jeff Pool 9 9 0 03 Jul 2020
schuBERT: Optimizing Elements of BERT A. Khetan Zohar Karnin 28 30 0 09 May 2020
On the Decision Boundaries of Neural Networks: A Tropical Geometry Perspective Motasem Alfarra Adel Bibi Hasan Hammoud M. Gaafar Guohao Li 16 26 0 20 Feb 2020
Embedding Compression with Isotropic Iterative Quantization Siyu Liao Jie Chen Yanzhi Wang Qinru Qiu Bo Yuan MQ 26 12 0 11 Jan 2020
Neural Machine Translation: A Review and Survey Felix Stahlberg 3DV AI4TS MedIm 20 312 0 04 Dec 2019
Fully Quantized Transformer for Machine Translation Gabriele Prato Ella Charlaix Mehdi Rezagholizadeh MQ 13 68 0 17 Oct 2019
Serving Recurrent Neural Networks Efficiently with a Spatial Accelerator Tian Zhao Yaqi Zhang K. Olukotun 27 16 0 26 Sep 2019
Extremely Small BERT Models from Mixed-Vocabulary Training Sanqiang Zhao Raghav Gupta Yang Song Denny Zhou VLM 11 53 0 25 Sep 2019
Reducing Transformer Depth on Demand with Structured Dropout Angela Fan Edouard Grave Armand Joulin 43 584 0 25 Sep 2019
Image Captioning with Sparse Recurrent Neural Network J. Tan Chee Seng Chan Joon Huang Chuah VLM 29 6 0 28 Aug 2019
On the Effectiveness of Low-Rank Matrix Factorization for LSTM Model Compression Genta Indra Winata Andrea Madotto Jamin Shin Elham J. Barezi Pascale Fung 24 28 0 27 Aug 2019
Implicit Deep Learning L. Ghaoui Fangda Gu Bertrand Travacca Armin Askari Alicia Y. Tsai AI4CE 34 176 0 17 Aug 2019
Recurrent Neural Networks: An Embedded Computing Perspective Nesma M. Rezk M. Purnaprajna Tomas Nordstrom Z. Ul-Abdin 43 81 0 23 Jul 2019
Knowledge Distillation For Recurrent Neural Network Language Modeling With Trust Regularization Yangyang Shi M. Hwang X. Lei Haoyu Sheng 31 25 0 08 Apr 2019
Online Embedding Compression for Text Classification using Low Rank Matrix Factorization Anish Acharya Rahul Goel A. Metallinou Inderjit Dhillon 19 58 0 01 Nov 2018
Language-Independent Representor for Neural Machine Translation Long Zhou Yuchen Liu Jiajun Zhang Chengqing Zong Guoping Huang 24 1 0 01 Nov 2018
SNIP: Single-shot Network Pruning based on Connection Sensitivity Namhoon Lee Thalaiyasingam Ajanthan Philip Torr VLM 21 1,172 0 04 Oct 2018
Dynamic Sentence Sampling for Efficient Training of Neural Machine Translation Rui Wang Masao Utiyama Eiichiro Sumita 35 27 0 01 May 2018
Sparse Persistent RNNs: Squeezing Large Recurrent Networks On-Chip Feiwen Zhu Jeff Pool M. Andersch J. Appleyard Fung Xie 19 29 0 26 Apr 2018
The Description Length of Deep Learning Models Léonard Blier Yann Ollivier 32 95 0 20 Feb 2018
Boosting Neural Machine Translation Dakun Zhang Jungi Kim Josep Crego Jean Senellart AI4CE 23 26 0 19 Dec 2016
SYSTRAN's Pure Neural Machine Translation Systems Josep Crego Jungi Kim Guillaume Klein Anabel Rebollo Kathy Yang ... Bo Wang Jin Yang Dakun Zhang Jing Zhou Peter Zoldan 36 125 0 18 Oct 2016
Effective Approaches to Attention-based Neural Machine Translation Thang Luong Hieu H. Pham Christopher D. Manning 218 7,929 0 17 Aug 2015