Estimating or Propagating Gradients Through Stochastic Neurons for Conditional Computation

15 August 2013

Aaron Courville

Papers citing "Estimating or Propagating Gradients Through Stochastic Neurons for Conditional Computation"

50 / 1,519 papers shown

Title
EQO: Exploring Ultra-Efficient Private Inference with Winograd-Based Protocol and Quantization Co-Optimization Wenxuan Zeng Tianshi Xu Meng Li Runsheng Wang MQ 75 0 0 15 Apr 2024
Differentiable Search for Finding Optimal Quantization Strategy Lianqiang Li Chenqian Yan Yefei Chen MQ 86 2 0 10 Apr 2024
End-to-End Rate-Distortion Optimized 3D Gaussian Representation Henan Wang Hanxin Zhu Tianyu He Runsen Feng Jiajun Deng Jiang Bian Zhibo Chen 3DGS 91 34 0 09 Apr 2024
AdaBM: On-the-Fly Adaptive Bit Mapping for Image Super-Resolution Chee Hong Kyoung Mu Lee SupR MQ 50 2 0 04 Apr 2024
Cherry on Top: Parameter Heterogeneity and Quantization in Large Language Models Wanyun Cui Qianle Wang MQ 71 3 0 03 Apr 2024
Mixture-of-Depths: Dynamically allocating compute in transformer-based language models David Raposo Sam Ritter Blake A. Richards Timothy Lillicrap Peter C. Humphreys Adam Santoro MoE 129 89 0 02 Apr 2024
Accelerating Transformer Pre-training with 2:4 Sparsity Yuezhou Hu Kang Zhao Weiyu Huang Jianfei Chen Jun Zhu 138 9 0 02 Apr 2024
Instance-Aware Group Quantization for Vision Transformers Jaehyeon Moon Dohyung Kim Junyong Cheon Bumsub Ham MQ ViT 92 8 0 01 Apr 2024
Embodied Active Defense: Leveraging Recurrent Feedback to Counter Adversarial Patches Lingxuan Wu Xiao Yang Yinpeng Dong Liuwei Xie Hang Su Jun Zhu AAML 81 2 0 31 Mar 2024
Genetic Quantization-Aware Approximation for Non-Linear Operations in Transformers Pingcheng Dong Yonghao Tan Dong Zhang Tianwei Ni Xuejiao Liu ... Xijie Huang Huaiyu Zhu Yun Pan Fengwei An Kwang-Ting Cheng MQ 38 5 0 28 Mar 2024
GLAD: Improving Latent Graph Generative Modeling with Simple Quantization Van Khoa Nguyen Yoann Boget Frantzeska Lavda Alexandros Kalousis 80 2 0 25 Mar 2024
HAC: Hash-grid Assisted Context for 3D Gaussian Splatting Compression Yihang Chen Qianyi Wu Weiyao Lin Mehrtash Harandi Jianfei Cai 117 83 0 21 Mar 2024
Debiasing surgeon: fantastic weights and how to find them Rémi Nahon Ivan Luiz De Moura Matos Van-Tam Nguyen Enzo Tartaglione 82 1 0 21 Mar 2024
Auto-Train-Once: Controller Network Guided Automatic Network Pruning from Scratch Xidong Wu Shangqian Gao Zeyu Zhang Zhenzhen Li Runxue Bao Yanfu Zhang Xiaoqian Wang Heng-Chiao Huang 68 11 0 21 Mar 2024
Advancing Time Series Classification with Multimodal Language Modeling Mingyue Cheng Yiheng Chen Qi Liu Zhiding Liu Yucong Luo AI4TS 89 12 0 19 Mar 2024
HyperVQ: MLR-based Vector Quantization in Hyperbolic Space Nabarun Goswami Yusuke Mukuta Tatsuya Harada 128 4 0 18 Mar 2024
Compact 3D Gaussian Splatting For Dense Visual SLAM Tianchen Deng Yaohui Chen Leyan Zhang Jianfei Yang Shenghai Yuan Danwei W. Wang Weidong Chen 3DGS 141 34 0 17 Mar 2024
Self-Supervised Quantization-Aware Knowledge Distillation Kaiqi Zhao Ming Zhao MQ 98 5 0 17 Mar 2024
AD3: Implicit Action is the Key for World Models to Distinguish the Diverse Visual Distractors Yucen Wang Shenghua Wan Le Gan Shuai Feng De-Chuan Zhan VGen 74 6 0 15 Mar 2024
CAMSIC: Content-aware Masked Image Modeling Transformer for Stereo Image Compression Xinjie Zhang Shenyuan Gao Zhening Liu Jiawei Shao Xingtong Ge Dailan He Tongda Xu Yan Wang Jun Zhang 118 1 0 13 Mar 2024
MoAI: Mixture of All Intelligence for Large Language and Vision Models Byung-Kwan Lee Beomchan Park Chae Won Kim Yonghyun Ro MLLM VLM 138 23 0 12 Mar 2024
Smart-Infinity: Fast Large Language Model Training using Near-Storage Processing on a Real System Hongsun Jang Jaeyong Song Jaewon Jung Jaeyoung Park Youngsok Kim Jinho Lee 54 16 0 11 Mar 2024
Ensemble Quadratic Assignment Network for Graph Matching Haoru Tan Chuang Wang Sitong Wu Xu-Yao Zhang Fei Yin Cheng-Lin Liu 89 3 0 11 Mar 2024
GlossLM: Multilingual Pretraining for Low-Resource Interlinear Glossing Michael Ginn Lindia Tjuatja Taiqi He Enora Rice Graham Neubig Alexis Palmer Lori Levin University of Colorado 98 4 0 11 Mar 2024
Wavelet-Like Transform-Based Technology in Response to the Call for Proposals on Neural Network-Based Image Coding Cunhui Dong Haichuan Ma Haotian Zhang Changsheng Gao Li Li Dong Liu 75 5 0 09 Mar 2024
CoRMF: Criticality-Ordered Recurrent Mean Field Ising Solver Zhenyu Pan Ammar Gilani En-Jui Kuo Zhuo Liu LRM 79 4 0 05 Mar 2024
VQSynery: Robust Drug Synergy Prediction With Vector Quantization Mechanism Jiawei Wu Mingyuan Yan Dianbo Liu 65 2 0 05 Mar 2024
NASH: Neural Architecture Search for Hardware-Optimized Machine Learning Models Mengfei Ji Yuchun Chang Baolin Zhang Zaid Al-Ars 51 0 0 04 Mar 2024
Neural Network Assisted Lifting Steps For Improved Fully Scalable Lossy Image Compression in JPEG 2000 Xinyue Li A. Naman David S. Taubman 46 0 0 04 Mar 2024
ProtoP-OD: Explainable Object Detection with Prototypical Parts Pavlos Rath-Manakidis Frederik Strothmann Tobias Glasmachers Laurenz Wiskott ViT 72 1 0 29 Feb 2024
Exploration of Learned Lifting-Based Transform Structures for Fully Scalable and Accessible Wavelet-Like Image Compression Xinyue Li A. Naman David S. Taubman 63 1 0 29 Feb 2024
Probabilistic Bayesian optimal experimental design using conditional normalizing flows Rafael Orozco Felix J. Herrmann Peng Chen 73 6 0 28 Feb 2024
Understanding Neural Network Binarization with Forward and Backward Proximal Quantizers Yiwei Lu Yaoliang Yu Xinlin Li Vahid Partovi Nia MQ 86 3 0 27 Feb 2024
InterroGate: Learning to Share, Specialize, and Prune Representations for Multi-task Learning B. Bejnordi Gaurav Kumar Amelie Royer Christos Louizos Tijmen Blankevoort Mohsen Ghafoorian CVBM 85 0 0 26 Feb 2024
Edge Detectors Can Make Deep Convolutional Neural Networks More Robust Jin Ding Jie-Chao Zhao Yong-zhi Sun Ping Tan Jia-Wei Wang Ji-en Ma You-tong Fang AAML 98 2 0 26 Feb 2024
Towards Accurate Post-training Quantization for Reparameterized Models Luoming Zhang Yefei He Wen Fei Zhenyu Lou Weijia Wu YangWei Ying Hong Zhou MQ 75 0 0 25 Feb 2024
EncodingNet: A Novel Encoding-based MAC Design for Efficient Neural Network Acceleration Bo Liu Grace Li Zhang Xunzhao Yin Ulf Schlichtmann Bing Li MQ AI4CE 77 0 0 25 Feb 2024
MAPE-PPI: Towards Effective and Efficient Protein-Protein Interaction Prediction via Microenvironment-Aware Protein Embedding Lirong Wu Yijun Tian Yufei Huang Siyuan Li Haitao Lin Nitesh Chawla Stan Z. Li 81 24 0 22 Feb 2024
BESA: Pruning Large Language Models with Blockwise Parameter-Efficient Sparsity Allocation Peng Xu Wenqi Shao Mengzhao Chen Shitao Tang Kai-Chuang Zhang Peng Gao Fengwei An Yu Qiao Ping Luo MoE 120 32 0 18 Feb 2024
Turn Waste into Worth: Rectifying Top- $k$ Router of MoE Zhiyuan Zeng Qipeng Guo Zhaoye Fei Zhangyue Yin Yunhua Zhou Linyang Li Tianxiang Sun Hang Yan Dahua Lin Xipeng Qiu MoE MoMe 67 6 0 17 Feb 2024
BitDistiller: Unleashing the Potential of Sub-4-Bit LLMs via Self-Distillation Dayou Du Yijia Zhang Shijie Cao Jiaqi Guo Ting Cao Xiaowen Chu Ningyi Xu MQ 117 37 0 16 Feb 2024
Symbolic Autoencoding for Self-Supervised Sequence Learning Mohammad Hossein Amani Nicolas Mario Baldwin Amin Mansouri Martin Josifoski Maxime Peyrard Robert West 63 1 0 16 Feb 2024
Squat: Quant Small Language Models on the Edge Xuan Shen Zhenglun Kong Zhenglun Kong Zhaoyang Han Changdi Yang ... Lei Lu Cheng Lyu Zhihao Shu Wei Niu Miriam Leeser MQ 131 22 0 16 Feb 2024
Conditional Information Gain Trellis Ufuk Can Biçici Tuna Han Salih Meral L. Akarun 55 2 0 13 Feb 2024
L4Q: Parameter Efficient Quantization-Aware Fine-Tuning on Large Language Models Hyesung Jeon Yulhwa Kim Jae-Joon Kim MQ 62 5 0 07 Feb 2024
ApiQ: Finetuning of 2-Bit Quantized Large Language Model Baohao Liao Christian Herold Shahram Khadivi Christof Monz CLL MQ 138 15 0 07 Feb 2024
BiLLM: Pushing the Limit of Post-Training Quantization for LLMs Wei Huang Yangdong Liu Haotong Qin Ying Li Shiming Zhang Xianglong Liu Michele Magno Xiaojuan Qi MQ 143 85 0 06 Feb 2024
See More Details: Efficient Image Super-Resolution by Experts Mining Eduard Zamfir Zongwei Wu Nancy Mehta Yulun Zhang Radu Timofte SupR 134 16 0 05 Feb 2024
Quantized Approximately Orthogonal Recurrent Neural Networks Armand Foucault Franck Mamalet Franccois Malgouyres MQ 99 1 0 05 Feb 2024
Variational DAG Estimation via State Augmentation With Stochastic Permutations Edwin V. Bonilla P. Elinas He Zhao Maurizio Filippone V. Kitsios Terry O'Kane CML 93 4 0 04 Feb 2024