Estimating or Propagating Gradients Through Stochastic Neurons for Conditional Computation

15 August 2013

Aaron Courville

Papers citing "Estimating or Propagating Gradients Through Stochastic Neurons for Conditional Computation"

50 / 1,511 papers shown

Title
ARB-LLM: Alternating Refined Binarizations for Large Language Models Zhiteng Li Xinyu Yan Tianao Zhang Haotong Qin Dong Xie Jiang Tian Zhongchao Shi Linghe Kong Yulun Zhang Xiaokang Yang MQ 97 8 0 04 Oct 2024
Remember and Recall: Associative-Memory-based Trajectory Prediction Hang Guo Yuzhen Zhang Tianci Gao Junning Su Pei Lv Mingliang Xu 87 0 0 03 Oct 2024
FedPeWS: Personalized Warmup via Subnetworks for Enhanced Heterogeneous Federated Learning Nurbek Tastan Samuel Horváth Martin Takáč Karthik Nandakumar FedML 142 0 0 03 Oct 2024
Constraint Guided Model Quantization of Neural Networks Quinten Van Baelen P. Karsmakers MQ 63 0 0 30 Sep 2024
CycleBNN: Cyclic Precision Training in Binary Neural Networks Federico Fontana Romeo Lanzino Anxhelo Diko G. Foresti Luigi Cinque MQ 104 0 0 28 Sep 2024
Student-Oriented Teacher Knowledge Refinement for Knowledge Distillation Yaxin Peng Yaomin Huang Haokun Zhu Jinsong Fan Guixu Zhang 83 1 0 27 Sep 2024
Learning Quantized Adaptive Conditions for Diffusion Models Yuchen Liang Yuchuan Tian Lei Yu Huao Tang Jie Hu Xiangzhong Fang Hanting Chen DiffM 80 0 0 26 Sep 2024
MaskLLM: Learnable Semi-Structured Sparsity for Large Language Models Gongfan Fang Hongxu Yin Saurav Muralidharan Greg Heinrich Jeff Pool Jan Kautz Pavlo Molchanov Xinchao Wang 73 10 0 26 Sep 2024
Mixture of Efficient Diffusion Experts Through Automatic Interval and Sub-Network Selection Alireza Ganjdanesh Yan Kang Yuchen Liu Richard Y. Zhang Zhe Lin Heng Huang DiffM 107 5 0 23 Sep 2024
A Diagonal Structured State Space Model on Loihi 2 for Efficient Streaming Sequence Processing Svea Marie Meyer Philipp Weidel Philipp Plank L. Campos-Macias Sumit Bam Shrestha Philipp Stratmann M. R 69 5 0 23 Sep 2024
R-AIF: Solving Sparse-Reward Robotic Tasks from Pixels with Active Inference and World Models Viet Dung Nguyen Zhizhuo Yang Christopher L. Buckley Alexander Ororbia 89 4 0 21 Sep 2024
Audio Codec Augmentation for Robust Collaborative Watermarking of Speech Synthesis Lauri Juvela Xin Eric Wang 88 4 0 20 Sep 2024
Adaptive Selection of Sampling-Reconstruction in Fourier Compressed Sensing Seongmin Hong Jaehyeok Bae Jongho Lee S. Chun 63 0 0 18 Sep 2024
LASERS: LAtent Space Encoding for Representations with Sparsity for Generative Modeling Xin Li Anand Sarwate 53 0 0 16 Sep 2024
MesonGS: Post-training Compression of 3D Gaussians via Efficient Attribute Transformation Shuzhao Xie Weixiang Zhang Chen Tang Yunpeng Bai Rongwei Lu Shijia Ge Zhi Wang 3DGS 84 15 0 15 Sep 2024
Robust Training of Neural Networks at Arbitrary Precision and Sparsity Chengxi Ye Grace Chu Yanfeng Liu Yichi Zhang Lukasz Lew Andrew G. Howard MQ 58 2 0 14 Sep 2024
S-STE: Continuous Pruning Function for Efficient 2:4 Sparse Pre-training Yuezhou Hu Jun-Jie Zhu Jianfei Chen 129 0 0 13 Sep 2024
Efficient and Reliable Vector Similarity Search Using Asymmetric Encoding with NAND-Flash for Many-Class Few-Shot Learning Hao-Wei Chiang Chi-Tse Huang Hsiang-Yun Cheng P. Tseng Ming-Hsiu Lee An-Yeu Wu 53 0 0 12 Sep 2024
NVRC: Neural Video Representation Compression Ho Man Kwan Ge Gao Fan Zhang Andrew Gower David Bull 74 12 0 11 Sep 2024
FreeAugment: Data Augmentation Search Across All Degrees of Freedom Tom Bekor Niv Nayman Lihi Zelnik-Manor ViT 91 0 0 07 Sep 2024
Sparsifying Parametric Models with L0 Regularization N. Botteghi Urban Fasel 86 1 0 05 Sep 2024
Learning in Order! A Sequential Strategy to Learn Invariant Features for Multimodal Sentiment Analysis Xianbing Zhao Zhuang Li Tao Feng Jianfei Cai Buzhou Tang 102 1 0 05 Sep 2024
GIFT-SW: Gaussian noise Injected Fine-Tuning of Salient Weights for LLMs Maxim Zhelnin Viktor Moskvoretskii Egor Shvetsov Egor Venediktov Mariya Krylova Aleksandr Zuev Evgeny Burnaev 108 3 0 27 Aug 2024
1-Bit FQT: Pushing the Limit of Fully Quantized Training to 1-bit Chang Gao Jianfei Chen Kang Zhao Jiaqi Wang Liping Jing MQ 70 2 0 26 Aug 2024
Recurrent Neural Networks Learn to Store and Generate Sequences using Non-Linear Representations Róbert Csordás Christopher Potts Christopher D. Manning Atticus Geiger GAN 82 21 0 20 Aug 2024
DisMix: Disentangling Mixtures of Musical Instruments for Source-level Pitch and Timbre Manipulation Yin-Jyun Luo K. Cheuk Woosung Choi Toshimitsu Uesaka Keisuke Toyama ... Chieh-Hsin Lai Yuhta Takida Wei-Hsiang Liao Simon Dixon Yuki Mitsufuji CoGe 106 2 0 20 Aug 2024
Obtaining Optimal Spiking Neural Network in Sequence Learning via CRNN-SNN Conversion Jiahao Su Kang You Zekai Xu Weizhi Xu Zhezhi He 85 0 0 18 Aug 2024
Vanilla Gradient Descent for Oblique Decision Trees Subrat Prasad Panda B. Genest Arvind Easwaran Ponnuthurai Nagaratnam Suganthan OffRL 134 1 0 17 Aug 2024
Task-Aware Dynamic Transformer for Efficient Arbitrary-Scale Image Super-Resolution Tianyi Xu Yiji Zhou Xiaotao Hu Kai Zhang Anran Zhang Xingye Qiu Jun Xu 71 0 0 16 Aug 2024
An End-to-End Model for Photo-Sharing Multi-modal Dialogue Generation Peiming Guo Sinuo Liu Yanzhao Zhang Dingkun Long Pengjun Xie Meishan Zhang Hao Fei DiffM 158 1 0 16 Aug 2024
Battery GraphNets : Relational Learning for Lithium-ion Batteries(LiBs) Life Estimation Sakhinana Sagar Srinivas Rajat Kumar Sarkar Venkataramana Runkana 82 0 0 14 Aug 2024
Root Cause Attribution of Delivery Risks via Causal Discovery with Reinforcement Learning Shi Bo 128 7 0 11 Aug 2024
SAMSA: Efficient Transformer for Many Data Modalities Minh Lenhat Viet Anh Nguyen Khoa Nguyen Duong Duc Hieu Dao Huu Hung Truong-Son Hy 111 0 0 10 Aug 2024
Compact 3D Gaussian Splatting for Static and Dynamic Radiance Fields J. Lee Daniel Rho Xiangyu Sun Jong Hwan Ko Eunbyung Park 3DGS 102 12 0 07 Aug 2024
GRAFX: An Open-Source Library for Audio Processing Graphs in PyTorch Sungho Lee Marco A. Martínez-Ramírez Wei-Hsiang Liao Stefan Uhlich Giorgio Fabbro Kyogu Lee Yuki Mitsufuji 91 5 0 06 Aug 2024
HQOD: Harmonious Quantization for Object Detection Long Huang Zhiwei Dong Song-Lu Chen Ruiyao Zhang Shutong Ti Feng Chen Xu-Cheng Yin MQ 53 0 0 05 Aug 2024
STBLLM: Breaking the 1-Bit Barrier with Structured Binary LLMs Peijie Dong Lujun Li Dayou Du Yuhan Chen Zhenheng Tang ... Wei Xue Wenhan Luo Qi-fei Liu Yi-Ting Guo Xiaowen Chu MQ 91 10 0 03 Aug 2024
UniMoT: Unified Molecule-Text Language Model with Discrete Token Representation Jiayuan Zhu Yunli Qi Yongqiang Chen Nan Yin Zhen Wang Quanming Yao 125 11 0 01 Aug 2024
Tamper-Resistant Safeguards for Open-Weight LLMs Rishub Tamirisa Bhrugu Bharathi Long Phan Andy Zhou Alice Gatti ... Andy Zou Dawn Song Bo Li Dan Hendrycks Mantas Mazeika AAML MU 133 63 0 01 Aug 2024
MART: MultiscAle Relational Transformer Networks for Multi-agent Trajectory Prediction Li Duan Junseok Lee Yeonguk Yu G. Aragon-Camarasa Kyoobin Lee 84 7 0 31 Jul 2024
On the Perturbed States for Transformed Input-robust Reinforcement Learning Tung M. Luu Haeyong Kang Matthew Groh Thanh Nguyen Chang D. Yoo OOD AAML OffRL 71 0 0 31 Jul 2024
Pruning Large Language Models with Semi-Structural Adaptive Sparse Training Weiyu Huang Yuezhou Hu Guohao Jian Jun Zhu Jianfei Chen 107 8 0 30 Jul 2024
Efficient Training of Large Language Models on Distributed Infrastructures: A Survey Jiangfei Duan Shuo Zhang Zerui Wang Lijuan Jiang Wenwen Qu ... Dahua Lin Yonggang Wen Xin Jin Tianwei Zhang Peng Sun 159 13 0 29 Jul 2024
FIARSE: Model-Heterogeneous Federated Learning via Importance-Aware Submodel Extraction Feijie Wu Xingchen Wang Yaqing Wang Tianci Liu Lu Su Jing Gao FedML 126 5 0 28 Jul 2024
Mixed Non-linear Quantization for Vision Transformers Gihwan Kim Jemin Lee Sihyeong Park Yongin Kwon Hyungshin Kim MQ 93 0 0 26 Jul 2024
Pixel Embedding: Fully Quantized Convolutional Neural Network with Differentiable Lookup Table Hiroyuki Tokunaga Joel Nicholls Daria Vazhenina Atsunori Kanemura MQ 25 1 0 23 Jul 2024
Revisiting Score Function Estimators for $k$ -Subset Sampling Klas Wijk Ricardo Vinuesa Hossein Azizpour TDI 63 2 0 22 Jul 2024
Decomposition of Neural Discrete Representations for Large-Scale 3D Mapping Minseong Park Suhan Woo Euntai Kim 3DV 60 0 0 22 Jul 2024
Differentiable Product Quantization for Memory Efficient Camera Relocalization Zakaria Laskar Iaroslav Melekhov Assia Benbihi Shuzhe Wang Arno Solin 95 2 0 22 Jul 2024
Jumping Ahead: Improving Reconstruction Fidelity with JumpReLU Sparse Autoencoders Senthooran Rajamanoharan Tom Lieberum Nicolas Sonnerat Arthur Conmy Vikrant Varma János Kramár Neel Nanda 89 105 0 19 Jul 2024