The Dual Form of Neural Networks Revisited: Connecting Test Time Predictions to Training Patterns via Spotlights of Attention

11 February 2022

Papers citing "The Dual Form of Neural Networks Revisited: Connecting Test Time Predictions to Training Patterns via Spotlights of Attention"

32 / 32 papers shown

Title
Teaching LLMs According to Their Aptitude: Adaptive Reasoning for Mathematical Problem Solving Xin Xu Yan Xu Tianhao Chen Yuchen Yan Chengwu Liu ... Yansen Wang Yichun Yin Yufei Wang Lifeng Shang Qiang Liu LRM 75 2 0 17 Feb 2025
Key-value memory in the brain Samuel J. Gershman Ila Fiete Kazuki Irie 34 7 0 06 Jan 2025
Disentangling Latent Shifts of In-Context Learning Through Self-Training Josip Jukić Jan Snajder 21 0 0 02 Oct 2024
Focused Large Language Models are Stable Many-Shot Learners Peiwen Yuan Shaoxiong Feng Yiwei Li Xinglin Wang Y. Zhang Chuyi Tan Boyuan Pan Heda Wang Yao Hu Kan Li 65 5 0 26 Aug 2024
Learning to (Learn at Test Time): RNNs with Expressive Hidden States Yu Sun Xinhao Li Karan Dalal Jiarui Xu Arjun Vikram ... Xinlei Chen Xiaolong Wang Sanmi Koyejo Tatsunori Hashimoto Carlos Guestrin 71 93 0 05 Jul 2024
Enhancing In-Context Learning Performance with just SVD-Based Weight Pruning: A Theoretical Perspective Xinhao Yao Xiaolin Hu Shenzhi Yang Yong Liu 47 2 0 06 Jun 2024
Exact Conversion of In-Context Learning to Model Weights in Linearized-Attention Transformers Brian K Chen Tianyang Hu Hui Jin Hwee Kuan Lee Kenji Kawaguchi 55 0 0 05 Jun 2024
Locally Differentially Private In-Context Learning Chunyan Zheng Keke Sun Wenhao Zhao Haibo Zhou Lixin Jiang Shaoyang Song Chunlai Zhou 47 2 0 07 May 2024
Exploring the Mystery of Influential Data for Mathematical Reasoning Xinzhe Ni Yeyun Gong Zhibin Gou Yelong Shen Yujiu Yang Nan Duan Weizhu Chen 47 9 0 01 Apr 2024
Universal Link Predictor By In-Context Learning on Graphs Kaiwen Dong Haitao Mao Zhichun Guo Nitesh Chawla 38 5 0 12 Feb 2024
Batch-ICL: Effective, Efficient, and Order-Agnostic In-Context Learning Kaiyi Zhang Ang Lv Yuhan Chen Hansen Ha Tao Xu Rui Yan 25 19 0 12 Jan 2024
One-Shot Learning as Instruction Data Prospector for Large Language Models Yunshui Li Binyuan Hui Xiaobo Xia Jiaxi Yang Min Yang ... Ling-Hao Chen Junhao Liu Tongliang Liu Fei Huang Yongbin Li 38 32 0 16 Dec 2023
In-context Learning and Gradient Descent Revisited Gilad Deutch Nadav Magar Tomer Bar Natan Guy Dar 33 9 0 13 Nov 2023
The Mystery of In-Context Learning: A Comprehensive Survey on Interpretation and Analysis Yuxiang Zhou Jiazheng Li Yanzheng Xiang Hanqi Yan Lin Gui Yulan He 29 14 0 01 Nov 2023
Practical Computational Power of Linear Transformers and Their Recurrent and Self-Referential Extensions Kazuki Irie Róbert Csordás Jürgen Schmidhuber 36 11 0 24 Oct 2023
Whispering LLaMA: A Cross-Modal Generative Error Correction Framework for Speech Recognition S. Radhakrishnan Chao-Han Huck Yang S. Khan Rohit Kumar N. Kiani D. Gómez-Cabrero Jesper N. Tegnér 38 47 0 10 Oct 2023
A Meta-Learning Perspective on Transformers for Causal Language Modeling Xinbo Wu Lav Varshney 37 6 0 09 Oct 2023
Causal Intersectionality and Dual Form of Gradient Descent for Multimodal Analysis: a Case Study on Hateful Memes Yosuke Miyanishi Minh Le Nguyen 34 2 0 19 Aug 2023
Nearest Neighbor Machine Translation is Meta-Optimizer on Output Projection Layer R. Gao Zhirui Zhang Yichao Du Lemao Liu Rui Wang 29 2 0 22 May 2023
Iterative Forward Tuning Boosts In-Context Learning in Language Models Jiaxi Yang Binyuan Hui Min Yang Bailin Wang Bowen Li Binhua Li Fei Huang Yongbin Li 41 16 0 22 May 2023
Accelerating Neural Self-Improvement via Bootstrapping Kazuki Irie Jürgen Schmidhuber 29 1 0 02 May 2023
Improving Visual Question Answering Models through Robustness Analysis and In-Context Learning with a Chain of Basic Questions Jia-Hong Huang Modar Alfadly Guohao Li M. Worring OOD AAML 52 5 0 06 Apr 2023
A Survey on In-context Learning Qingxiu Dong Lei Li Damai Dai Ce Zheng Jingyuan Ma ... Zhiyong Wu Baobao Chang Xu Sun Lei Li Zhifang Sui ReLM AIMat 22 471 0 31 Dec 2022
Why Can GPT Learn In-Context? Language Models Implicitly Perform Gradient Descent as Meta-Optimizers Damai Dai Yutao Sun Li Dong Y. Hao Shuming Ma Zhifang Sui Furu Wei LRM 23 152 0 20 Dec 2022
Learning to Control Rapidly Changing Synaptic Connections: An Alternative Type of Memory in Sequence Processing Artificial Neural Networks Kazuki Irie Jürgen Schmidhuber KELM 24 1 0 17 Nov 2022
Images as Weight Matrices: Sequential Image Generation Through Synaptic Learning Rules Kazuki Irie Jürgen Schmidhuber 37 5 0 07 Oct 2022
Discrete Key-Value Bottleneck Frederik Trauble Anirudh Goyal Nasim Rahaman Michael C. Mozer Kenji Kawaguchi Yoshua Bengio Bernhard Schölkopf CLL 26 22 0 22 Jul 2022
Neural Differential Equations for Learning to Program Neural Nets Through Continuous Learning Rules Kazuki Irie Francesco Faccio Jürgen Schmidhuber AI4TS 38 11 0 03 Jun 2022
BayesPCN: A Continually Learnable Predictive Coding Associative Memory Jason Yoo F. Wood KELM 97 9 0 20 May 2022
Learning in High Dimension Always Amounts to Extrapolation Randall Balestriero J. Pesenti Yann LeCun 44 103 0 18 Oct 2021
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 255 4,805 0 24 Feb 2021
Effective Approaches to Attention-based Neural Machine Translation Thang Luong Hieu H. Pham Christopher D. Manning 218 7,929 0 17 Aug 2015