v1v2v3 (latest)

Do Language Models Use Their Depth Efficiently?

20 May 2025

Róbert Csordás

Christopher D. Manning

Christopher Potts

ArXiv (abs)PDF HTML Github (23★)

Papers citing "Do Language Models Use Their Depth Efficiently?"

44 / 44 papers shown

Title
Teaching Pretrained Language Models to Think Deeper with Retrofitted Recurrence Sean McLeish Ang Li John Kirchenbauer Dayal Singh Kalra Brian Bartoldson B. Kailkhura Avi Schwarzschild Jonas Geiping Tom Goldstein Micah Goldblum 204 0 0 10 Nov 2025
Attention Sinks and Compression Valleys in LLMs are Two Sides of the Same Coin Enrique Queipo-de-Llano Alvaro Arroyo Federico Barbero Xiaowen Dong Michael M. Bronstein Yann LeCun Ravid Shwartz-Ziv 90 1 0 07 Oct 2025
Task Vectors, Learned Not Extracted: Performance Gains and Mechanistic Insight Haolin Yang Hakaze Cho Kaize Ding Naoya Inoue 120 0 0 29 Sep 2025
All for One: LLMs Solve Mental Math at the Last Token With Information Transferred From Other Tokens Siddarth Mamidanna Daking Rai Ziyu Yao Yilun Zhou LRM 87 1 0 11 Sep 2025
Crosscoding Through Time: Tracking Emergence & Consolidation Of Linguistic Representations Throughout LLM Pretraining Deniz Bayazit Aaron Mueller Antoine Bosselut 120 0 0 05 Sep 2025
Auto-Compressing Networks Vaggelis Dorovatas Georgios Paraskevopoulos Alexandros Potamianos 304 2 0 11 Jun 2025
Transferring Linear Features Across Language Models With Model Stitching Alan Chen Jack Merullo Alessandro Stolfo Ellie Pavlick 176 1 0 07 Jun 2025
GIM: Improved Interpretability for Large Language Models Joakim Edin Róbert Csordás Tuukka Ruotsalo Zhengxuan Wu Maria Maistro Casper L. Christensen Jing-ling Huang Lars Maaløe 290 0 0 23 May 2025
Reasoning Beyond Language: A Comprehensive Survey on Latent Chain-of-Thought Reasoning Xinghao Chen Anhao Zhao Heming Xia Xuan Lu Hanlin Wang Yanjun Chen Wei Zhang Jian Wang W. Li Xiaoyu Shen ReLM LRM 337 15 0 22 May 2025
Layer by Layer: Uncovering Hidden Representations in Language Models Oscar Skean Md Rifat Arefin Dan Zhao Niket Patel Jalal Naghiyev Yann LeCun Ravid Shwartz-Ziv MILM AIFin 436 97 0 04 Feb 2025
The Asymptotic Behavior of Attention in Transformers Álvaro Rodríguez Abella João Pedro Silvestre Paulo Tabuada 292 6 0 03 Dec 2024
NNsight and NDIF: Democratizing Access to Open-Weight Foundation Model Internals Jaden Fiotto-Kaufman Alexander R. Loftus Eric Todd Jannik Brinkmann Caden Juang ... Carla Brodley Arjun Guha Jonathan Bell Byron C. Wallace David Bau 312 6 0 18 Jul 2024
Transformer Layers as Painters Qi Sun Marc Pickett Aakash Kumar Nain Llion Jones AI4CE 481 36 0 12 Jul 2024
The Remarkable Robustness of LLMs: Stages of Inference? Vedang Lad Wes Gurnee Max Tegmark Max Tegmark 414 80 0 27 Jun 2024
MoEUT: Mixture-of-Experts Universal Transformers Róbert Csordás Kazuki Irie Jürgen Schmidhuber Christopher Potts Christopher D. Manning MoE 178 28 0 25 May 2024
The Unreasonable Ineffectiveness of the Deeper Layers Andrey Gromov Kushal Tirumala Hassan Shapourian Paolo Glorioso Daniel A. Roberts 380 152 0 26 Mar 2024
RAVEL: Evaluating Interpretability Methods on Disentangling Language Model Representations Jing-ling Huang Zhengxuan Wu Christopher Potts Mor Geva Atticus Geiger 256 54 0 27 Feb 2024
Successor Heads: Recurring, Interpretable Attention Heads In The WildInternational Conference on Learning Representations (ICLR), 2023 Rhys Gould Euan Ong George Ogden Arthur Conmy LRM 206 63 0 14 Dec 2023
Deja Vu: Contextual Sparsity for Efficient LLMs at Inference TimeInternational Conference on Machine Learning (ICML), 2023 Zichang Liu Jue Wang Tri Dao Wanrong Zhu Binhang Yuan ... Anshumali Shrivastava Ce Zhang Yuandong Tian Christopher Ré Beidi Chen BDL 252 269 0 26 Oct 2023
Copy Suppression: Comprehensively Understanding an Attention Head Callum McDougall Arthur Conmy Cody Rushing Thomas McGrath Neel Nanda MILM 221 53 0 06 Oct 2023
Language Models Represent Space and TimeInternational Conference on Learning Representations (ICLR), 2023 Wes Gurnee Max Tegmark 399 225 0 03 Oct 2023
Neurons in Large Language Models: Dead, N-gram, PositionalAnnual Meeting of the Association for Computational Linguistics (ACL), 2023 Elena Voita Javier Ferrando Christoforos Nalmpantis MILM 328 70 0 09 Sep 2023
MQuAKE: Assessing Knowledge Editing in Language Models via Multi-Hop QuestionsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023 Zexuan Zhong Zhengxuan Wu Christopher D. Manning Christopher Potts Danqi Chen KELM 338 269 0 24 May 2023
GPT-4 Technical Report OpenAI OpenAI OpenAI Josh Achiam Steven Adler Sandhini Agarwal Lama Ahmad ... Shengjia Zhao Tianhao Zheng Juntang Zhuang William Zhuk Barret Zoph LLMAG MLLM 3.5K 20,141 0 15 Mar 2023
Finding Alignments Between Interpretable Causal Variables and Distributed Neural RepresentationsCLEaR (CLEaR), 2023 Atticus Geiger Zhengxuan Wu Christopher Potts Thomas Icard Noah D. Goodman CML 411 135 0 05 Mar 2023
LLaMA: Open and Efficient Foundation Language Models Hugo Touvron Thibaut Lavril Gautier Izacard Xavier Martinet Marie-Anne Lachaux ... Faisal Azhar Aurelien Rodriguez Armand Joulin Edouard Grave Guillaume Lample ALM PILM 2.6K 17,255 0 27 Feb 2023
In-context Learning and Induction Heads Catherine Olsson Nelson Elhage Neel Nanda Nicholas Joseph Nova Dassarma ... Tom B. Brown Jack Clark Jared Kaplan Sam McCandlish C. Olah 534 682 0 24 Sep 2022
Toy Models of Superposition Nelson Elhage Tristan Hume Catherine Olsson Nicholas Schiefer T. Henighan ... Sam McCandlish Jared Kaplan Dario Amodei Martin Wattenberg C. Olah AAML MILM 1.2K 536 0 21 Sep 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language ModelsNeural Information Processing Systems (NeurIPS), 2022 Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 2.1K 14,012 0 28 Jan 2022
Training Verifiers to Solve Math Word Problems K. Cobbe V. Kosaraju Mohammad Bavarian Mark Chen Heewoo Jun ... Jerry Tworek Jacob Hilton Reiichiro Nakano Christopher Hesse John Schulman ReLM OffRL LRM 996 6,547 0 27 Oct 2021
PonderNet: Learning to Ponder Andrea Banino Jan Balaguer Charles Blundell PINN AIMat 578 94 0 12 Jul 2021
Measuring Mathematical Problem Solving With the MATH Dataset Dan Hendrycks Collin Burns Saurav Kadavath Akul Arora Steven Basart Eric Tang Basel Alomair Jacob Steinhardt ReLM FaML 791 3,729 0 05 Mar 2021
Are Neural Nets Modular? Inspecting Functional Modularity Through Differentiable Weight MasksInternational Conference on Learning Representations (ICLR), 2020 Róbert Csordás Sjoerd van Steenkiste Jürgen Schmidhuber 254 109 0 05 Oct 2020
Language Models are Few-Shot LearnersNeural Information Processing Systems (NeurIPS), 2020 Tom B. Brown Benjamin Mann Nick Ryder Melanie Subbiah Jared Kaplan ... Christopher Berner Sam McCandlish Alec Radford Ilya Sutskever Dario Amodei BDL 1.9K 51,164 0 28 May 2020
Null It Out: Guarding Protected Attributes by Iterative Nullspace ProjectionAnnual Meeting of the Association for Computational Linguistics (ACL), 2020 Shauli Ravfogel Yanai Elazar Hila Gonen Michael Twiton Yoav Goldberg 350 453 0 16 Apr 2020
On Layer Normalization in the Transformer ArchitectureInternational Conference on Machine Learning (ICML), 2020 Ruibin Xiong Yunchang Yang Di He Kai Zheng Shuxin Zheng Chen Xing Huishuai Zhang Yanyan Lan Liwei Wang Tie-Yan Liu AI4CE 328 1,195 0 12 Feb 2020
Root Mean Square Layer NormalizationNeural Information Processing Systems (NeurIPS), 2019 Biao Zhang Rico Sennrich 688 1,138 0 16 Oct 2019
How Contextual are Contextualized Word Representations? Comparing the Geometry of BERT, ELMo, and GPT-2 EmbeddingsConference on Empirical Methods in Natural Language Processing (EMNLP), 2019 Kawin Ethayarajh 215 992 0 02 Sep 2019
Analysing Mathematical Reasoning Abilities of Neural Models D. Saxton Edward Grefenstette Felix Hill Pushmeet Kohli LRM 435 479 0 02 Apr 2019
Universal Transformers Mostafa Dehghani Stephan Gouws Oriol Vinyals Jakob Uszkoreit Lukasz Kaiser 430 823 0 10 Jul 2018
Attention Is All You NeedNeural Information Processing Systems (NeurIPS), 2017 Ashish Vaswani Noam M. Shazeer Niki Parmar Jakob Uszkoreit Llion Jones Aidan Gomez Lukasz Kaiser Illia Polosukhin 3DV 2.4K 157,684 0 12 Jun 2017
Axiomatic Attribution for Deep Networks Mukund Sundararajan Ankur Taly Qiqi Yan OOD FAtt 1.2K 6,975 0 04 Mar 2017
Layer Normalization Jimmy Lei Ba J. Kiros Geoffrey E. Hinton 601 11,653 0 21 Jul 2016
Adaptive Computation Time for Recurrent Neural Networks Alex Graves 615 613 0 29 Mar 2016