Non-Vacuous Generalization Bounds for Large Language Models

28 December 2023

Papers citing "Non-Vacuous Generalization Bounds for Large Language Models"

21 / 21 papers shown

Title
Compute-Optimal LLMs Provably Generalize Better With Scale Marc Finzi Sanyam Kapoor Diego Granziol Anming Gu Christopher De Sa J. Zico Kolter Andrew Gordon Wilson 32 0 0 21 Apr 2025
Non-vacuous Generalization Bounds for Deep Neural Networks without any modification to the trained models Khoat Than Dat Phan BDL AAML VLM 60 0 0 10 Mar 2025
Deep Learning is Not So Mysterious or Different Andrew Gordon Wilson 41 2 0 03 Mar 2025
`Generalization is hallucination' through the lens of tensor completions Liang Ze Wong VLM 70 0 0 24 Feb 2025
Model Diffusion for Certifiable Few-shot Transfer Learning Fady Rezk Royson Lee Henry Gouk Timothy M. Hospedales Minyoung Kim 53 0 0 10 Feb 2025
A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs A. S. Rawat Veeranjaneyulu Sadhanala Afshin Rostamizadeh Ayan Chakrabarti Wittawat Jitkrittum ... Rakesh Shivanna Sashank J. Reddi A. Menon Rohan Anil Sanjiv Kumar 33 2 0 24 Oct 2024
A Theoretical Survey on Foundation Models Shi Fu Yuzhu Chen Yingjie Wang Dacheng Tao 28 0 0 15 Oct 2024
Large Language Models as Markov Chains Oussama Zekri Ambroise Odonnat Abdelhakim Benechehab Linus Bleistein Nicolas Boullé I. Redko 48 10 0 03 Oct 2024
Quantifying Generalization Complexity for Large Language Models Zhenting Qi Hongyin Luo Xuliang Huang Zhuokai Zhao Yibo Jiang Xiangjun Fan Himabindu Lakkaraju James Glass LRM ELM 31 5 0 02 Oct 2024
ViDAS: Vision-based Danger Assessment and Scoring Pranav Gupta Advith Krishnan Naman Nanda Ananth Eswar Deeksha Agarwal Pratham Gohil Pratyush Goel 21 1 0 01 Oct 2024
Sample Compression Unleashed: New Generalization Bounds for Real Valued Losses Mathieu Bazinet Valentina Zantedeschi Pascal Germain MLT AI4CE 34 2 0 26 Sep 2024
On the Generalization of Preference Learning with DPO Shawn Im Yixuan Li 52 1 0 06 Aug 2024
Unlocking Tokens as Data Points for Generalization Bounds on Larger Language Models Sanae Lotfi Yilun Kuang Brandon Amos Micah Goldblum Marc Finzi Andrew Gordon Wilson 31 8 0 25 Jul 2024
Just How Flexible are Neural Networks in Practice? Ravid Shwartz-Ziv Micah Goldblum Arpit Bansal C. Bayan Bruss Yann LeCun Andrew Gordon Wilson 43 4 0 17 Jun 2024
Position: Understanding LLMs Requires More Than Statistical Generalization Patrik Reizinger Szilvia Ujváry Anna Mészáros A. Kerekes Wieland Brendel Ferenc Huszár 36 12 0 03 May 2024
Panacea: Pareto Alignment via Preference Adaptation for LLMs Yifan Zhong Chengdong Ma Xiaoyuan Zhang Ziran Yang Haojun Chen Qingfu Zhang Siyuan Qi Yaodong Yang 62 31 0 03 Feb 2024
A Comprehensive Study of Knowledge Editing for Large Language Models Ningyu Zhang Yunzhi Yao Bo Tian Peng Wang Shumin Deng ... Lei Liang Qing Cui Xiao-Jun Zhu Jun Zhou Huajun Chen KELM 47 76 0 02 Jan 2024
Extracting Training Data from Large Language Models Nicholas Carlini Florian Tramèr Eric Wallace Matthew Jagielski Ariel Herbert-Voss ... Tom B. Brown D. Song Ulfar Erlingsson Alina Oprea Colin Raffel MLAU SILM 290 1,815 0 14 Dec 2020
Scaling Laws for Neural Language Models Jared Kaplan Sam McCandlish T. Henighan Tom B. Brown B. Chess R. Child Scott Gray Alec Radford Jeff Wu Dario Amodei 264 4,489 0 23 Jan 2020
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 297 6,959 0 20 Apr 2018
Pac-Bayesian Supervised Classification: The Thermodynamics of Statistical Learning O. Catoni 148 454 0 03 Dec 2007