v1v2 (latest)

Generalization through Memorization: Nearest Neighbor Language Models

1 November 2019

Urvashi Khandelwal

Omer Levy

Dan Jurafsky

Luke Zettlemoyer

M. Lewis

RALM

ArXiv (abs)PDF HTML

Papers citing "Generalization through Memorization: Nearest Neighbor Language Models"

50 / 597 papers shown

Title
Rethinking Privacy in Machine Learning Pipelines from an Information Flow Control Perspective Lukas Wutschitz Boris Köpf Andrew Paverd Saravan Rajmohan Ahmed Salem Shruti Tople Santiago Zanella Béguelin Menglin Xia Victor Rühle 106 14 0 27 Nov 2023
Augmenting Unsupervised Reinforcement Learning with Self-Reference Andrew Zhao Erle Zhu Rui Lu Matthieu Lin Yong-Jin Liu Gao Huang SSL 87 1 0 16 Nov 2023
On Retrieval Augmentation and the Limitations of Language Model Training Ting-Rui Chiang Xinyan Velocity Yu Joshua Robinson Ollie Liu Isabelle Lee Dani Yogatama RALM 61 0 0 16 Nov 2023
Chain-of-Note: Enhancing Robustness in Retrieval-Augmented Language Models Wenhao Yu Hongming Zhang Xiaoman Pan Kaixin Ma Hongwei Wang Dong Yu KELM RALM LRM 132 119 0 15 Nov 2023
PEMA: An Offsite-Tunable Plug-in External Memory Adaptation for Language Models HyunJin Kim Young Jin Kim Jinyeong Bak KELM 98 1 0 14 Nov 2023
Learning to Filter Context for Retrieval-Augmented Generation Zhiruo Wang Jun Araki Zhengbao Jiang Md. Rizwan Parvez Graham Neubig RALM 81 52 0 14 Nov 2023
REST: Retrieval-Based Speculative Decoding Zhenyu He Zexuan Zhong Tianle Cai Jason D. Lee Di He RALM 100 91 0 14 Nov 2023
MetaReVision: Meta-Learning with Retrieval for Visually Grounded Compositional Concept Acquisition Guangyue Xu Parisa Kordjamshidi Joyce Chai 75 2 0 02 Nov 2023
Learn to Refuse: Making Large Language Models More Controllable and Reliable through Knowledge Scope Limitation and Refusal Mechanism Lang Cao 69 22 0 02 Nov 2023
Style Locality for Controllable Generation with kNN Language Models Gilles Nawezi Lucie Flek Charles F Welch RALM 59 0 0 01 Nov 2023
Defining a New NLP Playground Sha Li Chi Han Pengfei Yu Carl Edwards Manling Li ... Yi R. Fung Charles Yu Joel R. Tetreault Eduard H. Hovy Heng Ji 123 5 0 31 Oct 2023
DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain Question Answering over Knowledge Base and Text Wenting Zhao Ye Liu Tong Niu Yao Wan Philip S. Yu Shafiq Joty Yingbo Zhou Semih Yavuz LRM 93 7 0 31 Oct 2023
Knowledge Corpus Error in Question Answering Yejoon Lee Philhoon Oh James Thorne 41 2 0 27 Oct 2023
Nearest Neighbor Search over Vectorized Lexico-Syntactic Patterns for Relation Extraction from Financial Documents P. Rajpoot Ankur P. Parikh 57 1 0 26 Oct 2023
SoK: Memorization in General-Purpose Large Language Models Valentin Hartmann Anshuman Suri Vincent Bindschaedler David Evans Shruti Tople Robert West KELM LLMAG 98 24 0 24 Oct 2023
TRAMS: Training-free Memory Selection for Long-range Language Modeling Haofei Yu Cunxiang Wang Yue Zhang Wei Bi RALM 119 6 0 24 Oct 2023
Multilingual k-Nearest-Neighbor Machine Translation David Stap Christof Monz 76 3 0 23 Oct 2023
Large Search Model: Redefining Search Stack in the Era of LLMs Liang Wang Nan Yang Xiaolong Huang Linjun Yang Rangan Majumder Furu Wei LRM KELM 100 15 0 23 Oct 2023
From Interpolation to Extrapolation: Complete Length Generalization for Arithmetic Transformers Shaoxiong Duan Yining Shi Wei Xu 117 12 0 18 Oct 2023
Emptying the Ocean with a Spoon: Should We Edit Models? Yuval Pinter Michael Elhadad KELM 129 29 0 18 Oct 2023
Heterogenous Memory Augmented Neural Networks Zihan Qiu Zhen Liu Shuicheng Yan Shanghang Zhang Jie Fu 73 0 0 17 Oct 2023
RegaVAE: A Retrieval-Augmented Gaussian Mixture Variational Auto-Encoder for Language Modeling Jingcheng Deng Liang Pang Huawei Shen Xueqi Cheng RALM 103 12 0 16 Oct 2023
Chameleon: a Heterogeneous and Disaggregated Accelerator System for Retrieval-Augmented Language Models Wenqi Jiang Marco Zeller R. Waleffe Torsten Hoefler Gustavo Alonso 130 19 0 15 Oct 2023
InstructRetro: Instruction Tuning post Retrieval-Augmented Pretraining Wei Ping Ming-Yu Liu Lawrence C. McAfee Peng Xu Bo Li Mohammad Shoeybi Bryan Catanzaro RALM 122 54 0 11 Oct 2023
Goodtriever: Adaptive Toxicity Mitigation with Retrieval-augmented Models Luiza Amador Pozzobon Beyza Ermis Patrick Lewis Sara Hooker 120 23 0 11 Oct 2023
How Do Large Language Models Capture the Ever-changing World Knowledge? A Review of Recent Advances Zihan Zhang Meng Fang Lingxi Chen Mohammad-Reza Namazi-Rad Jun Wang KELM 98 24 0 11 Oct 2023
A Meta-Learning Perspective on Transformers for Causal Language Modeling Xinbo Wu Lav Varshney 80 7 0 09 Oct 2023
What do larger image classifiers memorise? Michal Lukasik Vaishnavh Nagarajan A. S. Rawat A. Menon Sanjiv Kumar 103 5 0 09 Oct 2023
Toolink: Linking Toolkit Creation and Using through Chain-of-Solving on Open-Source Model Cheng Qian Chenyan Xiong Zhenghao Liu Zhiyuan Liu LRM 92 18 0 08 Oct 2023
Self-Knowledge Guided Retrieval Augmentation for Large Language Models Yile Wang Peng Li Maosong Sun Yang Liu RALM KELM 88 50 0 08 Oct 2023
RECOMP: Improving Retrieval-Augmented LMs with Compression and Selective Augmentation Fangyuan Xu Weijia Shi Eunsol Choi RALM 117 166 0 06 Oct 2023
Retrieval meets Long Context Large Language Models Peng Xu Ming-Yu Liu Xianchao Wu Lawrence C. McAfee Chen Zhu Zihan Liu Sandeep Subramanian Evelina Bakhturina Mohammad Shoeybi Bryan Catanzaro RALM LRM 97 86 0 04 Oct 2023
Dodo: Dynamic Contextual Compression for Decoder-only LMs Guanghui Qin Corby Rosset Ethan C. Chau Nikhil Rao Benjamin Van Durme 57 11 0 03 Oct 2023
OceanGPT: A Large Language Model for Ocean Science Tasks Zhen Bi Ningyu Zhang Yida Xue Yixin Ou Daxiong Ji Guozhou Zheng Huajun Chen ALM LLMAG 122 33 0 03 Oct 2023
RA-DIT: Retrieval-Augmented Dual Instruction Tuning Xi Lin Xilun Chen Mingda Chen Weijia Shi Maria Lomeli ... Jacob Kahn Gergely Szilvasy Mike Lewis Luke Zettlemoyer Scott Yih RALM 161 157 0 02 Oct 2023
Noise-Tolerant Unsupervised Adapter for Vision-Language Models Eman Ali Dayan Guan Muhammad Haris Khan Abdulmotaleb Elsaddik VLM 72 0 0 26 Sep 2023
Ragas: Automated Evaluation of Retrieval Augmented Generation ES Shahul Jithin James Luis Espinosa-Anke Steven Schockaert 154 205 0 26 Sep 2023
Can Whisper perform speech-based in-context learning? Siyin Wang Chao-Han Huck Yang Ji Wu Chao Zhang 117 29 0 13 Sep 2023
Towards Reliable and Fluent Large Language Models: Incorporating Feedback Learning Loops in QA Systems Dongyub Lee Taesun Whang Chanhee Lee Heuiseok Lim KELM 72 9 0 08 Sep 2023
ImageBind-LLM: Multi-modality Instruction Tuning Jiaming Han Renrui Zhang Wenqi Shao Peng Gao Peng Xu ... Yafei Wen Xiaoxin Chen Xiangyu Yue Hongsheng Li Yu Qiao MLLM 105 125 0 07 Sep 2023
RenAIssance: A Survey into AI Text-to-Image Generation in the Era of Large Model Fengxiang Bie Yibo Yang Zhongzhu Zhou Adam Ghanem Minjia Zhang ... Pareesa Ameneh Golnari David A. Clifton Yuxiong He Dacheng Tao Shuaiwen Leon Song EGVM 105 25 0 02 Sep 2023
RAMP: Retrieval-Augmented MOS Prediction via Confidence-based Dynamic Weighting Haibo Wang Shiwan Zhao Xiguang Zheng Yong Qin 77 13 0 31 Aug 2023
Supervised Contrastive Learning with Nearest Neighbor Search for Speech Emotion Recognition Xuechen Wang Shiwan Zhao Yong Qin 50 6 0 31 Aug 2023
LM-Infinite: Zero-Shot Extreme Length Generalization for Large Language Models Chi Han Qifan Wang Hao Peng Wenhan Xiong Yu Chen Heng Ji Sinong Wang 161 61 0 30 Aug 2023
Cross-Modal Retrieval Meets Inference:Improving Zero-Shot Classification with Cross-Modal Retrieval Seong-Hoon Eom Namgyu Ho Jaehoon Oh Se-Young Yun CLIP VLM 75 0 0 29 Aug 2023
CAGRA: Highly Parallel Graph Construction and Approximate Nearest Neighbor Search for GPUs Hiroyuki Ootomo Akira Naruse Corey J. Nolet Ray Wang Tamas B. Fehér Yuanbo Wang GNN 94 28 0 29 Aug 2023
MEMORY-VQ: Compression for Tractable Internet-Scale Memory Yury Zemlyanskiy Michiel de Jong Luke Vilnis Santiago Ontañón William W. Cohen Sumit Sanghai Joshua Ainslie RALM MQ 80 0 0 28 Aug 2023
LongBench: A Bilingual, Multitask Benchmark for Long Context Understanding Yushi Bai Xin Lv Jiajie Zhang Hong Lyu Jiankai Tang ... Aohan Zeng Lei Hou Yuxiao Dong Jie Tang Juanzi Li LLMAG RALM 128 605 0 28 Aug 2023
With a Little Help from your own Past: Prototypical Memory Networks for Image Captioning Manuele Barraco Sara Sarto Marcella Cornia Lorenzo Baraldi Rita Cucchiara VLM 92 20 0 23 Aug 2023
RSpell: Retrieval-augmented Framework for Domain Adaptive Chinese Spelling Check Siqi Song Qi Lv Lei Geng Ziqiang Cao Guohong Fu 56 5 0 16 Aug 2023