Mass-Editing Memory in a Transformer

13 October 2022

Papers citing "Mass-Editing Memory in a Transformer"

50 / 412 papers shown

Title
Revealing the Deceptiveness of Knowledge Editing: A Mechanistic Analysis of Superficial Editing Jiakuan Xie Pengfei Cao Yubo Chen Kang Liu Jun Zhao KELM 1 0 0 19 May 2025
Bidirectional LMs are Better Knowledge Memorizers? A Benchmark for Real-world Knowledge Injection Yuwei Zhang W. Yu Shangbin Feng Yifan Zhu Letian Peng Jayanth Srinivasa Gaowen Liu Jingbo Shang KELM 0 0 0 18 May 2025
Learning Auxiliary Tasks Improves Reference-Free Hallucination Detection in Open-Domain Long-Form Generation Chengwei Qin Wenxuan Zhou Karthik Abinav Sankararaman Nanshu Wang Tengyu Xu ... Aditya Tayade Sinong Wang Shafiq R. Joty Han Fang Hao Ma HILM LRM 0 0 0 18 May 2025
Internal Causal Mechanisms Robustly Predict Language Model Out-of-Distribution Behaviors Jing Huang Junyi Tao Thomas F. Icard Diyi Yang Christopher Potts OODD 14 0 0 17 May 2025
NAMET: Robust Massive Model Editing via Noise-Aware Memory Optimization Yanbo Dai Zhenlan Ji Zongjie Li Shuai Wang KELM 0 0 0 17 May 2025
DeltaEdit: Enhancing Sequential Editing in Large Language Models by Controlling Superimposed Noise Ding Cao Yuchen Cai Rongxi Guo X. He Guiquan Liu KELM 43 0 0 12 May 2025
Rethinking Memory in AI: Taxonomy, Operations, Topics, and Future Directions Yiming Du Wenyu Huang Danna Zheng Zhaowei Wang Sébastien Montella Mirella Lapata Kam-Fai Wong Jeff Z. Pan KELM MU 80 2 0 01 May 2025
Memorization and Knowledge Injection in Gated LLMs Xu Pan Ely Hahami Zechen Zhang H. Sompolinsky KELM CLL RALM 104 1 0 30 Apr 2025
SetKE: Knowledge Editing for Knowledge Elements Overlap Yifan Wei Xiaoyan Yu Ran Song Hao Peng Angsheng Li KELM 67 0 0 29 Apr 2025
Improving Reasoning Performance in Large Language Models via Representation Engineering Bertram Højer Oliver Jarvis Stefan Heinrich LRM 83 1 0 28 Apr 2025
A Model Zoo on Phase Transitions in Neural Networks Konstantin Schurholt Léo Meynent Yefan Zhou Haiquan Lu Yaoqing Yang Damian Borth 68 0 0 25 Apr 2025
Exploring How LLMs Capture and Represent Domain-Specific Knowledge Mirian Hipolito Garcia Camille Couturier Daniel Madrigal Diaz Ankur Mallick Anastasios Kyrillidis Robert Sim Victor Rühle Saravan Rajmohan 30 0 0 23 Apr 2025
Functional Abstraction of Knowledge Recall in Large Language Models Zijian Wang Chang Xu KELM 34 0 0 20 Apr 2025
REDEditing: Relationship-Driven Precise Backdoor Poisoning on Text-to-Image Diffusion Models Chongye Guo Jinhu Fu Fan Zhang Kun Wang Guorui Feng 39 0 0 20 Apr 2025
SHA256 at SemEval-2025 Task 4: Selective Amnesia -- Constrained Unlearning for Large Language Models via Knowledge Isolation Saransh Agrawal Kuan-Hao Huang MU KELM 54 0 0 17 Apr 2025
GRAIL: Gradient-Based Adaptive Unlearning for Privacy and Copyright in LLMs Kun-Woo Kim Ji-Hoon Park Ju-Min Han Seong-Whan Lee MU PILM 62 0 0 17 Apr 2025
Memorization vs. Reasoning: Updating LLMs with New Knowledge Aochong Oliver Li Tanya Goyal KELM 50 1 0 16 Apr 2025
Can We Edit LLMs for Long-Tail Biomedical Knowledge? Xinhao Yi Jake Lever Kevin Bryson Zaiqiao Meng KELM 22 0 0 14 Apr 2025
Weight-of-Thought Reasoning: Exploring Neural Network Weights for Enhanced LLM Reasoning Saif Punjwani Larry Heck LRM 36 0 0 14 Apr 2025
Knowledge-Instruct: Effective Continual Pre-training from Limited Data using Instructions O. Ovadia Meni Brief Rachel Lemberg Eitam Sheetrit CLL KELM 47 0 0 08 Apr 2025
Steering off Course: Reliability Challenges in Steering Language Models Patrick Queiroz Da Silva Hari Sethuraman Dheeraj Rajagopal Hannaneh Hajishirzi Sachin Kumar LLMSV 29 1 0 06 Apr 2025
From Text to Graph: Leveraging Graph Neural Networks for Enhanced Explainability in NLP Fabio Yáñez-Romero Andrés Montoyo Armando Suárez Yoan Gutiérrez Ruslan Mitkov 46 0 0 02 Apr 2025
If an LLM Were a Character, Would It Know Its Own Story? Evaluating Lifelong Learning in LLMs Siqi Fan Xiusheng Huang Yiqun Yao Xuezhi Fang Kang Liu Peng Han Shuo Shang Aixin Sun Yequan Wang LLMAG 45 0 0 30 Mar 2025
Leaking LoRa: An Evaluation of Password Leaks and Knowledge Storage in Large Language Models Ryan Marinelli Magnus Eckhoff PILM 52 0 0 29 Mar 2025
Skip-Vision: Efficient and Scalable Acceleration of Vision-Language Models via Adaptive Token Skipping Weili Zeng Ziyuan Huang Kaixiang Ji Yichao Yan VLM 42 1 0 26 Mar 2025
ADS-Edit: A Multimodal Knowledge Editing Dataset for Autonomous Driving Systems Chenxi Wang Jizhan Fang Xiang Chen Bozhong Tian Ziwen Xu H. Chen N. Zhang KELM 96 0 0 26 Mar 2025
LLM Braces: Straightening Out LLM Predictions with Relevant Sub-Updates Ying Shen Lifu Huang 52 1 0 20 Mar 2025
CaKE: Circuit-aware Editing Enables Generalizable Knowledge Learners Yunzhi Yao Jizhan Fang Jia-Chen Gu N. Zhang Shumin Deng H. Chen Nanyun Peng KELM 59 1 0 20 Mar 2025
Exploring Model Editing for LLM-based Aspect-Based Sentiment Classification Shichen Li Zhongqing Wang Zheyu Zhao Yue Zhang Peifeng Li KELM 56 0 0 19 Mar 2025
Resolving UnderEdit & OverEdit with Iterative & Neighbor-Assisted Model Editing Bhiman Kumar Baghel Scott M. Jordan Zheyuan Ryan Shi Xiang Lorraine Li KELM 52 0 0 14 Mar 2025
Safe Vision-Language Models via Unsafe Weights Manipulation Moreno DÍncà E. Peruzzo Xingqian Xu Humphrey Shi N. Sebe Massimiliano Mancini MU 55 0 0 14 Mar 2025
Taming Knowledge Conflicts in Language Models Gaotang Li Yuzhong Chen Hanghang Tong KELM 49 1 0 14 Mar 2025
TruthPrInt: Mitigating LVLM Object Hallucination Via Latent Truthful-Guided Pre-Intervention Jinhao Duan Fei Kong Hao-Ran Cheng James Diffenderfer B. Kailkhura Lichao Sun Xiaofeng Zhu Xiaoshuang Shi Kaidi Xu 149 0 0 13 Mar 2025
HyperDAS: Towards Automating Mechanistic Interpretability with Hypernetworks Jiuding Sun Jing Huang Sidharth Baskaran Karel DÓosterlinck Christopher Potts Michael Sklar Atticus Geiger AI4CE 71 1 0 13 Mar 2025
BiasEdit: Debiasing Stereotyped Language Models via Model Editing Xin Xu Wei Xu N. Zhang Julian McAuley KELM 39 0 0 11 Mar 2025
Exploiting Edited Large Language Models as General Scientific Optimizers Qitan Lv T. Liu Haoyu Wang 41 0 0 08 Mar 2025
Understanding the Limits of Lifelong Knowledge Editing in LLMs Lukas Thede Karsten Roth Matthias Bethge Zeynep Akata Tom Hartvigsen KELM CLL 75 2 0 07 Mar 2025
From Style to Facts: Mapping the Boundaries of Knowledge Injection with Finetuning Eric Zhao Pranjal Awasthi Nika Haghtalab 58 0 0 07 Mar 2025
Knowledge Updating? No More Model Editing! Just Selective Contextual Reasoning Guoxiu He Xin Song Aixin Sun KELM 68 3 0 07 Mar 2025
Effectively Steer LLM To Follow Preference via Building Confident Directions Bingqing Song Boran Han Shuai Zhang Hao Wang Haoyang Fang Bonan Min Yuyang Wang Mingyi Hong LLMSV 54 0 0 04 Mar 2025
MindBridge: Scalable and Cross-Model Knowledge Editing via Memory-Augmented Modality Shuaike Li Kai Zhang Qiang Liu Enhong Chen KELM 78 1 0 04 Mar 2025
Machine Learners Should Acknowledge the Legal Implications of Large Language Models as Personal Data Henrik Nolte Michèle Finck Kristof Meding AILaw PILM 79 0 0 03 Mar 2025
SAKE: Steering Activations for Knowledge Editing Marco Scialanga Thibault Laugel Vincent Grari Marcin Detyniecki KELM LLMSV 77 1 0 03 Mar 2025
Unlocking Efficient, Scalable, and Continual Knowledge Editing with Basis-Level Representation Fine-Tuning Tianci Liu R. Li Yunzhe Qi Hui Liu X. Tang ... Qingyu Yin Monica Cheng Jun Huan Haoyu Wang Jing Gao KELM 46 2 0 01 Mar 2025
Capability Localization: Capabilities Can be Localized rather than Individual Knowledge Xiusheng Huang Jiaxiang Liu Yequan Wang Jun Zhao Kang Liu 54 0 0 28 Feb 2025
GeoEdit: Geometric Knowledge Editing for Large Language Models Yujie Feng Liming Zhan Zexin Lu Yongxin Xu Xu Chu Yasha Wang Jiannong Cao Philip S. Yu Xiao-Ming Wu KELM 53 0 0 27 Feb 2025
MMKE-Bench: A Multimodal Editing Benchmark for Diverse Visual Knowledge Yuntao Du Kailin Jiang Zhi Gao Chenrui Shi Zilong Zheng Siyuan Qi Qing Li KELM 73 2 0 27 Feb 2025
A Causal Lens for Evaluating Faithfulness Metrics Kerem Zaman Shashank Srivastava 68 0 0 26 Feb 2025
Norm Growth and Stability Challenges in Localized Sequential Knowledge Editing Akshat Gupta Christine Fang Atahan Ozdemir Maochuan Lu Ahmed Alaa Thomas Hartvigsen Gopala Anumanchipalli KELM 38 0 0 26 Feb 2025
Constraining Sequential Model Editing with Editing Anchor Compression Hao-Xiang Xu Jun-Yu Ma Zhen-Hua Ling Ningyu Zhang Jia-Chen Gu KELM 52 1 0 25 Feb 2025