Title
GeoEdit: Geometric Knowledge Editing for Large Language Models Yujie Feng Liming Zhan Zexin Lu Yongxin Xu Xu Chu Yasha Wang Jiannong Cao Philip S. Yu Xiao-Ming Wu KELM 71 0 0 27 Feb 2025
Understanding Layer Significance in LLM Alignment Guangyuan Shi Zexin Lu Xiaoyu Dong Wenlong Zhang Xuanyu Zhang Yujie Feng Xiao-Ming Wu 99 3 0 23 Oct 2024
Parenting: Optimizing Knowledge Selection of Retrieval-Augmented Language Models with Parameter Decoupling and Tailored Tuning Yongxin Xu Ruizhe Zhang Xinke Jiang Yujie Feng Yuzhen Xiao Xinyu Ma Runchuan Zhu Xu Chu Junfeng Zhao Yasha Wang KELM 44 4 0 14 Oct 2024
Recent Advances of Multimodal Continual Learning: A Comprehensive Survey Dianzhi Yu Xinni Zhang Yankai Chen Aiwei Liu Yifei Zhang Philip S. Yu Irwin King VLM CLL 79 12 0 07 Oct 2024
TaSL: Continual Dialog State Tracking via Task Skill Localization and Consolidation Yujie Feng Xu Chu Yongxin Xu Guangyuan Shi Bo Liu Xiao-Ming Wu MoMe CLL 70 7 0 19 Aug 2024
Continual Dialogue State Tracking via Reason-of-Select Distillation Yujie Feng Bo Liu Xiaoyu Dong Zexin Lu Li-Ming Zhan Xiao-Ming Wu Albert Y. S. Lam CLL LRM 91 5 0 19 Aug 2024
A Survey on Model MoErging: Recycling and Routing Among Specialized Experts for Collaborative Learning Prateek Yadav Colin Raffel Mohammed Muqeeth Lucas Caccia Haokun Liu Tianlong Chen Joey Tianyi Zhou Leshem Choshen Alessandro Sordoni MoMe 79 22 0 13 Aug 2024
KnowPO: Knowledge-aware Preference Optimization for Controllable Knowledge Selection in Retrieval-Augmented Language Models Ruizhe Zhang Yongxin Xu Yuzhen Xiao Runchuan Zhu Xinke Jiang Xu Chu Junfeng Zhao Yasha Wang 56 4 0 06 Aug 2024
Mitigating Catastrophic Forgetting in Language Transfer via Model Merging Anton Alexandrov Veselin Raychev Mark Niklas Muller Ce Zhang Martin Vechev Kristina Toutanova MoMe CLL KELM 70 20 0 11 Jul 2024
Unlocking Continual Learning Abilities in Language Models Wenyu Du Shuang Cheng Tongxu Luo Zihan Qiu Zeyu Huang Ka Chun Cheung Reynold Cheng Jie Fu KELM CLL 92 9 0 25 Jun 2024
LLaMA-MoE: Building Mixture-of-Experts from LLaMA with Continual Pre-training Tong Zhu Xiaoye Qu Daize Dong Jiacheng Ruan Jingqi Tong Conghui He Yu Cheng MoE ALM 71 82 0 24 Jun 2024
Revisiting Catastrophic Forgetting in Large Language Model Tuning Hongyu Li Liang Ding Meng Fang Dacheng Tao CLL KELM 69 19 0 07 Jun 2024
Large Language Models Meet NLP: A Survey Libo Qin Qiguang Chen Xiachong Feng Yang Wu Yongheng Zhang Hai-Tao Zheng Min Li Wanxiang Che Philip S. Yu ALM LM&MA ELM LRM 82 54 0 21 May 2024
Rehearsal-Free Modular and Compositional Continual Learning for Language Models Mingyang Wang Heike Adel Lukas Lange Jannik Strötgen Hinrich Schütze KELM CLL 65 15 0 31 Mar 2024
Self-Expansion of Pre-trained Models with Mixture of Adapters for Continual Learning Huiyi Wang Haodong Lu Lina Yao Dong Gong KELM CLL 84 11 0 27 Mar 2024
InsCL: A Data-efficient Continual Learning Paradigm for Fine-tuning Large Language Models with Instructions Yifan Wang Yafei Liu Chufan Shi Haoling Li Chen Chen H. Lu Yujiu Yang CLL 60 33 0 18 Mar 2024
DAM: Dynamic Adapter Merging for Continual Video QA Learning Feng Cheng Ziyang Wang Yi-Lin Sung Yan-Bo Lin Mohit Bansal Gedas Bertasius CLL MoMe 74 10 0 13 Mar 2024
Mitigating Catastrophic Forgetting in Large Language Models with Self-Synthesized Rehearsal Jianheng Huang Leyang Cui Ante Wang Chengyi Yang Xinting Liao Linfeng Song Junfeng Yao Jinsong Su KELM CLL 56 42 0 02 Mar 2024
Analyzing and Reducing Catastrophic Forgetting in Parameter Efficient Tuning Weijieying Ren Xinlong Li Lei Wang Tianxiang Zhao Wei Qin CLL KELM 92 36 0 29 Feb 2024
Continual Learning with Pre-Trained Models: A Survey Da-Wei Zhou Hai-Long Sun Jingyi Ning Han-Jia Ye De-Chuan Zhan CLL KELM 75 74 0 29 Jan 2024
Divide and not forget: Ensemble of selectively trained experts in Continual Learning Grzegorz Rype'sć Sebastian Cygert Valeriya Khan Tomasz Trzciñski Bartosz Zieliñski Bartlomiej Twardowski CLL 49 31 0 18 Jan 2024
HyKGE: A Hypothesis Knowledge Graph Enhanced Framework for Accurate and Reliable Medical LLMs Responses Xinke Jiang Ruizhe Zhang Yongxin Xu Rihong Qiu Yue Fang ... Jinyi Tang Hongxin Ding Xu Chu Junfeng Zhao Yasha Wang RALM 48 21 0 26 Dec 2023
Orthogonal Subspace Learning for Language Model Continual Learning Xiao Wang Tianze Chen Qiming Ge Han Xia Rong Bao Rui Zheng Qi Zhang Tao Gui Xuanjing Huang CLL 145 104 0 22 Oct 2023
Sub-network Discovery and Soft-masking for Continual Learning of Mixed Tasks Zixuan Ke Bing Liu Wenhan Xiong Asli Celikyilmaz Haoran Li CLL 56 6 0 13 Oct 2023
Parameter-Level Soft-Masking for Continual Learning Tatsuya Konishi M. Kurokawa C. Ono Zixuan Ke Gyuhak Kim Bin Liu CLL 51 37 0 26 Jun 2023
TIES-Merging: Resolving Interference When Merging Models Prateek Yadav Derek Tam Leshem Choshen Colin Raffel Joey Tianyi Zhou MoMe 111 295 0 02 Jun 2023
Lifelong Language Pretraining with Distribution-Specialized Experts Wuyang Chen Yan-Quan Zhou Nan Du Yanping Huang James Laudon Zhiwen Chen Claire Cu KELM 68 50 0 20 May 2023
Does Continual Learning Equally Forget All Parameters? Haiyan Zhao Dinesh Manocha Guodong Long Jing Jiang Chengqi Zhang CLL KELM 76 14 0 09 Apr 2023
LLaMA: Open and Efficient Foundation Language Models Hugo Touvron Thibaut Lavril Gautier Izacard Xavier Martinet Marie-Anne Lachaux ... Faisal Azhar Aurelien Rodriguez Armand Joulin Edouard Grave Guillaume Lample ALM PILM 1.4K 13,167 0 27 Feb 2023
Task-Specific Skill Localization in Fine-tuned Language Models A. Panigrahi Nikunj Saunshi Haoyu Zhao Sanjeev Arora MoMe 57 74 0 13 Feb 2023
Progressive Prompts: Continual Learning for Language Models Anastasia Razdaibiedina Yuning Mao Rui Hou Madian Khabsa M. Lewis Amjad Almahairi VLM KELM CLL 92 135 0 29 Jan 2023
PLATON: Pruning Large Transformer Models with Upper Confidence Bound of Weight Importance Qingru Zhang Simiao Zuo Chen Liang Alexander Bukharin Pengcheng He Weizhu Chen T. Zhao 58 80 0 25 Jun 2022
Super-NaturalInstructions: Generalization via Declarative Instructions on 1600+ NLP Tasks Yizhong Wang Swaroop Mishra Pegah Alipoormolabashi Yeganeh Kordi Amirreza Mirzaei ... Chitta Baral Yejin Choi Noah A. Smith Hannaneh Hajishirzi Daniel Khashabi ELM 111 840 0 16 Apr 2022
Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time Mitchell Wortsman Gabriel Ilharco S. Gadre Rebecca Roelofs Raphael Gontijo-Lopes ... Hongseok Namkoong Ali Farhadi Y. Carmon Simon Kornblith Ludwig Schmidt MoMe 116 980 1 10 Mar 2022
Learning to Prompt for Continual Learning Zifeng Wang Zizhao Zhang Chen-Yu Lee Han Zhang Ruoxi Sun Xiaoqi Ren Guolong Su Vincent Perot Jennifer Dy Tomas Pfister CLL VPVLM KELM VLM 84 773 0 16 Dec 2021
Achieving Forgetting Prevention and Knowledge Transfer in Continual Learning Zixuan Ke Bing-Quan Liu Nianzu Ma Hu Xu Lei Shu CLL 217 124 0 05 Dec 2021
LFPT5: A Unified Framework for Lifelong Few-shot Language Learning Based on Prompt Tuning of T5 Chengwei Qin Shafiq Joty CLL 207 103 0 14 Oct 2021
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer Colin Raffel Noam M. Shazeer Adam Roberts Katherine Lee Sharan Narang Michael Matena Yanqi Zhou Wei Li Peter J. Liu AIMat 392 20,114 0 23 Oct 2019
Are Sixteen Heads Really Better than One? Paul Michel Omer Levy Graham Neubig MoE 100 1,060 0 25 May 2019
SuperGLUE: A Stickier Benchmark for General-Purpose Language Understanding Systems Alex Jinpeng Wang Yada Pruksachatkun Nikita Nangia Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 254 2,307 0 02 May 2019
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 1.0K 7,152 0 20 Apr 2018
Riemannian Walk for Incremental Learning: Understanding Forgetting and Intransigence Arslan Chaudhry P. Dokania Thalaiyasingam Ajanthan Philip Torr CLL 89 1,137 0 30 Jan 2018
Gradient Episodic Memory for Continual Learning David Lopez-Paz MarcÁurelio Ranzato VLM CLL 111 2,711 0 26 Jun 2017
Overcoming catastrophic forgetting in neural networks J. Kirkpatrick Razvan Pascanu Neil C. Rabinowitz J. Veness Guillaume Desjardins ... A. Grabska-Barwinska Demis Hassabis Claudia Clopath D. Kumaran R. Hadsell CLL 339 7,498 0 02 Dec 2016
Character-level Convolutional Networks for Text Classification Xiang Zhang Jiaqi Zhao Yann LeCun 260 6,101 0 04 Sep 2015