TIES-Merging: Resolving Interference When Merging Models

2 June 2023

Papers citing "TIES-Merging: Resolving Interference When Merging Models"

50 / 221 papers shown

Title
Activation-Guided Consensus Merging for Large Language Models Yuxuan Yao Shuqi Liu Zehua Liu Qintong Li Mingyang Liu Xiongwei Han Zhijiang Guo Han Wu Linqi Song MoMe 9 0 0 20 May 2025
InfiFPO: Implicit Model Fusion via Preference Optimization in Large Language Models Yanggan Gu Zhaoyi Yan Yuanyi Wang Yiming Zhang Qi Zhou Fei Wu Hongxia Yang 7 0 0 20 May 2025
Distilling a speech and music encoder with task arithmetic Fabian Ritter-Gutierrez Yi-Cheng Lin Jui-Chiang Wei Jeremy H.M Wong Eng Siong Chng Nancy F. Chen Hung-yi Lee 8 0 0 19 May 2025
Scalable Strategies for Continual Learning with Replay Truman Hickok CLL 9 0 0 18 May 2025
MINGLE: Mixtures of Null-Space Gated Low-Rank Experts for Test-Time Continual Model Merging Zihuan Qiu Yi Xu Chiyuan He Fanman Meng Linfeng Xu Qi Wu Hongliang Li CLL MoMe 29 0 0 17 May 2025
MergeBench: A Benchmark for Merging Domain-Specialized LLMs Yifei He Siqi Zeng Yuzheng Hu Rui Yang Tong Zhang Han Zhao MoMe ALM 24 0 0 16 May 2025
Mergenetic: a Simple Evolutionary Model Merging Library Adrian Robert Minut Tommaso Mencattini Andrea Santilli Donato Crisostomi Emanuele Rodolà MoMe 25 0 0 16 May 2025
Reinforcement Learning Finetunes Small Subnetworks in Large Language Models Sagnik Mukherjee Lifan Yuan Dilek Hakkani-Tur Hao Peng 7 0 0 16 May 2025
A Modular Approach for Clinical SLMs Driven by Synthetic Data with Pre-Instruction Tuning, Model Merging, and Clinical-Tasks Alignment Jean-Philippe Corbeil Amin Dada Jean-Michel Attendu Asma Ben Abacha Alessandro Sordoni Lucas Caccia François Beaulieu Thomas Lin Jens Kleesiek Paul Vozila LM&MA 17 0 0 15 May 2025
Customizing a Large Language Model for VHDL Design of High-Performance Microprocessors Nicolas Dupuis Ravi Nair Shyam Ramji Sean McClintock Nishant Chauhan Priyanka Nagpal Bart Blaner Ken Valk Leon Stok Ruchir Puri 24 0 0 14 May 2025
CAT Merging: A Training-Free Approach for Resolving Conflicts in Model Merging Wenju Sun Qingyong Li Yangli-ao Geng Boyang Li MoMe 40 0 0 11 May 2025
Bielik 11B v2 Technical Report Krzysztof Ociepa Łukasz Flis Krzysztof Wróbel Adrian Gwoździej Remigiusz Kinas 34 0 0 05 May 2025
Position: Enough of Scaling LLMs! Lets Focus on Downscaling Ayan Sengupta Yash Goel Tanmoy Chakraborty 36 0 0 02 May 2025
Investigating Task Arithmetic for Zero-Shot Information Retrieval Marco Braga Pranav Kasela Alessandro Raganato G. Pasi RALM 69 0 0 01 May 2025
Ada-R1: Hybrid-CoT via Bi-Level Adaptive Reasoning Optimization Hanjun Luo Haiying He Yucheng Wang Jinluan Yang Rui Liu Naiqiang Tan Xiaochun Cao Dacheng Tao Li Shen LRM 31 1 0 30 Apr 2025
X-Cross: Dynamic Integration of Language Models for Cross-Domain Sequential Recommendation Guy Hadad Haggai Roitman Yotam Eshel Bracha Shapira Lior Rokach BDL VLM LRM 47 0 0 29 Apr 2025
Adaptive Helpfulness-Harmlessness Alignment with Preference Vectors Ren-Wei Liang Chin-Ting Hsu Chan-Hung Yu Saransh Agrawal Shih-Cheng Huang Shang-Tse Chen Kuan-Hao Huang Shao-Hua Sun 81 0 0 27 Apr 2025
Param $Δ$ for Direct Weight Mixing: Post-Train Large Language Model at Zero Cost Sheng Cao Mingrui Wu Karthik Prasad Yuandong Tian Zechun Liu MoMe 85 0 0 23 Apr 2025
EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models Ziwen Xu Shuxun Wang Kewei Xu Haoming Xu Mengru Wang Xinle Deng Yunzhi Yao Guozhou Zheng H. Chen Ningyu Zhang KELM LLMSV 214 0 0 21 Apr 2025
Mitigating Parameter Interference in Model Merging via Sharpness-Aware Fine-Tuning Yeoreum Lee Jinwook Jung Sungyong Baik MoMe 45 0 0 20 Apr 2025
Leveraging Submodule Linearity Enhances Task Arithmetic Performance in LLMs Rui Dai Sile Hu Xu Shen Yonggang Zhang Xinmei Tian Jieping Ye MoMe 56 2 0 15 Apr 2025
When is Task Vector Provably Effective for Model Editing? A Generalization Analysis of Nonlinear Transformers Hongkang Li Yihua Zhang Shuai Zhang Ming Wang Sijia Liu Pin-Yu Chen MoMe 71 4 0 15 Apr 2025
Reduction of Supervision for Biomedical Knowledge Discovery Christos Theodoropoulos Andrei Catalin Coman James Henderson Marie-Francine Moens 30 0 0 13 Apr 2025
LoRI: Reducing Cross-Task Interference in Multi-Task Low-Rank Adaptation Juzheng Zhang Jiacheng You Ashwinee Panda Tom Goldstein MoMe 53 1 0 10 Apr 2025
Sculpting Subspaces: Constrained Full Fine-Tuning in LLMs for Continual Learning Nikhil Shivakumar Nayak Krishnateja Killamsetty Ligong Han Abhishek Bhandwaldar Prateek Chanda ... Hao Wang Aldo Pareja Oleg Silkin Mustafa Eyceoz Akash Srivastava CLL 55 0 0 09 Apr 2025
Defending Deep Neural Networks against Backdoor Attacks via Module Switching Weijun Li Ansh Arora Xuanli He Mark Dras Qiongkai Xu AAML MoMe 53 0 0 08 Apr 2025
Exact Unlearning of Finetuning Data via Model Merging at Scale Kevin Kuo Amrith Rajagopal Setlur Kartik Srinivas Aditi Raghunathan Virginia Smith MoMe CLL MU 50 0 0 06 Apr 2025
MASS: MoErging through Adaptive Subspace Selection Donato Crisostomi Alessandro Zirilli Antonio Andrea Gargiulo Maria Sofia Bucarelli Simone Scardapane Fabrizio Silvestri Iacopo Masi Emanuele Rodolà MoMe 45 0 0 06 Apr 2025
BECAME: BayEsian Continual Learning with Adaptive Model MErging Mei Li Yuxiang Lu Qinyan Dai Suizhi Huang Yue Ding Hongtao Lu CLL MoMe 49 0 0 03 Apr 2025
Efficient Model Editing with Task-Localized Sparse Fine-tuning Leonardo Iurada Marco Ciccone Tatiana Tommasi KELM MoMe 56 2 0 03 Apr 2025
Scaling Test-time Compute for Low-resource Languages: Multilingual Reasoning in LLMs Khanh-Tung Tran Barry O'Sullivan Hoang D. Nguyen LRM 37 2 0 02 Apr 2025
AdaMMS: Model Merging for Heterogeneous Multimodal Large Language Models with Unsupervised Coefficient Optimization Yiyang Du Xiaochen Wang C. Chen Jiabo Ye Yiru Wang ... J.N. Zhang Fei Huang Zhifang Sui Maosong Sun Yi Liu MoMe 57 0 0 31 Mar 2025
Breach in the Shield: Unveiling the Vulnerabilities of Large Language Models Runpeng Dai Run Yang Fan Zhou Hongtu Zhu 31 0 0 28 Mar 2025
AdaRank: Adaptive Rank Pruning for Enhanced Model Merging Chanhyuk Lee Jiho Choi Chanryeol Lee Donggyun Kim Seunghoon Hong MoMe 57 0 0 28 Mar 2025
Reinforced Model Merging J. N. Han Jingwen Ye Shunyu Liu Haofei Zhang Jie Song Zunlei Feng Mingli Song MoMe 60 0 0 27 Mar 2025
Unlocking the Value of Decentralized Data: A Federated Dual Learning Approach for Model Aggregation Junyi Zhu Ruicong Yao Taha Ceritli Savas Ozkan Matthew B. Blaschko Eunchung Noh Jeongwon Min Cho Jung Min Mete Ozay FedML 103 0 0 26 Mar 2025
Unlocking Efficient Long-to-Short LLM Reasoning with Model Merging Han Wu Yuxuan Yao Shuqi Liu Zehua Liu Xiaojin Fu Xiongwei Han Xianrui Li Hui-Ling Zhen Tao Zhong Mingxuan Yuan MoMe LRM 78 7 0 26 Mar 2025
Efficient Model Development through Fine-tuning Transfer Pin-Jie Lin Rishab Balasubramanian Fengyuan Liu Nikhil Kandpal Tu Vu 64 1 0 25 Mar 2025
SafeMERGE: Preserving Safety Alignment in Fine-Tuned Large Language Models via Selective Layer-Wise Model Merging Aladin Djuhera S. Kadhe Farhan Ahmed Syed Zawad Holger Boche MoMe 51 1 0 21 Mar 2025
FedAWA: Adaptive Optimization of Aggregation Weights in Federated Learning Using Client Vectors Changlong Shi He Zhao Bingjie Zhang Mingyuan Zhou Dandan Guo Yi Chang 47 0 0 20 Mar 2025
When Domain Generalization meets Generalized Category Discovery: An Adaptive Task-Arithmetic Driven Approach Vaibhav Rathore S. Bagchi Saikat Dutta Sarthak Mehrotra Zsolt Kira Biplab Banerjee OOD 76 1 0 19 Mar 2025
FW-Merging: Scaling Model Merging with Frank-Wolfe Optimization Hao Mark Chen S. Hu Wayne Luk Timothy M. Hospedales Hongxiang Fan MoMe 74 0 0 16 Mar 2025
Charting and Navigating Hugging Face's Model Atlas Eliahu Horwitz Nitzan Kurer Jonathan Kahana Liel Amar Yedid Hoshen 41 0 0 13 Mar 2025
Ensemble Learning for Large Language Models in Text and Code Generation: A Survey Mari Ashiga Wei Jie Fan Wu Vardan K. Voskanyan Fateme Dinmohammadi P. Brookes Jingzhi Gong Zheng Wang 44 0 0 13 Mar 2025
From Task-Specific Models to Unified Systems: A Review of Model Merging Approaches Wei Ruan Tianze Yang Yue Zhou Tianming Liu Jin Lu MoMe 93 0 0 13 Mar 2025
Enhanced Continual Learning of Vision-Language Models with Model Fusion Haoyuan Gao Zicong Zhang Yuqi Wei Linglan Zhao Guilin Li Yuan Li Linghe Kong Weiran Huang CLL VLM 191 0 0 12 Mar 2025
DitHub: A Modular Framework for Incremental Open-Vocabulary Object Detection Chiara Cappellino G. Mancusi Matteo Mosconi Angelo Porrello Simone Calderara Rita Cucchiara ObjD VLM 86 0 0 12 Mar 2025
Whoever Started the Interference Should End It: Guiding Data-Free Model Merging via Task Vectors Runxi Cheng Feng Xiong Yongxian Wei Wanyun Zhu Chun Yuan MoMe 68 0 0 11 Mar 2025
Modular Customization of Diffusion Models via Blockwise-Parameterized Low-Rank Adaptation Mingkang Zhu Xi Chen Zihan Wang Bei Yu Hengshuang Zhao Jiaya Jia MoMe 57 0 0 11 Mar 2025
Task Vector Quantization for Memory-Efficient Model Merging Youngeun Kim Seunghwan Lee Aecheon Jung Bogon Ryu Sungeun Hong MQ MoMe 56 0 0 10 Mar 2025