本文深入研究了Git Re-Basin这一新兴的模型合并方法。作者提出了一种分层模型合并方案,显著优于标准的MergeMany算法。通过新算法,研究发现Re-Basin能够为合并后的模型引入对抗鲁棒性和扰动鲁棒性,且随着参与分层合并的模型数量增加,这种效果变得更加明显。然而,实验中Re-Basin引起的性能下降比原作者报告的要大得多。
给定n个具有相同架构的训练好的神经网络模型Θ₁, Θ₂, ..., Θₙ,目标是将它们合并成一个性能更好或至少不显著下降的单一模型。
阶段0: 原始训练模型 (2^n个模型)
阶段1: 两两合并 → 2^(n-1)个合并模型
阶段2: 继续两两合并 → 2^(n-2)个合并模型
...
阶段n: 最终合并模型 (1个模型)
算法流程:
总结: 这篇论文在Git Re-Basin的基础上提出了重要改进,不仅解决了原算法的理论缺陷,还发现了模型合并的鲁棒性增强效应。尽管存在一些局限性,但其严谨的实验设计和诚实的结果报告为该领域的发展提供了有价值的贡献。