تتناول هذه الورقة دراسة متعمقة لطريقة دمج النماذج الناشئة المعروفة باسم Git Re-Basin. يقترح المؤلفون مخطط دمج نماذج هرمي يتفوق بشكل ملحوظ على خوارزمية MergeMany القياسية. من خلال الخوارزمية الجديدة، يكتشف الباحثون أن Re-Basin يمكنه إدخال متانة الخصومة والمتانة ضد الاضطراب في النموذج المدمج، وتصبح هذه التأثيرات أكثر وضوحاً مع زيادة عدد النماذج المشاركة في الدمج الهرمي. ومع ذلك، فإن انخفاض الأداء الناجم عن Re-Basin في التجارب أكبر بكثير مما أبلغ عنه المؤلفون الأصليون.
بالنظر إلى n نموذج شبكة عصبية مدربة بنفس البنية Θ₁, Θ₂, ..., Θₙ، الهدف هو دمجها في نموذج واحد بأداء أفضل أو على الأقل بدون انخفاض كبير.
المرحلة 0: نماذج التدريب الأصلية (2^n نموذج)
المرحلة 1: دمج زوجي → 2^(n-1) نموذج مدمج
المرحلة 2: استمرار الدمج الزوجي → 2^(n-2) نموذج مدمج
...
المرحلة n: النموذج المدمج النهائي (نموذج واحد)
تدفق الخوارزمية:
الملخص: تقترح هذه الورقة تحسينات مهمة على أساس Git Re-Basin، لا تحل فقط العيب النظري للخوارزمية الأصلية، بل تكتشف أيضاً تأثير تعزيز المتانة في دمج النماذج. على الرغم من وجود بعض القيود، فإن تصميمها التجريبي الصارم والإبلاغ الصادق عن النتائج يوفران مساهمة قيمة لتطور هذا المجال.