Robustness and Regularization in Hierarchical Re-Basin
Franke, Heinrich, Lange et al.
This paper takes a closer look at Git Re-Basin, an interesting new approach to merge trained models. We propose a hierarchical model merging scheme that significantly outperforms the standard MergeMany algorithm. With our new algorithm, we find that Re-Basin induces adversarial and perturbation robustness into the merged models, with the effect becoming stronger the more models participate in the hierarchical merging scheme. However, in our experiments Re-Basin induces a much bigger performance drop than reported by the original authors.
본 논문은 새로운 모델 병합 방법인 Git Re-Basin을 심층적으로 연구합니다. 저자들은 표준 MergeMany 알고리즘을 크게 능가하는 계층적 모델 병합 방안을 제안합니다. 새로운 알고리즘을 통해 Re-Basin이 병합된 모델에 대적 견고성과 섭동 견고성을 도입할 수 있으며, 계층적 병합에 참여하는 모델 수가 증가함에 따라 이러한 효과가 더욱 두드러진다는 것을 발견했습니다. 그러나 실험에서 Re-Basin으로 인한 성능 저하는 원래 저자들이 보고한 것보다 훨씬 큽니다.
Ainsworth et al. (2023): Git re-basin 원본 논문, 기초 모델 병합 방법 제안
Entezari et al. (2022): 신경망 선형 모드 연결성에서의 순열 불변성 역할
Frankle et al. (2020): 선형 모드 연결성과 복권 가설의 연관 연구
Moosavi-Dezfooli et al. (2016): DeepFool 대적 공격 방법
Avant & Morgansen (2023): ReLU 네트워크 Lipschitz 상수의 해석적 한계
요약: 본 논문은 Git Re-Basin을 기반으로 중요한 개선을 제안하며, 원본 알고리즘의 이론적 결함을 해결할 뿐만 아니라 모델 병합의 견고성 증강 효과를 발견합니다. 일부 한계가 있지만, 엄밀한 실험 설계와 정직한 결과 보고는 해당 분야의 발전에 가치 있는 기여를 제공합니다.