Bridging Memory Gaps: Scaling Federated Learning for Heterogeneous Clients
Wu, Li, Tian et al.
Federated Learning (FL) enables multiple clients to collaboratively train a shared model while preserving data privacy. However, the high memory demand during model training severely limits the deployment of FL on resource-constrained clients. To this end, we propose \our, a scalable and inclusive FL framework designed to overcome memory limitations through sequential block-wise training. The core idea of \our is to partition the global model into blocks and train them sequentially, thereby reducing training memory requirements. To mitigate information loss during block-wise training, \our introduces a Curriculum Mentor that crafts curriculum-aware training objectives for each block to steer their learning process. Moreover, \our incorporates a Training Harmonizer that designs a parameter co-adaptation training scheme to coordinate block updates, effectively breaking inter-block information isolation. Extensive experiments on both simulation and hardware testbeds demonstrate that \our significantly improves model performance by up to 84.2\%, reduces peak memory usage by up to 50.4\%, and accelerates training by up to 1.9$\times$.
academic
Überbrückung von Speicherlücken: Skalierung des Föderativen Lernens für heterogene Clients
Föderatives Lernen (FL) ermöglicht es mehreren Clients, ein gemeinsames Modell zu trainieren und dabei die Datenschutzbestimmungen einzuhalten. Jedoch beschränken hohe Speicheranforderungen während des Modelltrainings erheblich die Bereitstellung von FL auf ressourcenbeschränkten Clients. Zu diesem Zweck wird SCALEFL vorgestellt, ein skalierbares und inklusives FL-Framework, das Speicherbeschränkungen durch sequenzielles Block-Training überwindet. Die Kernidee von SCALEFL besteht darin, das globale Modell in Blöcke zu unterteilen und diese sequenziell zu trainieren, wodurch der Speicherbedarf beim Training reduziert wird. Um Informationsverluste beim Block-Training zu mildern, führt SCALEFL einen Curriculum-Mentor ein, der für jeden Block lehrplanbewusste Trainingsziele festlegt. Darüber hinaus integriert SCALEFL einen Training-Harmonizer, um ein parametersynergistisches adaptives Trainingsschema zu entwerfen, das die Informationsisolation zwischen Blöcken wirksam durchbricht.
Speicherwand-Problem: Während des Trainings des föderativen Lernens müssen alle Zwischenaktivierungen, Modellgewichte und Optimiererzustände im Speicher behalten werden, was zu hohem Speicherverbrauch führt. Beispielsweise verbraucht das Training von ResNet34 auf ImageNet über 12 GB Speicher, während handelsübliche Mobilgeräte typischerweise nur 4-12 GB RAM haben.
Geräte-Heterogenität: Ressourcenbeschränkte Edge-Geräte können nicht am lokalen Training teilnehmen, was verhindert, dass ihre wertvollen Daten zum globalen Modell beitragen.
Einschränkungen bestehender Methoden:
Modell-heterogenes Training: Erfordert hochwertige öffentliche Datensätze für Wissensdestillation, die in FL schwer zu erhalten sind
Teiltraining: Breitenskalierung zerstört die Modellarchitektur, Tiefenskalierung wird durch die maximale Speicherkapazität des Clients begrenzt
Mit der Zunahme tieferer und breiterer Modellarchitekturen zur Erreichung höherer analytischer Fähigkeiten verschärft sich das Speicherproblem weiter. Dieses Paper zielt darauf ab, ein FL-Framework zu entwerfen, das sowohl die Speicheranforderungen beim Training erheblich reduziert als auch die Modellleistung beibehält.
Vorstellung des SCALEFL-Frameworks: Reduziert die Speicheranforderungen beim Training durch sequenzielles Block-Training erheblich und ermöglicht ressourcenbeschränkten Geräten eine effektive Teilnahme
Entwurf zweier Kernkomponenten: Curriculum-Mentor und Training-Harmonizer prägen synergistisch das Lernverhalten jedes Blocks und fördern kohärentes strukturiertes Merkmalslernen
Umfassende experimentelle Validierung: Demonstriert die Effektivität und Robustheit von SCALEFL auf mehreren Benchmark-Datensätzen
Theoretische Analyse: Bietet Konvergenzanalyse und beweist die theoretische Zuverlässigkeit der Methode
In einem FL-System mit N Clients besitzt jeder Client n einen lokalen Datensatz Dn. Das Ziel besteht darin, ein globales Modell Θ zu trainieren und gleichzeitig die Speicherbeschränkungen aller Clients zu erfüllen.
Problemanalyse: Basierend auf der Informationsengpass-Theorie wird festgestellt, dass sequenzielles Block-Training zu erheblichem Informationsverlust führt. Die dynamische Analyse der nHSIC-Ebene zeigt, dass SBT nach dem Training des ersten Blocks große Mengen an Eingabeinformationen verliert, was verhindert, dass nachfolgende Blöcke kritische Merkmale extrahieren.
nHSIC(X;Zt) die Beibehaltung von Eingabeinformationen misst
nHSIC(Y;Zt) die aufgabenbezogene Relevanz misst
λt und γt je nach Trainingsphase dynamisch angepasst werden
Strategie: In der Anfangsphase werden höhere λt und niedrigere γt verwendet, um die Beibehaltung von Eingabeinformationen zu betonen. In der späteren Phase werden λt schrittweise reduziert und γt erhöht, um zur aufgabenspezifischen Merkmalsextraktion überzugehen.
Begrenzte Vorwärtsinformationsfluss: Nachgelagerte Blöcke beginnen erst mit dem Training, nachdem vorgelagerte Blöcke konvergiert sind
Begrenzte Rückwärtsinformationsfluss: Gradienten sind auf den Block beschränkt, was zu Gradienten-Isolation führt
Parametersynergistisches Adaptationsschema:
Dynamisches Modellwachstum: Dynamische Orchestrierung des Lernprozesses jedes Blocks in jeder Runde, sodass nachgelagerte Blöcke sich in Echtzeit an Aktualisierungen vorgelagerter Blöcke anpassen können
Gleichzeitige Trainingsstrategie: Gleichzeitiges Training des aktuellen Blocks mit den letzten Schichten vorgelagerter Blöcke, um den Gradientenfluss zu fördern
Das Paper zitiert wichtige Arbeiten im FL-Bereich, einschließlich klassischer Methoden wie FedAvg, HeteroFL, FedRolex sowie theoretischer Grundlagen wie Informationsengpass-Theorie und HSIC. Die Literaturzitate sind umfassend und autoritativ.
Gesamtbewertung: Dies ist ein hochqualitatives Federated-Learning-Paper, das eine innovative Lösung für ein kritisches Problem bei der praktischen Bereitstellung bietet. Das Methodendesign ist vernünftig, die experimentelle Validierung ist umfassend, die theoretische Analyse ist vollständig und hat wichtigen akademischen und praktischen Wert.