2025-11-24T04:07:17.991345

Personalized Federated Fine-Tuning of Vision Foundation Models for Healthcare

Tupper, Gagné
Foundation models open up new possibilities for the use of AI in healthcare. However, even when pre-trained on health data, they still need to be fine-tuned for specific downstream tasks. Furthermore, although foundation models reduce the amount of training data required to achieve good performance, obtaining sufficient data is still a challenge. This is due, in part, to restrictions on sharing and aggregating data from different sources to protect patients' privacy. One possible solution to this is to fine-tune foundation models via federated learning across multiple participating clients (i.e., hospitals, clinics, etc.). In this work, we propose a new personalized federated fine-tuning method that learns orthogonal LoRA adapters to disentangle general and client-specific knowledge, enabling each client to fully exploit both their own data and the data of others. Our preliminary results on real-world federated medical imaging tasks demonstrate that our approach is competitive against current federated fine-tuning methods.
academic

Personalisierte föderierte Feinabstimmung von Vision Foundation Models für das Gesundheitswesen

Grundlegende Informationen

  • Paper-ID: 2510.12741
  • Titel: Personalisierte föderierte Feinabstimmung von Vision Foundation Models für das Gesundheitswesen
  • Autoren: Adam Tupper, Christian Gagné (Université Laval, Mila - Quebec AI Institute)
  • Klassifizierung: cs.CV, cs.DC
  • Veröffentlichungskonferenz: SMASH 2025
  • Paper-Link: https://arxiv.org/abs/2510.12741

Zusammenfassung

Foundation Models eröffnen neue Möglichkeiten für medizinische KI-Anwendungen, erfordern aber auch nach dem Vortraining auf Gesundheitsdaten eine Feinabstimmung für spezifische nachgelagerte Aufgaben. Aufgrund von Datenschutzbeschränkungen bleibt die gemeinsame Nutzung und Aggregation von Daten aus verschiedenen Quellen eine Herausforderung. Dieser Artikel stellt eine neue personalisierte föderierte Feinabstimmungsmethode FedOPAL vor, die durch das Erlernen orthogonaler LoRA-Adapter das allgemeine Wissen und das clientspezifische Wissen entkoppelt, sodass jeder Client seine eigenen Daten und die Daten anderer Clients vollständig nutzen kann. Vorläufige Ergebnisse bei realen föderiert medizinischen Bildgebungsaufgaben zeigen, dass die Methode mit aktuellen föderiert Feinabstimmungsmethoden konkurrenzfähig ist.

Forschungshintergrund und Motivation

Kernprobleme

  1. Datenschutzbeschränkungen: Medizinische Daten können aufgrund strenger Datenschutzbestimmungen nicht zentral aggregiert werden
  2. Datenmangel: Annotierte Datensätze in der medizinischen Bildgebung sind selten und teuer zu beschaffen
  3. Datenheterogenität: Es bestehen erhebliche Unterschiede in der Datenverteilung zwischen verschiedenen medizinischen Einrichtungen
  4. Kommunikationsaufwand: Föderiertes Lernen großer Foundation Models ist mit enormen Kommunikationskosten verbunden

Forschungsmotivation

  • Obwohl föderiertes Lernen Datenschutzprobleme löst, führt es bei der Feinabstimmung von Foundation Models zu neuen Herausforderungen
  • Bestehende Methoden behandeln das Problem der Datenheterogenität zwischen Clients nicht wirksam
  • Es ist eine föderiert Feinabstimmungsmethode erforderlich, die sowohl globales Wissen nutzt als auch Personalisierung bewahrt

Kernbeiträge

  1. Vorstellung der FedOPAL-Methode: Ein neuartiges personalisiertes föderiert Feinabstimmungs-Framework, das orthogonale LoRA-Adapter zur Trennung von allgemeinem und clientspezifischem Wissen verwendet
  2. Duales Orthogonalisierungsmechanismus: Zwei Methoden wurden entwickelt – Gewichtsorthogonalisierung (FedOPAL-W) und Darstellungsorthogonalisierung (FedOPAL-R)
  3. Validierung mit echten medizinischen Daten: Wirksamkeit der Methode auf zwei anspruchsvollen medizinischen Bildgebungsdatensätzen (Fed-ISIC 2019 und Camelyon17-WILDS) validiert
  4. Systematische Vergleichsanalyse: Umfassender Vergleich mit mehreren neuesten LoRA-basierten föderiert Lernmethoden

Methodische Details

Aufgabendefinition

Bei föderiert medizinischen Bildgebungsklassifizierungsaufgaben arbeiten mehrere medizinische Einrichtungen (Clients) zusammen, um ein gemeinsames Vision Foundation Model zu trainieren, während sie ihre Datenschutzbestimmungen schützen und die Heterogenität der Datenverteilung bewältigen.

Modellarchitektur

Duales Adapter-Design

FedOPAL verwendet eine duale LoRA-Adapter-Architektur:

  • Globaler Adapter: Von allen Clients gemeinsam aktualisiert, erlernt allgemeine Merkmale
  • Persönlicher Adapter: Privat für jeden Client, erlernt clientspezifische Merkmale

Für vortrainierte Gewichtsmatrix W0Rd×kW_0 \in \mathbb{R}^{d \times k} lautet die Aktualisierungsformel: ΔW=W0+BglobalAglobal+BpersonalApersonal\Delta W = W_0 + B_{global}A_{global} + B_{personal}A_{personal}

Orthogonalisierungsmechanismus

1. Gewichtsorthogonalisierung (FedOPAL-W) Basierend auf der O-LoRA-Methode werden orthogonale Beschränkungen auf Adapter-Gewichte angewendet: \ell_{orth} = \frac{1}{N} \sum_{i=1}^{N} |(A_i_{global})^T A_i_{personal}|

2. Darstellungsorthogonalisierung (FedOPAL-R) Beschränkt direkt die erlernten Darstellungen und minimiert die Kosinus-Ähnlichkeit: orth=1NBi=1Nj=1Bcos(zglobali,j,zpersonali,j)\ell_{orth} = \frac{1}{NB} \sum_{i=1}^{N} \sum_{j=1}^{B} |\cos(z_{global}^{i,j}, z_{personal}^{i,j})|

Gesamtverlustfunktion: total=task+λorth\ell_{total} = \ell_{task} + \lambda \ell_{orth}

Technische Innovationen

  1. Wissensentkopplungsmechanismus: Erzwingt durch orthogonale Beschränkungen, dass zwei Adapter unterschiedliche Merkmalsteilräume erlernen
  2. Duale Orthogonalisierung: Bietet Orthogonalisierungsstrategien auf Gewichts- und Darstellungsebene
  3. Föderierte Personalisierung: Ermöglicht Client-Personalisierung bei Beibehaltung globaler Zusammenarbeit

Experimentelle Einrichtung

Datensätze

1. Fed-ISIC 2019

  • Umfang: 6 Clients aus medizinischen Einrichtungen in Australien, Österreich, USA und Spanien
  • Aufgabe: Hautläsionen-Klassifizierung (9 Diagnosekategorien)
  • Merkmale: Signifikante Labelverschiebung und ungleiche Stichprobengrößen

2. Camelyon17-WILDS

  • Umfang: 5 Clients (Krankenhäuser), jeweils 7-10 Patienten pro Client
  • Aufgabe: Patch-Level-Klassifizierung von Brustkrebs-Metastasen in Lymphknotenschnitten
  • Merkmale: Farbveränderungen aufgrund von Unterschieden in Färbeverfahren

Bewertungsmetriken

Verwendung der ausgeglichenen Genauigkeit (balanced accuracy) zur Behandlung von Klassenunausgeglichenheit

Vergleichsmethoden

  • FedIT: Training einzelner globaler Adapter A- und B-Matrizen
  • FFA-LoRA: Fixierte A-Matrix, nur B-Matrix-Training
  • FedSA: Nur A-Matrix-Sharing, personalisierte B-Matrix
  • FedDPA: Training unabhängiger globaler und persönlicher Adapter
  • FedPAL: Baseline-Methode ohne orthogonale Beschränkung

Implementierungsdetails

  • Modell: ViT-Tiny (9,7 Millionen Parameter), ImageNet-21K-Vortraining
  • Optimierer: SGD, Lernrate η ∈ {1e-4, 5e-4, 1e-3, 5e-3, 1e-2}
  • Föderierte Einstellung: FedAvg, 100% Client-Beteiligung, 1 Epoch lokales Training pro Runde

Experimentelle Ergebnisse

Hauptergebnisse

Fed-ISIC 2019 Aufgabenergebnisse:

  • FedOPAL-R erreicht beste durchschnittliche Rangfolge (3,17) mit durchschnittlicher Genauigkeit von 0,726
  • FedPAL-Baseline zeigt gute Leistung (durchschnittliche Rangfolge 3,50, Genauigkeit 0,726)
  • Bei Client 2 erreicht FedPAL höchste Genauigkeit von 0,931

Camelyon17-WILDS Aufgabenergebnisse:

  • FedDPA zeigt beste Leistung (durchschnittliche Rangfolge 2,40, Genauigkeit 0,909)
  • FedOPAL-R erreicht zweithöchste durchschnittliche Genauigkeit von 0,870
  • Alle föderiert Methoden nähern sich zentralisierter Trainingsleistung (0,905) an

Wichtige Erkenntnisse

  1. Methodische Konkurrenzfähigkeit: FedOPAL-Methode ist mit bestehenden State-of-the-Art-Methoden konkurrenzfähig
  2. Konsistenzprobleme: Keine einzelne Methode zeigt durchgehend beste Leistung auf allen Clients und Aufgaben
  3. Orthogonalisierungseffekt: Darstellungsorthogonalisierung (FedOPAL-R) ist typischerweise besser als Gewichtsorthogonalisierung (FedOPAL-W)
  4. Verbesserungsspielraum: Ergebnisse zeigen weiteres Verbesserungspotenzial

Verwandte Arbeiten

Föderiertes Lernen und LoRA-Kombination

  • Parametereffizientz: LoRA reduziert Kommunikationsaufwand und Rechenbedarf
  • Personalisierungsmethoden: Teilweise Modellpersonalisierung lindert Datenheterogenität
  • Neueste Entwicklungen: FedDPA, FedSA und andere Methoden erforschen verschiedene Personalisierungsstrategien

Orthogonale Lernmethoden

  • O-LoRA: Verwendet orthogonale Beschränkungen im kontinuierlichen Lernen zur Vermeidung katastrophalen Vergessens
  • Teilraumlernens: Beschränkt das Erlernen unterschiedlicher Merkmalsteilräume

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. FedOPAL entkoppelt erfolgreich allgemeines und spezifisches Wissen durch orthogonale LoRA-Adapter
  2. Die Methode zeigt auf echten medizinischen Datensätzen Konkurrenzfähigkeit mit bestehenden Methoden
  3. Darstellungsebenen-Orthogonalisierung ist wirksamer als Gewichtsebenen-Orthogonalisierung

Einschränkungen

  1. Leistungskonsistenz: Methode zeigt inkonsistente Leistung über verschiedene Clients und Aufgaben hinweg
  2. Vorläufige Ergebnisse: Aktuelle Ergebnisse sind noch vorläufig und erfordern tiefere Analyse
  3. Hyperparameter-Empfindlichkeit: Die Wahl des λ-Parameters kann die Methodenleistung beeinflussen
  4. Rechenaufwand: Duales Adapter-Design erhöht Rechenkomplexität

Zukünftige Richtungen

  1. Adapter-Rang-Optimierung: Erforschung optimaler Rangeinstellungen für globale und lokale Adapter
  2. Verbesserung der Wissensseparation: Verfeinerung der Trennung von clientunabhängigem und clientspezifischem Wissen
  3. Erweiterte Bewertung: Bewertung auf größeren Modellen und mehr Aufgaben
  4. Theoretische Analyse: Bereitstellung theoretischer Garantien und Konvergenzanalyse der Methode

Tiefgehende Bewertung

Stärken

  1. Hohe Innovativität: Erstmals orthogonale Beschränkungen in föderiert LoRA-Feinabstimmung eingeführt, neuartige Idee
  2. Hoher praktischer Wert: Direkt auf praktische Anforderungen und Herausforderungen der medizinischen KI ausgerichtet
  3. Vollständige Methode: Bietet zwei Orthogonalisierungsstrategien auf verschiedenen Ebenen
  4. Umfassende Experimente: Systematische Bewertung auf echten medizinischen Datensätzen

Mängel

  1. Schwache theoretische Grundlagen: Mangel an theoretischer Analyse der Wirksamkeit orthogonaler Beschränkungen
  2. Unzureichende Experimenttiefe: Fehlende detaillierte Ablationsstudien und Parametersensitivitätsanalyse
  3. Begrenzte Leistungsverbesserung: Verbesserungen gegenüber bestehenden Methoden sind marginal
  4. Begrenzte Bewertungsreichweite: Bewertung nur auf zwei Datensätzen durchgeführt

Auswirkungen

  1. Akademischer Beitrag: Bietet neue Perspektiven für das Schnittstellenfeld föderiertes Lernen und medizinische KI
  2. Praktische Aussichten: Potenziell anwendbar in realen föderiert medizinischen Lernszenarien
  3. Skalierbarkeit: Methodisches Framework ist auf andere Domänen und Aufgaben erweiterbar

Anwendungsszenarien

  1. Multi-Institutionelle medizinische Zusammenarbeit: Geeignet für föderiert Lernszenarien zwischen Krankenhäusern
  2. Datenschutzsensitive Aufgaben: Geeignet für Anwendungen mit strengem Datenschutz
  3. Umgebung mit Datenheterogenität: Besonders geeignet für Szenarien mit großen Unterschieden in der Clientdatenverteilung

Literaturverzeichnis

Dieser Artikel bezieht sich hauptsächlich auf wichtige Arbeiten in den Bereichen föderiertes Lernen (McMahan et al., 2017), LoRA-Adapter (Hu et al., 2022) und orthogonales Lernen (Wang et al., 2023) und bietet eine neue Lösungsansatz für das Problem der föderiert Feinabstimmung in der medizinischen KI.


Zusammenfassung: Dies ist eine innovative Arbeit, die sich mit Herausforderungen des föderiert Lernens in der medizinischen KI befasst. Durch orthogonale LoRA-Adapter wird eine Wissensentkopplung erreicht, die Datenschutz schützt und gleichzeitig die Personalisierungseffektivität verbessert. Obwohl die aktuellen Ergebnisse noch vorläufig sind, bietet die Arbeit wertvolle neue Perspektiven und ein Methodisches Framework für dieses Forschungsgebiet.