Foundation models open up new possibilities for the use of AI in healthcare. However, even when pre-trained on health data, they still need to be fine-tuned for specific downstream tasks. Furthermore, although foundation models reduce the amount of training data required to achieve good performance, obtaining sufficient data is still a challenge. This is due, in part, to restrictions on sharing and aggregating data from different sources to protect patients' privacy. One possible solution to this is to fine-tune foundation models via federated learning across multiple participating clients (i.e., hospitals, clinics, etc.). In this work, we propose a new personalized federated fine-tuning method that learns orthogonal LoRA adapters to disentangle general and client-specific knowledge, enabling each client to fully exploit both their own data and the data of others. Our preliminary results on real-world federated medical imaging tasks demonstrate that our approach is competitive against current federated fine-tuning methods.
- ID de l'article: 2510.12741
- Titre: Personalized Federated Fine-Tuning of Vision Foundation Models for Healthcare
- Auteurs: Adam Tupper, Christian Gagné (Université Laval, Mila - Quebec AI Institute)
- Classification: cs.CV, cs.DC
- Conférence de publication: SMASH 2025
- Lien de l'article: https://arxiv.org/abs/2510.12741
Les modèles de fondation ouvrent de nouvelles possibilités pour les applications d'IA médicale, mais nécessitent un affinage adapté aux tâches spécifiques en aval, même après préentraînement sur des données de santé. En raison des restrictions liées à la protection de la vie privée des patients, le partage et l'agrégation de données provenant de différentes sources restent un défi majeur. Cet article propose une nouvelle méthode d'affinage fédéré personnalisé, FedOPAL, qui découple les connaissances générales et spécifiques aux clients en apprenant des adaptateurs LoRA orthogonaux, permettant à chaque client de tirer pleinement parti de ses propres données et de celles des autres clients. Les résultats préliminaires sur des tâches réelles d'imagerie médicale fédérée démontrent que cette méthode est compétitive par rapport aux approches actuelles d'affinage fédéré.
- Restrictions de confidentialité des données: Les données médicales ne peuvent pas être agrégées de manière centralisée en raison de réglementations strictes sur la vie privée
- Rareté des données: Les ensembles de données annotées en imagerie médicale sont rares et coûteux à acquérir
- Hétérogénéité des données: Des différences significatives dans les distributions de données existent entre les différentes institutions médicales
- Surcharge de communication: L'apprentissage fédéré des grands modèles de fondation fait face à des coûts de communication énormes
- L'apprentissage fédéré, bien qu'il résout les contraintes de partage de données, introduit de nouveaux défis dans l'affinage des modèles de fondation
- Les méthodes existantes ne traitent pas efficacement le problème d'hétérogénéité des données entre clients
- Il est nécessaire de développer une méthode d'affinage fédéré qui exploite les connaissances globales tout en maintenant la personnalisation
- Proposition de la méthode FedOPAL: Un nouveau cadre d'affinage fédéré personnalisé utilisant des adaptateurs LoRA orthogonaux pour séparer les connaissances générales et spécifiques aux clients
- Mécanisme de double contrainte orthogonale: Conception de deux approches - orthogonalisation des poids (FedOPAL-W) et orthogonalisation des représentations (FedOPAL-R)
- Validation sur données médicales réelles: Vérification de l'efficacité de la méthode sur deux ensembles de données d'imagerie médicale exigeants: Fed-ISIC 2019 et Camelyon17-WILDS
- Analyse comparative systématique: Comparaison complète avec plusieurs méthodes d'apprentissage fédéré basées sur LoRA de pointe
Dans les tâches de classification d'imagerie médicale fédérée, plusieurs institutions médicales (clients) collaborent pour entraîner un modèle de fondation de vision partagé, tout en protégeant la confidentialité de leurs données respectives et en gérant l'hétérogénéité de la distribution des données.
FedOPAL adopte une architecture à double adaptateur LoRA:
- Adaptateur global: Mis à jour collaborativement par tous les clients, apprenant les caractéristiques générales
- Adaptateur personnel: Privé pour chaque client, apprenant les caractéristiques spécifiques au client
Pour la matrice de poids préentraînée W0∈Rd×k, la formule de mise à jour est:
ΔW=W0+BglobalAglobal+BpersonalApersonal
1. Orthogonalisation des Poids (FedOPAL-W)
Basée sur la méthode O-LoRA, appliquant des contraintes orthogonales aux poids des adaptateurs:
\ell_{orth} = \frac{1}{N} \sum_{i=1}^{N} |(A_i_{global})^T A_i_{personal}|
2. Orthogonalisation des Représentations (FedOPAL-R)
Contraignant directement les représentations apprises, minimisant la similarité cosinus:
ℓorth=NB1∑i=1N∑j=1B∣cos(zglobali,j,zpersonali,j)∣
Fonction de perte totale: ℓtotal=ℓtask+λℓorth
- Mécanisme de découplage des connaissances: Forcer deux adaptateurs à apprendre différents sous-espaces de caractéristiques par des contraintes orthogonales
- Orthogonalisation à double niveau: Fournir deux stratégies d'orthogonalisation au niveau des poids et au niveau des représentations
- Personnalisation fédérée: Réaliser la personnalisation des clients tout en maintenant la collaboration mondiale
1. Fed-ISIC 2019
- Échelle: 6 clients provenant d'institutions médicales en Australie, Autriche, États-Unis et Espagne
- Tâche: Classification des lésions cutanées (9 catégories diagnostiques)
- Caractéristiques: Décalage significatif des étiquettes et tailles d'échantillons inégales
2. Camelyon17-WILDS
- Échelle: 5 clients (hôpitaux), chacun avec 7-10 patients
- Tâche: Classification au niveau des patches des métastases du cancer du sein dans les coupes de ganglions lymphatiques
- Caractéristiques: Variations de couleur dues aux différences dans les procédures de coloration
Utilisation de la précision équilibrée (balanced accuracy) pour traiter le problème du déséquilibre des classes
- FedIT: Entraînement d'un seul adaptateur global avec matrices A et B
- FFA-LoRA: Fixation de la matrice A, entraînement uniquement de la matrice B
- FedSA: Partage uniquement de la matrice A, personnalisation de la matrice B
- FedDPA: Entraînement d'adaptateurs globaux et personnels indépendants
- FedPAL: Méthode de base sans contrainte orthogonale
- Modèle: ViT-Tiny (9,7 millions de paramètres), préentraîné sur ImageNet-21K
- Optimiseur: SGD, taux d'apprentissage η ∈ {1e-4, 5e-4, 1e-3, 5e-3, 1e-2}
- Configuration fédérée: FedAvg, participation de 100% des clients, 1 epoch d'entraînement local par tour
Résultats de la tâche Fed-ISIC 2019:
- FedOPAL-R obtient le meilleur classement moyen (3,17) avec une précision moyenne de 0,726
- La méthode de base FedPAL montre de bonnes performances (classement moyen 3,50, précision 0,726)
- Sur le client 2, FedPAL atteint la précision la plus élevée de 0,931
Résultats de la tâche Camelyon17-WILDS:
- FedDPA montre les meilleures performances (classement moyen 2,40, précision 0,909)
- FedOPAL-R obtient la deuxième meilleure précision moyenne de 0,870
- Toutes les méthodes fédérées se rapprochent des performances d'entraînement centralisé (0,905)
- Compétitivité de la méthode: La méthode FedOPAL est compétitive par rapport aux méthodes de pointe existantes
- Problèmes de cohérence: Aucune méthode unique ne montre les meilleures performances de manière cohérente sur tous les clients et tâches
- Efficacité de l'orthogonalisation: L'orthogonalisation des représentations (FedOPAL-R) surpasse généralement l'orthogonalisation des poids (FedOPAL-W)
- Marge d'amélioration: Les résultats indiquent qu'il existe encore de l'espace pour des améliorations supplémentaires
- Efficacité des paramètres: LoRA réduit les frais généraux de communication et les besoins de calcul
- Approches personnalisées: La personnalisation partielle du modèle atténue les problèmes d'hétérogénéité des données
- Progrès récents: Les méthodes FedDPA, FedSA et autres explorent différentes stratégies de personnalisation
- O-LoRA: Utilisation de contraintes orthogonales dans l'apprentissage continu pour prévenir l'oubli catastrophique
- Apprentissage des sous-espaces: Contrainte d'apprentissage de différents sous-espaces de caractéristiques
- FedOPAL réalise avec succès le découplage des connaissances générales et spécifiques par des adaptateurs LoRA orthogonaux
- La méthode démontre une compétitivité avec les méthodes existantes sur des ensembles de données médicales réelles
- L'orthogonalisation au niveau des représentations est plus efficace que celle au niveau des poids
- Cohérence des performances: La méthode ne montre pas une cohérence suffisante entre différents clients et tâches
- Résultats préliminaires: Les résultats actuels sont de nature préliminaire et nécessitent une analyse plus approfondie
- Sensibilité aux hyperparamètres: Le choix du paramètre λ peut influencer les performances de la méthode
- Surcharge de calcul: La conception à double adaptateur augmente la complexité de calcul
- Optimisation du rang des adaptateurs: Explorer les paramètres de rang optimaux pour les adaptateurs globaux et locaux
- Amélioration de la séparation des connaissances: Affiner les méthodes de séparation des connaissances indépendantes et spécifiques aux clients
- Évaluation étendue: Évaluation sur des modèles plus grands et davantage de tâches
- Analyse théorique: Fournir des garanties théoriques et une analyse de convergence de la méthode
- Innovation forte: Introduction novatrice de contraintes orthogonales dans l'affinage fédéré LoRA
- Valeur pratique élevée: Répond directement aux besoins et défis réels de l'IA médicale
- Méthode complète: Fournit deux stratégies d'orthogonalisation à différents niveaux
- Évaluation systématique: Évaluation systématique sur des ensembles de données médicales réelles
- Fondations théoriques faibles: Manque d'analyse théorique sur l'efficacité des contraintes orthogonales
- Profondeur expérimentale insuffisante: Absence d'études d'ablation détaillées et d'analyse de sensibilité aux paramètres
- Améliorations de performance limitées: Les améliorations par rapport aux méthodes existantes sont modestes
- Portée d'évaluation limitée: Évaluation sur seulement deux ensembles de données
- Contribution académique: Fournit de nouvelles perspectives à l'intersection de l'apprentissage fédéré et de l'IA médicale
- Perspectives pratiques: Promesse d'application dans des scénarios réels d'apprentissage fédéré médical
- Extensibilité: Le cadre méthodologique peut être étendu à d'autres domaines et tâches
- Collaboration médicale multi-institutionnelle: Applicable aux scénarios d'apprentissage fédéré entre hôpitaux
- Tâches sensibles à la confidentialité: Approprié pour les applications nécessitant une protection stricte de la vie privée des données
- Environnements avec hétérogénéité des données: Particulièrement adapté aux situations où la distribution des données diffère considérablement entre les clients
Cet article s'appuie principalement sur les travaux importants dans les domaines de l'apprentissage fédéré (McMahan et al., 2017), des adaptateurs LoRA (Hu et al., 2022), et de l'apprentissage orthogonal (Wang et al., 2023), fournissant une nouvelle solution au problème de l'affinage fédéré en IA médicale.
Résumé: Cet article représente un travail innovant abordant les défis de l'apprentissage fédéré en IA médicale, réalisant le découplage des connaissances par des adaptateurs LoRA orthogonaux, améliorant l'effet de personnalisation tout en protégeant la vie privée. Bien que les résultats actuels soient de nature préliminaire, l'article fournit des perspectives et un cadre méthodologique précieux pour ce domaine.