2025-11-24T04:07:17.991345

Personalized Federated Fine-Tuning of Vision Foundation Models for Healthcare

Tupper, GagnÃ©

Foundation models open up new possibilities for the use of AI in healthcare. However, even when pre-trained on health data, they still need to be fine-tuned for specific downstream tasks. Furthermore, although foundation models reduce the amount of training data required to achieve good performance, obtaining sufficient data is still a challenge. This is due, in part, to restrictions on sharing and aggregating data from different sources to protect patients' privacy. One possible solution to this is to fine-tune foundation models via federated learning across multiple participating clients (i.e., hospitals, clinics, etc.). In this work, we propose a new personalized federated fine-tuning method that learns orthogonal LoRA adapters to disentangle general and client-specific knowledge, enabling each client to fully exploit both their own data and the data of others. Our preliminary results on real-world federated medical imaging tasks demonstrate that our approach is competitive against current federated fine-tuning methods.

academic

Affinage Fédéré Personnalisé des Modèles de Fondation de Vision pour la Santé

Informations Fondamentales

ID de l'article: 2510.12741
Titre: Personalized Federated Fine-Tuning of Vision Foundation Models for Healthcare
Auteurs: Adam Tupper, Christian Gagné (Université Laval, Mila - Quebec AI Institute)
Classification: cs.CV, cs.DC
Conférence de publication: SMASH 2025
Lien de l'article: https://arxiv.org/abs/2510.12741

Résumé

Les modèles de fondation ouvrent de nouvelles possibilités pour les applications d'IA médicale, mais nécessitent un affinage adapté aux tâches spécifiques en aval, même après préentraînement sur des données de santé. En raison des restrictions liées à la protection de la vie privée des patients, le partage et l'agrégation de données provenant de différentes sources restent un défi majeur. Cet article propose une nouvelle méthode d'affinage fédéré personnalisé, FedOPAL, qui découple les connaissances générales et spécifiques aux clients en apprenant des adaptateurs LoRA orthogonaux, permettant à chaque client de tirer pleinement parti de ses propres données et de celles des autres clients. Les résultats préliminaires sur des tâches réelles d'imagerie médicale fédérée démontrent que cette méthode est compétitive par rapport aux approches actuelles d'affinage fédéré.

Contexte de Recherche et Motivation

Problèmes Fondamentaux

Restrictions de confidentialité des données: Les données médicales ne peuvent pas être agrégées de manière centralisée en raison de réglementations strictes sur la vie privée
Rareté des données: Les ensembles de données annotées en imagerie médicale sont rares et coûteux à acquérir
Hétérogénéité des données: Des différences significatives dans les distributions de données existent entre les différentes institutions médicales
Surcharge de communication: L'apprentissage fédéré des grands modèles de fondation fait face à des coûts de communication énormes

Motivation de la Recherche

L'apprentissage fédéré, bien qu'il résout les contraintes de partage de données, introduit de nouveaux défis dans l'affinage des modèles de fondation
Les méthodes existantes ne traitent pas efficacement le problème d'hétérogénéité des données entre clients
Il est nécessaire de développer une méthode d'affinage fédéré qui exploite les connaissances globales tout en maintenant la personnalisation

Contributions Principales

Proposition de la méthode FedOPAL: Un nouveau cadre d'affinage fédéré personnalisé utilisant des adaptateurs LoRA orthogonaux pour séparer les connaissances générales et spécifiques aux clients
Mécanisme de double contrainte orthogonale: Conception de deux approches - orthogonalisation des poids (FedOPAL-W) et orthogonalisation des représentations (FedOPAL-R)
Validation sur données médicales réelles: Vérification de l'efficacité de la méthode sur deux ensembles de données d'imagerie médicale exigeants: Fed-ISIC 2019 et Camelyon17-WILDS
Analyse comparative systématique: Comparaison complète avec plusieurs méthodes d'apprentissage fédéré basées sur LoRA de pointe

Explication Détaillée de la Méthode

Définition de la Tâche

Dans les tâches de classification d'imagerie médicale fédérée, plusieurs institutions médicales (clients) collaborent pour entraîner un modèle de fondation de vision partagé, tout en protégeant la confidentialité de leurs données respectives et en gérant l'hétérogénéité de la distribution des données.

Architecture du Modèle

Conception à Double Adaptateur

FedOPAL adopte une architecture à double adaptateur LoRA:

Adaptateur global: Mis à jour collaborativement par tous les clients, apprenant les caractéristiques générales
Adaptateur personnel: Privé pour chaque client, apprenant les caractéristiques spécifiques au client

Pour la matrice de poids préentraînée $W_0 \in \mathbb{R}^{d \times k}$ , la formule de mise à jour est: $\Delta W = W_0 + B_{global}A_{global} + B_{personal}A_{personal}$

Mécanisme de Contrainte Orthogonale

1. Orthogonalisation des Poids (FedOPAL-W) Basée sur la méthode O-LoRA, appliquant des contraintes orthogonales aux poids des adaptateurs: $\ell_{orth} = \frac{1}{N} \sum_{i=1}^{N} |(A_i_{global})^T A_i_{personal}|$

2. Orthogonalisation des Représentations (FedOPAL-R) Contraignant directement les représentations apprises, minimisant la similarité cosinus: $\ell_{orth} = \frac{1}{NB} \sum_{i=1}^{N} \sum_{j=1}^{B} |\cos(z_{global}^{i,j}, z_{personal}^{i,j})|$

Fonction de perte totale: $\ell_{total} = \ell_{task} + \lambda \ell_{orth}$

Points d'Innovation Technique

Mécanisme de découplage des connaissances: Forcer deux adaptateurs à apprendre différents sous-espaces de caractéristiques par des contraintes orthogonales
Orthogonalisation à double niveau: Fournir deux stratégies d'orthogonalisation au niveau des poids et au niveau des représentations
Personnalisation fédérée: Réaliser la personnalisation des clients tout en maintenant la collaboration mondiale

Configuration Expérimentale

Ensembles de Données

1. Fed-ISIC 2019

Échelle: 6 clients provenant d'institutions médicales en Australie, Autriche, États-Unis et Espagne
Tâche: Classification des lésions cutanées (9 catégories diagnostiques)
Caractéristiques: Décalage significatif des étiquettes et tailles d'échantillons inégales

2. Camelyon17-WILDS

Échelle: 5 clients (hôpitaux), chacun avec 7-10 patients
Tâche: Classification au niveau des patches des métastases du cancer du sein dans les coupes de ganglions lymphatiques
Caractéristiques: Variations de couleur dues aux différences dans les procédures de coloration

Métriques d'Évaluation

Utilisation de la précision équilibrée (balanced accuracy) pour traiter le problème du déséquilibre des classes

Méthodes de Comparaison

FedIT: Entraînement d'un seul adaptateur global avec matrices A et B
FFA-LoRA: Fixation de la matrice A, entraînement uniquement de la matrice B
FedSA: Partage uniquement de la matrice A, personnalisation de la matrice B
FedDPA: Entraînement d'adaptateurs globaux et personnels indépendants
FedPAL: Méthode de base sans contrainte orthogonale

Détails d'Implémentation

Modèle: ViT-Tiny (9,7 millions de paramètres), préentraîné sur ImageNet-21K
Optimiseur: SGD, taux d'apprentissage η ∈ {1e-4, 5e-4, 1e-3, 5e-3, 1e-2}
Configuration fédérée: FedAvg, participation de 100% des clients, 1 epoch d'entraînement local par tour

Résultats Expérimentaux

Résultats Principaux

Résultats de la tâche Fed-ISIC 2019:

FedOPAL-R obtient le meilleur classement moyen (3,17) avec une précision moyenne de 0,726
La méthode de base FedPAL montre de bonnes performances (classement moyen 3,50, précision 0,726)
Sur le client 2, FedPAL atteint la précision la plus élevée de 0,931

Résultats de la tâche Camelyon17-WILDS:

FedDPA montre les meilleures performances (classement moyen 2,40, précision 0,909)
FedOPAL-R obtient la deuxième meilleure précision moyenne de 0,870
Toutes les méthodes fédérées se rapprochent des performances d'entraînement centralisé (0,905)

Conclusions Clés

Compétitivité de la méthode: La méthode FedOPAL est compétitive par rapport aux méthodes de pointe existantes
Problèmes de cohérence: Aucune méthode unique ne montre les meilleures performances de manière cohérente sur tous les clients et tâches
Efficacité de l'orthogonalisation: L'orthogonalisation des représentations (FedOPAL-R) surpasse généralement l'orthogonalisation des poids (FedOPAL-W)
Marge d'amélioration: Les résultats indiquent qu'il existe encore de l'espace pour des améliorations supplémentaires

Travaux Connexes

Combinaison de l'Apprentissage Fédéré et LoRA

Efficacité des paramètres: LoRA réduit les frais généraux de communication et les besoins de calcul
Approches personnalisées: La personnalisation partielle du modèle atténue les problèmes d'hétérogénéité des données
Progrès récents: Les méthodes FedDPA, FedSA et autres explorent différentes stratégies de personnalisation

Méthodes d'Apprentissage Orthogonal

O-LoRA: Utilisation de contraintes orthogonales dans l'apprentissage continu pour prévenir l'oubli catastrophique
Apprentissage des sous-espaces: Contrainte d'apprentissage de différents sous-espaces de caractéristiques

Conclusions et Discussion

Conclusions Principales

FedOPAL réalise avec succès le découplage des connaissances générales et spécifiques par des adaptateurs LoRA orthogonaux
La méthode démontre une compétitivité avec les méthodes existantes sur des ensembles de données médicales réelles
L'orthogonalisation au niveau des représentations est plus efficace que celle au niveau des poids

Limitations

Cohérence des performances: La méthode ne montre pas une cohérence suffisante entre différents clients et tâches
Résultats préliminaires: Les résultats actuels sont de nature préliminaire et nécessitent une analyse plus approfondie
Sensibilité aux hyperparamètres: Le choix du paramètre λ peut influencer les performances de la méthode
Surcharge de calcul: La conception à double adaptateur augmente la complexité de calcul

Directions Futures

Optimisation du rang des adaptateurs: Explorer les paramètres de rang optimaux pour les adaptateurs globaux et locaux
Amélioration de la séparation des connaissances: Affiner les méthodes de séparation des connaissances indépendantes et spécifiques aux clients
Évaluation étendue: Évaluation sur des modèles plus grands et davantage de tâches
Analyse théorique: Fournir des garanties théoriques et une analyse de convergence de la méthode

Évaluation Approfondie

Points Forts

Innovation forte: Introduction novatrice de contraintes orthogonales dans l'affinage fédéré LoRA
Valeur pratique élevée: Répond directement aux besoins et défis réels de l'IA médicale
Méthode complète: Fournit deux stratégies d'orthogonalisation à différents niveaux
Évaluation systématique: Évaluation systématique sur des ensembles de données médicales réelles

Insuffisances

Fondations théoriques faibles: Manque d'analyse théorique sur l'efficacité des contraintes orthogonales
Profondeur expérimentale insuffisante: Absence d'études d'ablation détaillées et d'analyse de sensibilité aux paramètres
Améliorations de performance limitées: Les améliorations par rapport aux méthodes existantes sont modestes
Portée d'évaluation limitée: Évaluation sur seulement deux ensembles de données

Impact Potentiel

Contribution académique: Fournit de nouvelles perspectives à l'intersection de l'apprentissage fédéré et de l'IA médicale
Perspectives pratiques: Promesse d'application dans des scénarios réels d'apprentissage fédéré médical
Extensibilité: Le cadre méthodologique peut être étendu à d'autres domaines et tâches

Scénarios d'Application

Collaboration médicale multi-institutionnelle: Applicable aux scénarios d'apprentissage fédéré entre hôpitaux
Tâches sensibles à la confidentialité: Approprié pour les applications nécessitant une protection stricte de la vie privée des données
Environnements avec hétérogénéité des données: Particulièrement adapté aux situations où la distribution des données diffère considérablement entre les clients

Références

Cet article s'appuie principalement sur les travaux importants dans les domaines de l'apprentissage fédéré (McMahan et al., 2017), des adaptateurs LoRA (Hu et al., 2022), et de l'apprentissage orthogonal (Wang et al., 2023), fournissant une nouvelle solution au problème de l'affinage fédéré en IA médicale.

Résumé: Cet article représente un travail innovant abordant les défis de l'apprentissage fédéré en IA médicale, réalisant le découplage des connaissances par des adaptateurs LoRA orthogonaux, améliorant l'effet de personnalisation tout en protégeant la vie privée. Bien que les résultats actuels soient de nature préliminaire, l'article fournit des perspectives et un cadre méthodologique précieux pour ce domaine.