Foundation models open up new possibilities for the use of AI in healthcare. However, even when pre-trained on health data, they still need to be fine-tuned for specific downstream tasks. Furthermore, although foundation models reduce the amount of training data required to achieve good performance, obtaining sufficient data is still a challenge. This is due, in part, to restrictions on sharing and aggregating data from different sources to protect patients' privacy. One possible solution to this is to fine-tune foundation models via federated learning across multiple participating clients (i.e., hospitals, clinics, etc.). In this work, we propose a new personalized federated fine-tuning method that learns orthogonal LoRA adapters to disentangle general and client-specific knowledge, enabling each client to fully exploit both their own data and the data of others. Our preliminary results on real-world federated medical imaging tasks demonstrate that our approach is competitive against current federated fine-tuning methods.
- ID Articolo: 2510.12741
- Titolo: Personalized Federated Fine-Tuning of Vision Foundation Models for Healthcare
- Autori: Adam Tupper, Christian Gagné (Université Laval, Mila - Quebec AI Institute)
- Classificazione: cs.CV, cs.DC
- Conferenza di Pubblicazione: SMASH 2025
- Link Articolo: https://arxiv.org/abs/2510.12741
I modelli di fondazione aprono nuove possibilità per le applicazioni di IA medica, ma richiedono comunque una messa a punto mirata per compiti specifici a valle, anche quando preaddestrati su dati sanitari. A causa dei vincoli di protezione della privacy dei pazienti, la condivisione e l'aggregazione di dati provenienti da diverse fonti rimane una sfida. Questo articolo propone un nuovo metodo di messa a punto federata personalizzata FedOPAL, che disaccoppia la conoscenza universale e quella specifica del cliente attraverso l'apprendimento di adattatori LoRA ortogonali, consentendo a ogni cliente di sfruttare pienamente i propri dati e quelli degli altri clienti. I risultati preliminari su compiti reali di imaging medico federato dimostrano che il metodo è competitivo rispetto ai metodi attuali di messa a punto federata.
- Vincoli di Privacy dei Dati: I dati medici non possono essere aggregati centralmente a causa di rigide normative sulla privacy
- Scarsità di Dati: I dataset annotati nell'imaging medico sono rari e costosi da acquisire
- Eterogeneità dei Dati: Esistono differenze significative nella distribuzione dei dati tra diverse istituzioni mediche
- Sovraccarico di Comunicazione: L'apprendimento federato di modelli di fondazione di grandi dimensioni affronta costi di comunicazione enormi
- Sebbene l'apprendimento federato risolva i vincoli di condivisione dei dati, introduce nuove sfide nella messa a punto dei modelli di fondazione
- I metodi esistenti non affrontano efficacemente il problema dell'eterogeneità dei dati tra clienti
- È necessario un metodo di messa a punto federata che possa sfruttare la conoscenza globale mantenendo la personalizzazione
- Proposta del Metodo FedOPAL: Un nuovo framework di messa a punto federata personalizzata che utilizza adattatori LoRA ortogonali per separare la conoscenza universale e quella specifica del cliente
- Meccanismo di Doppio Vincolo Ortogonale: Progettazione di due metodi: ortogonalizzazione dei pesi (FedOPAL-W) e ortogonalizzazione delle rappresentazioni (FedOPAL-R)
- Validazione su Dati Medici Reali: Verifica dell'efficacia del metodo su due dataset di imaging medico impegnativi: Fed-ISIC 2019 e Camelyon17-WILDS
- Analisi Comparativa Sistematica: Confronto completo con molteplici metodi di apprendimento federato basati su LoRA all'avanguardia
Nel compito di classificazione di imaging medico federato, molteplici istituzioni mediche (clienti) collaborano per addestrare un modello di fondazione visivo condiviso, proteggendo contemporaneamente i propri dati e affrontando l'eterogeneità della distribuzione dei dati.
FedOPAL adotta un'architettura con doppio adattatore LoRA:
- Adattatore Globale: Aggiornato collaborativamente da tutti i clienti, apprende caratteristiche universali
- Adattatore Personale: Privato di ogni cliente, apprende caratteristiche specifiche del cliente
Per la matrice di pesi preaddestrata W0∈Rd×k, la formula di aggiornamento è:
ΔW=W0+BglobalAglobal+BpersonalApersonal
1. Ortogonalizzazione dei Pesi (FedOPAL-W)
Basata sul metodo O-LoRA, applica vincoli ortogonali ai pesi degli adattatori:
\ell_{orth} = \frac{1}{N} \sum_{i=1}^{N} |(A_i_{global})^T A_i_{personal}|
2. Ortogonalizzazione delle Rappresentazioni (FedOPAL-R)
Vincola direttamente le rappresentazioni apprese, minimizzando la somiglianza del coseno:
ℓorth=NB1∑i=1N∑j=1B∣cos(zglobali,j,zpersonali,j)∣
Funzione di perdita totale: ℓtotal=ℓtask+λℓorth
- Meccanismo di Disaccoppiamento della Conoscenza: Attraverso vincoli ortogonali, forza i due adattatori ad apprendere sottospazi di caratteristiche diversi
- Ortogonalizzazione Doppio Livello: Fornisce due strategie di ortogonalizzazione a livello di peso e a livello di rappresentazione
- Personalizzazione Federata: Realizza la personalizzazione del cliente mantenendo la collaborazione globale
1. Fed-ISIC 2019
- Scala: 6 clienti, provenienti da istituzioni mediche in Australia, Austria, Stati Uniti e Spagna
- Compito: Classificazione di lesioni cutanee (9 categorie diagnostiche)
- Caratteristiche: Significativo spostamento di etichette e dimensioni di campioni non uniformi
2. Camelyon17-WILDS
- Scala: 5 clienti (ospedali), 7-10 pazienti per cliente
- Compito: Classificazione a livello di patch di metastasi del cancro al seno in sezioni di linfonodi
- Caratteristiche: Variazioni di colore dovute a differenze nelle procedure di colorazione
Utilizzo dell'accuratezza bilanciata (balanced accuracy) per affrontare il problema dello squilibrio di classe
- FedIT: Addestramento di matrici A e B di un singolo adattatore globale
- FFA-LoRA: Matrice A fissa, addestramento solo della matrice B
- FedSA: Condivisione solo della matrice A, personalizzazione della matrice B
- FedDPA: Addestramento di adattatori globali e personali indipendenti
- FedPAL: Metodo di base senza vincoli ortogonali
- Modello: ViT-Tiny (9,7 milioni di parametri), preaddestrato su ImageNet-21K
- Ottimizzatore: SGD, tasso di apprendimento η ∈ {1e-4, 5e-4, 1e-3, 5e-3, 1e-2}
- Configurazione Federata: FedAvg, partecipazione del 100% dei clienti, 1 epoch di addestramento locale per round
Risultati del Compito Fed-ISIC 2019:
- FedOPAL-R ottiene il miglior ranking medio (3,17), accuratezza media 0,726
- Il metodo di base FedPAL mostra buone prestazioni (ranking medio 3,50, accuratezza 0,726)
- Sul cliente 2, FedPAL raggiunge l'accuratezza massima di 0,931
Risultati del Compito Camelyon17-WILDS:
- FedDPA mostra le migliori prestazioni (ranking medio 2,40, accuratezza 0,909)
- FedOPAL-R ottiene la seconda migliore accuratezza media di 0,870
- Tutti i metodi federati si avvicinano alle prestazioni dell'addestramento centralizzato (0,905)
- Competitività del Metodo: Il metodo FedOPAL è competitivo rispetto ai metodi all'avanguardia esistenti
- Problema di Coerenza: Nessun singolo metodo mostra prestazioni costantemente migliori su tutti i clienti e compiti
- Effetto dell'Ortogonalizzazione: L'ortogonalizzazione delle rappresentazioni (FedOPAL-R) generalmente supera l'ortogonalizzazione dei pesi (FedOPAL-W)
- Spazio di Miglioramento: I risultati indicano ulteriore spazio per miglioramenti
- Efficienza Parametrica: LoRA riduce il sovraccarico di comunicazione e i requisiti computazionali
- Metodi Personalizzati: La personalizzazione parziale del modello mitiga l'eterogeneità dei dati
- Progressi Recenti: Metodi come FedDPA e FedSA esplorano diverse strategie di personalizzazione
- O-LoRA: Utilizza vincoli ortogonali nell'apprendimento continuo per prevenire l'oblio catastrofico
- Apprendimento di Sottospazi: Vincola l'apprendimento di sottospazi di caratteristiche diversi
- FedOPAL realizza con successo il disaccoppiamento della conoscenza universale e specifica attraverso adattatori LoRA ortogonali
- Il metodo dimostra competitività con i metodi esistenti su dataset medici reali
- L'ortogonalizzazione a livello di rappresentazione è più efficace dell'ortogonalizzazione a livello di peso
- Coerenza delle Prestazioni: Il metodo non mostra prestazioni sufficientemente coerenti tra diversi clienti e compiti
- Risultati Preliminari: I risultati attuali sono ancora di natura preliminare e richiedono analisi più approfondite
- Sensibilità agli Iperparametri: La scelta del parametro λ può influenzare le prestazioni del metodo
- Sovraccarico Computazionale: La progettazione doppio adattatore aumenta la complessità computazionale
- Ottimizzazione del Rango dell'Adattatore: Esplorare le impostazioni di rango ottimali per adattatori globali e locali
- Miglioramento della Separazione della Conoscenza: Perfezionare il metodo di separazione della conoscenza indipendente dal cliente e specifica
- Valutazione Estesa: Valutazione su modelli più grandi e più compiti
- Analisi Teorica: Fornire garanzie teoriche e analisi di convergenza del metodo
- Forte Innovatività: Primo a introdurre vincoli ortogonali nella messa a punto federata LoRA, approccio innovativo
- Alto Valore Pratico: Affronta direttamente le esigenze e le sfide reali dell'IA medica
- Metodo Completo: Fornisce due strategie di ortogonalizzazione a diversi livelli
- Valutazione Completa: Valutazione sistematica su dataset medici reali
- Fondamenti Teorici Deboli: Manca l'analisi teorica dell'efficacia dei vincoli ortogonali
- Profondità Sperimentale Insufficiente: Mancano esperimenti di ablazione dettagliati e analisi di sensibilità ai parametri
- Miglioramento delle Prestazioni Limitato: Il miglioramento rispetto ai metodi esistenti è modesto
- Ambito di Valutazione Limitato: Valutazione su soli due dataset
- Contributo Accademico: Fornisce nuove prospettive nel campo dell'intersezione tra apprendimento federato e IA medica
- Prospettive Pratiche: Promettente per l'applicazione in scenari reali di apprendimento federato medico
- Scalabilità: Il framework del metodo è estendibile ad altri domini e compiti
- Collaborazione Medica Multi-Istituzionale: Applicabile a scenari di apprendimento federato tra ospedali
- Compiti Sensibili alla Privacy: Adatto per applicazioni che richiedono rigorosa protezione della privacy dei dati
- Ambiente con Eterogeneità dei Dati: Particolarmente adatto quando la distribuzione dei dati tra clienti varia significativamente
Questo articolo fa principalmente riferimento a lavori importanti nei campi dell'apprendimento federato (McMahan et al., 2017), adattatori LoRA (Hu et al., 2022), apprendimento ortogonale (Wang et al., 2023), fornendo una nuova soluzione al problema della messa a punto federata nell'IA medica.
Sintesi: Questo è un lavoro innovativo affrontando le sfide dell'apprendimento federato nell'IA medica, realizzando il disaccoppiamento della conoscenza attraverso adattatori LoRA ortogonali, migliorando l'effetto di personalizzazione proteggendo contemporaneamente la privacy. Sebbene i risultati attuali siano ancora di natura preliminare, fornisce prospettive e framework metodologici preziosi per il campo.