2025-11-24T04:07:17.991345

Personalized Federated Fine-Tuning of Vision Foundation Models for Healthcare

Tupper, GagnÃ©

Foundation models open up new possibilities for the use of AI in healthcare. However, even when pre-trained on health data, they still need to be fine-tuned for specific downstream tasks. Furthermore, although foundation models reduce the amount of training data required to achieve good performance, obtaining sufficient data is still a challenge. This is due, in part, to restrictions on sharing and aggregating data from different sources to protect patients' privacy. One possible solution to this is to fine-tune foundation models via federated learning across multiple participating clients (i.e., hospitals, clinics, etc.). In this work, we propose a new personalized federated fine-tuning method that learns orthogonal LoRA adapters to disentangle general and client-specific knowledge, enabling each client to fully exploit both their own data and the data of others. Our preliminary results on real-world federated medical imaging tasks demonstrate that our approach is competitive against current federated fine-tuning methods.

academic

Ajuste Personalizado Federado de Modelos de Fundación de Visión para Atención Médica

Información Básica

ID del Artículo: 2510.12741
Título: Personalized Federated Fine-Tuning of Vision Foundation Models for Healthcare
Autores: Adam Tupper, Christian Gagné (Université Laval, Mila - Quebec AI Institute)
Clasificación: cs.CV, cs.DC
Conferencia de Publicación: SMASH 2025
Enlace del Artículo: https://arxiv.org/abs/2510.12741

Resumen

Los modelos de fundación abren nuevas posibilidades para aplicaciones de IA médica, pero incluso cuando se preentrenan en datos de salud, requieren ajuste fino para tareas específicas posteriores. Debido a las restricciones de protección de privacidad del paciente, compartir y agregar datos de diferentes fuentes sigue siendo un desafío. Este artículo propone un nuevo método de ajuste fino federado personalizado FedOPAL, que desacopla el conocimiento general del conocimiento específico del cliente mediante el aprendizaje de adaptadores LoRA ortogonales, permitiendo que cada cliente aproveche plenamente sus propios datos y los de otros clientes. Los resultados preliminares en tareas reales de imágenes médicas federadas demuestran que el método es competitivo con los métodos actuales de ajuste fino federado.

Antecedentes de Investigación y Motivación

Problemas Centrales

Restricciones de Privacidad de Datos: Los datos médicos no pueden agregarse centralmente para entrenamiento debido a regulaciones estrictas de privacidad
Escasez de Datos: Los conjuntos de datos anotados en imágenes médicas son escasos y costosos de obtener
Heterogeneidad de Datos: Existen diferencias significativas en la distribución de datos entre diferentes instituciones médicas
Gastos de Comunicación: El aprendizaje federado de modelos de fundación grandes enfrenta costos de comunicación enormes

Motivación de la Investigación

Aunque el aprendizaje federado resuelve las restricciones de compartir datos, introduce nuevos desafíos en el ajuste fino de modelos de fundación
Los métodos existentes no manejan efectivamente el problema de heterogeneidad de datos entre clientes
Se necesita un método de ajuste fino federado que pueda aprovechar el conocimiento global mientras mantiene la personalización

Contribuciones Principales

Propuesta del Método FedOPAL: Un nuevo marco de ajuste fino federado personalizado que utiliza adaptadores LoRA ortogonales para separar el conocimiento general y específico del cliente
Mecanismo de Restricción Ortogonal Dual: Se diseñan dos métodos: ortogonalización de pesos (FedOPAL-W) y ortogonalización de representaciones (FedOPAL-R)
Validación con Datos Médicos Reales: Se verifica la efectividad del método en dos conjuntos de datos desafiantes de imágenes médicas: Fed-ISIC 2019 y Camelyon17-WILDS
Análisis Comparativo Sistemático: Se realiza una comparación exhaustiva con múltiples métodos recientes de aprendizaje federado basados en LoRA

Explicación Detallada del Método

Definición de la Tarea

En la tarea de clasificación de imágenes médicas federadas, múltiples instituciones médicas (clientes) colaboran en el entrenamiento de un modelo de fundación de visión compartido, mientras protegen la privacidad de sus datos y manejan la heterogeneidad de la distribución de datos.

Arquitectura del Modelo

Diseño de Adaptador Dual

FedOPAL adopta una arquitectura de adaptador LoRA dual:

Adaptador Global: Actualizado colaborativamente por todos los clientes, aprende características generales
Adaptador Personal: Privado para cada cliente, aprende características específicas del cliente

Para la matriz de pesos preentrenada $W_0 \in \mathbb{R}^{d \times k}$ , la fórmula de actualización es: $\Delta W = W_0 + B_{global}A_{global} + B_{personal}A_{personal}$

Mecanismo de Restricción Ortogonal

1. Ortogonalización de Pesos (FedOPAL-W) Basada en el método O-LoRA, impone restricciones ortogonales en los pesos del adaptador: $\ell_{orth} = \frac{1}{N} \sum_{i=1}^{N} |(A_i_{global})^T A_i_{personal}|$

2. Ortogonalización de Representaciones (FedOPAL-R) Restringe directamente las representaciones aprendidas, minimizando la similitud del coseno: $\ell_{orth} = \frac{1}{NB} \sum_{i=1}^{N} \sum_{j=1}^{B} |\cos(z_{global}^{i,j}, z_{personal}^{i,j})|$

Función de pérdida total: $\ell_{total} = \ell_{task} + \lambda \ell_{orth}$

Puntos de Innovación Técnica

Mecanismo de Desacoplamiento de Conocimiento: Fuerza dos adaptadores a aprender subespacios de características diferentes mediante restricciones ortogonales
Ortogonalización Dual: Proporciona dos estrategias de ortogonalización a nivel de pesos y a nivel de representación
Personalización Federada: Logra personalización del cliente mientras mantiene la colaboración global

Configuración Experimental

Conjuntos de Datos

1. Fed-ISIC 2019

Escala: 6 clientes de instituciones médicas en Australia, Austria, Estados Unidos y España
Tarea: Clasificación de lesiones cutáneas (9 categorías de diagnóstico)
Características: Cambio de etiqueta significativo y tamaños de muestra desiguales

2. Camelyon17-WILDS

Escala: 5 clientes (hospitales), 7-10 pacientes por cliente
Tarea: Clasificación a nivel de parche de metástasis de cáncer de mama en cortes de ganglios linfáticos
Características: Variaciones de color debido a diferencias en procedimientos de tinción

Métricas de Evaluación

Se utiliza precisión equilibrada (balanced accuracy) para manejar el problema de desequilibrio de clases

Métodos de Comparación

FedIT: Entrena matrices A y B de un único adaptador global
FFA-LoRA: Fija la matriz A, entrena solo la matriz B
FedSA: Comparte solo la matriz A, personaliza la matriz B
FedDPA: Entrena adaptadores globales y personales independientes
FedPAL: Método de línea base sin restricción ortogonal

Detalles de Implementación

Modelo: ViT-Tiny (9,7 millones de parámetros), preentrenado en ImageNet-21K
Optimizador: SGD, tasa de aprendizaje η ∈ {1e-4, 5e-4, 1e-3, 5e-3, 1e-2}
Configuración Federada: FedAvg, participación del 100% de clientes, 1 epoch de entrenamiento local por ronda

Resultados Experimentales

Resultados Principales

Resultados de la Tarea Fed-ISIC 2019:

FedOPAL-R obtiene el mejor ranking promedio (3,17), precisión promedio de 0,726
El método de línea base FedPAL muestra buen desempeño (ranking promedio 3,50, precisión 0,726)
En el cliente 2, FedPAL alcanza la precisión más alta de 0,931

Resultados de la Tarea Camelyon17-WILDS:

FedDPA muestra el mejor desempeño (ranking promedio 2,40, precisión 0,909)
FedOPAL-R obtiene la segunda mejor precisión promedio de 0,870
Todos los métodos federados se acercan al desempeño del entrenamiento centralizado (0,905)

Hallazgos Clave

Competitividad del Método: El método FedOPAL es competitivo con los métodos más avanzados existentes
Problemas de Consistencia: Ningún método único muestra el mejor desempeño consistentemente en todos los clientes y tareas
Efecto de Ortogonalización: La ortogonalización de representaciones (FedOPAL-R) generalmente supera a la ortogonalización de pesos (FedOPAL-W)
Espacio para Mejora: Los resultados indican que aún hay espacio para mejoras adicionales

Trabajo Relacionado

Combinación de Aprendizaje Federado y LoRA

Eficiencia de Parámetros: LoRA reduce los gastos de comunicación y los requisitos computacionales
Métodos de Personalización: La personalización parcial del modelo mitiga la heterogeneidad de datos
Avances Recientes: Métodos como FedDPA y FedSA exploran diferentes estrategias de personalización

Métodos de Aprendizaje Ortogonal

O-LoRA: Utiliza restricciones ortogonales en aprendizaje continuo para prevenir olvido catastrófico
Aprendizaje de Subespacios: Restringe el aprendizaje de diferentes subespacios de características

Conclusiones y Discusión

Conclusiones Principales

FedOPAL logra exitosamente el desacoplamiento de conocimiento general y específico mediante adaptadores LoRA ortogonales
El método demuestra competitividad con métodos existentes en conjuntos de datos médicos reales
La ortogonalización a nivel de representación es más efectiva que la ortogonalización a nivel de pesos

Limitaciones

Consistencia de Desempeño: El método no muestra desempeño suficientemente consistente entre diferentes clientes y tareas
Resultados Preliminares: Los resultados actuales son de naturaleza preliminar y requieren análisis más profundo
Sensibilidad de Hiperparámetros: La selección del parámetro λ puede afectar el desempeño del método
Gastos Computacionales: El diseño de adaptador dual aumenta la complejidad computacional

Direcciones Futuras

Optimización del Rango del Adaptador: Explorar la configuración óptima del rango para adaptadores globales y locales
Mejora de la Separación de Conocimiento: Perfeccionar los métodos de separación entre conocimiento independiente del cliente y específico del cliente
Evaluación Extendida: Realizar evaluación en modelos más grandes y más tareas
Análisis Teórico: Proporcionar garantías teóricas y análisis de convergencia del método

Evaluación Profunda

Fortalezas

Innovación Fuerte: Primera introducción de restricciones ortogonales en ajuste fino federado con LoRA, enfoque novedoso
Alto Valor Práctico: Aborda directamente las necesidades y desafíos reales de la IA médica
Método Completo: Proporciona dos estrategias de ortogonalización diferentes a diferentes niveles
Evaluación Suficiente: Realiza evaluación sistemática en conjuntos de datos médicos reales

Insuficiencias

Base Teórica Débil: Carece de análisis teórico sobre la efectividad de las restricciones ortogonales
Profundidad Experimental Insuficiente: Faltan experimentos de ablación detallados y análisis de sensibilidad de parámetros
Mejora de Desempeño Limitada: La mejora respecto a métodos existentes es marginal
Alcance de Evaluación Limitado: Solo se evalúa en dos conjuntos de datos

Impacto

Contribución Académica: Proporciona nuevas perspectivas para el campo de intersección entre aprendizaje federado e IA médica
Perspectiva Práctica: Tiene potencial para aplicación en escenarios reales de aprendizaje federado médico
Escalabilidad: El marco del método es extensible a otros dominios y tareas

Escenarios Aplicables

Colaboración Médica Multiinstitucional: Aplicable a escenarios de aprendizaje federado entre hospitales
Tareas Sensibles a la Privacidad: Adecuado para aplicaciones que requieren protección estricta de privacidad de datos
Entornos con Heterogeneidad de Datos: Particularmente adecuado para casos donde la distribución de datos difiere significativamente entre clientes

Referencias

Este artículo se basa principalmente en trabajos importantes en aprendizaje federado (McMahan et al., 2017), adaptadores LoRA (Hu et al., 2022), aprendizaje ortogonal (Wang et al., 2023) y otros campos relacionados, proporcionando una nueva solución para el problema de ajuste fino federado en IA médica.

Resumen: Este es un trabajo innovador que aborda los desafíos del aprendizaje federado en IA médica, logrando el desacoplamiento de conocimiento mediante adaptadores LoRA ortogonales, mejorando los efectos de personalización mientras se protege la privacidad. Aunque los resultados actuales son de naturaleza preliminar, proporciona perspectivas valiosas y un marco de método novedoso para el campo.