Foundation models open up new possibilities for the use of AI in healthcare. However, even when pre-trained on health data, they still need to be fine-tuned for specific downstream tasks. Furthermore, although foundation models reduce the amount of training data required to achieve good performance, obtaining sufficient data is still a challenge. This is due, in part, to restrictions on sharing and aggregating data from different sources to protect patients' privacy. One possible solution to this is to fine-tune foundation models via federated learning across multiple participating clients (i.e., hospitals, clinics, etc.). In this work, we propose a new personalized federated fine-tuning method that learns orthogonal LoRA adapters to disentangle general and client-specific knowledge, enabling each client to fully exploit both their own data and the data of others. Our preliminary results on real-world federated medical imaging tasks demonstrate that our approach is competitive against current federated fine-tuning methods.
- ID del Artículo: 2510.12741
- Título: Personalized Federated Fine-Tuning of Vision Foundation Models for Healthcare
- Autores: Adam Tupper, Christian Gagné (Université Laval, Mila - Quebec AI Institute)
- Clasificación: cs.CV, cs.DC
- Conferencia de Publicación: SMASH 2025
- Enlace del Artículo: https://arxiv.org/abs/2510.12741
Los modelos de fundación abren nuevas posibilidades para aplicaciones de IA médica, pero incluso cuando se preentrenan en datos de salud, requieren ajuste fino para tareas específicas posteriores. Debido a las restricciones de protección de privacidad del paciente, compartir y agregar datos de diferentes fuentes sigue siendo un desafío. Este artículo propone un nuevo método de ajuste fino federado personalizado FedOPAL, que desacopla el conocimiento general del conocimiento específico del cliente mediante el aprendizaje de adaptadores LoRA ortogonales, permitiendo que cada cliente aproveche plenamente sus propios datos y los de otros clientes. Los resultados preliminares en tareas reales de imágenes médicas federadas demuestran que el método es competitivo con los métodos actuales de ajuste fino federado.
- Restricciones de Privacidad de Datos: Los datos médicos no pueden agregarse centralmente para entrenamiento debido a regulaciones estrictas de privacidad
- Escasez de Datos: Los conjuntos de datos anotados en imágenes médicas son escasos y costosos de obtener
- Heterogeneidad de Datos: Existen diferencias significativas en la distribución de datos entre diferentes instituciones médicas
- Gastos de Comunicación: El aprendizaje federado de modelos de fundación grandes enfrenta costos de comunicación enormes
- Aunque el aprendizaje federado resuelve las restricciones de compartir datos, introduce nuevos desafíos en el ajuste fino de modelos de fundación
- Los métodos existentes no manejan efectivamente el problema de heterogeneidad de datos entre clientes
- Se necesita un método de ajuste fino federado que pueda aprovechar el conocimiento global mientras mantiene la personalización
- Propuesta del Método FedOPAL: Un nuevo marco de ajuste fino federado personalizado que utiliza adaptadores LoRA ortogonales para separar el conocimiento general y específico del cliente
- Mecanismo de Restricción Ortogonal Dual: Se diseñan dos métodos: ortogonalización de pesos (FedOPAL-W) y ortogonalización de representaciones (FedOPAL-R)
- Validación con Datos Médicos Reales: Se verifica la efectividad del método en dos conjuntos de datos desafiantes de imágenes médicas: Fed-ISIC 2019 y Camelyon17-WILDS
- Análisis Comparativo Sistemático: Se realiza una comparación exhaustiva con múltiples métodos recientes de aprendizaje federado basados en LoRA
En la tarea de clasificación de imágenes médicas federadas, múltiples instituciones médicas (clientes) colaboran en el entrenamiento de un modelo de fundación de visión compartido, mientras protegen la privacidad de sus datos y manejan la heterogeneidad de la distribución de datos.
FedOPAL adopta una arquitectura de adaptador LoRA dual:
- Adaptador Global: Actualizado colaborativamente por todos los clientes, aprende características generales
- Adaptador Personal: Privado para cada cliente, aprende características específicas del cliente
Para la matriz de pesos preentrenada W0∈Rd×k, la fórmula de actualización es:
ΔW=W0+BglobalAglobal+BpersonalApersonal
1. Ortogonalización de Pesos (FedOPAL-W)
Basada en el método O-LoRA, impone restricciones ortogonales en los pesos del adaptador:
\ell_{orth} = \frac{1}{N} \sum_{i=1}^{N} |(A_i_{global})^T A_i_{personal}|
2. Ortogonalización de Representaciones (FedOPAL-R)
Restringe directamente las representaciones aprendidas, minimizando la similitud del coseno:
ℓorth=NB1∑i=1N∑j=1B∣cos(zglobali,j,zpersonali,j)∣
Función de pérdida total: ℓtotal=ℓtask+λℓorth
- Mecanismo de Desacoplamiento de Conocimiento: Fuerza dos adaptadores a aprender subespacios de características diferentes mediante restricciones ortogonales
- Ortogonalización Dual: Proporciona dos estrategias de ortogonalización a nivel de pesos y a nivel de representación
- Personalización Federada: Logra personalización del cliente mientras mantiene la colaboración global
1. Fed-ISIC 2019
- Escala: 6 clientes de instituciones médicas en Australia, Austria, Estados Unidos y España
- Tarea: Clasificación de lesiones cutáneas (9 categorías de diagnóstico)
- Características: Cambio de etiqueta significativo y tamaños de muestra desiguales
2. Camelyon17-WILDS
- Escala: 5 clientes (hospitales), 7-10 pacientes por cliente
- Tarea: Clasificación a nivel de parche de metástasis de cáncer de mama en cortes de ganglios linfáticos
- Características: Variaciones de color debido a diferencias en procedimientos de tinción
Se utiliza precisión equilibrada (balanced accuracy) para manejar el problema de desequilibrio de clases
- FedIT: Entrena matrices A y B de un único adaptador global
- FFA-LoRA: Fija la matriz A, entrena solo la matriz B
- FedSA: Comparte solo la matriz A, personaliza la matriz B
- FedDPA: Entrena adaptadores globales y personales independientes
- FedPAL: Método de línea base sin restricción ortogonal
- Modelo: ViT-Tiny (9,7 millones de parámetros), preentrenado en ImageNet-21K
- Optimizador: SGD, tasa de aprendizaje η ∈ {1e-4, 5e-4, 1e-3, 5e-3, 1e-2}
- Configuración Federada: FedAvg, participación del 100% de clientes, 1 epoch de entrenamiento local por ronda
Resultados de la Tarea Fed-ISIC 2019:
- FedOPAL-R obtiene el mejor ranking promedio (3,17), precisión promedio de 0,726
- El método de línea base FedPAL muestra buen desempeño (ranking promedio 3,50, precisión 0,726)
- En el cliente 2, FedPAL alcanza la precisión más alta de 0,931
Resultados de la Tarea Camelyon17-WILDS:
- FedDPA muestra el mejor desempeño (ranking promedio 2,40, precisión 0,909)
- FedOPAL-R obtiene la segunda mejor precisión promedio de 0,870
- Todos los métodos federados se acercan al desempeño del entrenamiento centralizado (0,905)
- Competitividad del Método: El método FedOPAL es competitivo con los métodos más avanzados existentes
- Problemas de Consistencia: Ningún método único muestra el mejor desempeño consistentemente en todos los clientes y tareas
- Efecto de Ortogonalización: La ortogonalización de representaciones (FedOPAL-R) generalmente supera a la ortogonalización de pesos (FedOPAL-W)
- Espacio para Mejora: Los resultados indican que aún hay espacio para mejoras adicionales
- Eficiencia de Parámetros: LoRA reduce los gastos de comunicación y los requisitos computacionales
- Métodos de Personalización: La personalización parcial del modelo mitiga la heterogeneidad de datos
- Avances Recientes: Métodos como FedDPA y FedSA exploran diferentes estrategias de personalización
- O-LoRA: Utiliza restricciones ortogonales en aprendizaje continuo para prevenir olvido catastrófico
- Aprendizaje de Subespacios: Restringe el aprendizaje de diferentes subespacios de características
- FedOPAL logra exitosamente el desacoplamiento de conocimiento general y específico mediante adaptadores LoRA ortogonales
- El método demuestra competitividad con métodos existentes en conjuntos de datos médicos reales
- La ortogonalización a nivel de representación es más efectiva que la ortogonalización a nivel de pesos
- Consistencia de Desempeño: El método no muestra desempeño suficientemente consistente entre diferentes clientes y tareas
- Resultados Preliminares: Los resultados actuales son de naturaleza preliminar y requieren análisis más profundo
- Sensibilidad de Hiperparámetros: La selección del parámetro λ puede afectar el desempeño del método
- Gastos Computacionales: El diseño de adaptador dual aumenta la complejidad computacional
- Optimización del Rango del Adaptador: Explorar la configuración óptima del rango para adaptadores globales y locales
- Mejora de la Separación de Conocimiento: Perfeccionar los métodos de separación entre conocimiento independiente del cliente y específico del cliente
- Evaluación Extendida: Realizar evaluación en modelos más grandes y más tareas
- Análisis Teórico: Proporcionar garantías teóricas y análisis de convergencia del método
- Innovación Fuerte: Primera introducción de restricciones ortogonales en ajuste fino federado con LoRA, enfoque novedoso
- Alto Valor Práctico: Aborda directamente las necesidades y desafíos reales de la IA médica
- Método Completo: Proporciona dos estrategias de ortogonalización diferentes a diferentes niveles
- Evaluación Suficiente: Realiza evaluación sistemática en conjuntos de datos médicos reales
- Base Teórica Débil: Carece de análisis teórico sobre la efectividad de las restricciones ortogonales
- Profundidad Experimental Insuficiente: Faltan experimentos de ablación detallados y análisis de sensibilidad de parámetros
- Mejora de Desempeño Limitada: La mejora respecto a métodos existentes es marginal
- Alcance de Evaluación Limitado: Solo se evalúa en dos conjuntos de datos
- Contribución Académica: Proporciona nuevas perspectivas para el campo de intersección entre aprendizaje federado e IA médica
- Perspectiva Práctica: Tiene potencial para aplicación en escenarios reales de aprendizaje federado médico
- Escalabilidad: El marco del método es extensible a otros dominios y tareas
- Colaboración Médica Multiinstitucional: Aplicable a escenarios de aprendizaje federado entre hospitales
- Tareas Sensibles a la Privacidad: Adecuado para aplicaciones que requieren protección estricta de privacidad de datos
- Entornos con Heterogeneidad de Datos: Particularmente adecuado para casos donde la distribución de datos difiere significativamente entre clientes
Este artículo se basa principalmente en trabajos importantes en aprendizaje federado (McMahan et al., 2017), adaptadores LoRA (Hu et al., 2022), aprendizaje ortogonal (Wang et al., 2023) y otros campos relacionados, proporcionando una nueva solución para el problema de ajuste fino federado en IA médica.
Resumen: Este es un trabajo innovador que aborda los desafíos del aprendizaje federado en IA médica, logrando el desacoplamiento de conocimiento mediante adaptadores LoRA ortogonales, mejorando los efectos de personalización mientras se protege la privacidad. Aunque los resultados actuales son de naturaleza preliminar, proporciona perspectivas valiosas y un marco de método novedoso para el campo.