2025-11-24T04:07:17.991345

Personalized Federated Fine-Tuning of Vision Foundation Models for Healthcare

Tupper, GagnÃ©

Foundation models open up new possibilities for the use of AI in healthcare. However, even when pre-trained on health data, they still need to be fine-tuned for specific downstream tasks. Furthermore, although foundation models reduce the amount of training data required to achieve good performance, obtaining sufficient data is still a challenge. This is due, in part, to restrictions on sharing and aggregating data from different sources to protect patients' privacy. One possible solution to this is to fine-tune foundation models via federated learning across multiple participating clients (i.e., hospitals, clinics, etc.). In this work, we propose a new personalized federated fine-tuning method that learns orthogonal LoRA adapters to disentangle general and client-specific knowledge, enabling each client to fully exploit both their own data and the data of others. Our preliminary results on real-world federated medical imaging tasks demonstrate that our approach is competitive against current federated fine-tuning methods.

academic

Персонализированная федеративная тонкая настройка моделей фундаментального зрения для здравоохранения

Основная информация

ID статьи: 2510.12741
Название: Personalized Federated Fine-Tuning of Vision Foundation Models for Healthcare
Авторы: Adam Tupper, Christian Gagné (Université Laval, Mila - Quebec AI Institute)
Классификация: cs.CV, cs.DC
Конференция публикации: SMASH 2025
Ссылка на статью: https://arxiv.org/abs/2510.12741

Аннотация

Фундаментальные модели открывают новые возможности для приложений медицинского ИИ, однако даже при предварительном обучении на данных здравоохранения требуют тонкой настройки для конкретных нижестоящих задач. Из-за ограничений, связанных с защитой конфиденциальности пациентов, совместное использование и агрегирование данных из различных источников остаются серьезной проблемой. В данной работе предложен новый метод персонализированной федеративной тонкой настройки FedOPAL, который путем обучения ортогональным адаптерам LoRA разделяет универсальные знания и знания, специфичные для клиента, позволяя каждому клиенту в полной мере использовать как собственные данные, так и данные других клиентов. Предварительные результаты на реальных федеративных задачах медицинской визуализации демонстрируют конкурентоспособность метода с существующими методами федеративной тонкой настройки.

Исследовательский контекст и мотивация

Основные проблемы

Ограничения конфиденциальности данных: Медицинские данные не могут быть централизованно агрегированы для обучения из-за строгих нормативных требований по защите конфиденциальности
Дефицит данных: Аннотированные наборы данных в медицинской визуализации редки и дорогостоящи в получении
Гетерогенность данных: Существуют значительные различия в распределении данных между различными медицинскими учреждениями
Коммуникационные издержки: Федеративное обучение больших фундаментальных моделей сталкивается с огромными коммуникационными затратами

Исследовательская мотивация

Хотя федеративное обучение решает ограничения совместного использования данных, оно вводит новые вызовы при тонкой настройке фундаментальных моделей
Существующие методы неэффективно справляются с проблемой гетерогенности данных между клиентами
Требуется метод федеративной тонкой настройки, который одновременно использует глобальные знания и сохраняет персонализацию

Основные вклады

Предложение метода FedOPAL: Новая структура персонализированной федеративной тонкой настройки, использующая ортогональные адаптеры LoRA для разделения универсальных и специфичных для клиента знаний
Механизм двойной ортогональной констрейнты: Разработаны два метода - ортогонализация весов (FedOPAL-W) и ортогонализация представлений (FedOPAL-R)
Валидация на реальных медицинских данных: Проверка эффективности метода на двух сложных наборах данных медицинской визуализации - Fed-ISIC 2019 и Camelyon17-WILDS
Систематический сравнительный анализ: Комплексное сравнение с несколькими современными методами федеративного обучения на основе LoRA

Подробное описание метода

Определение задачи

В задаче федеративной классификации медицинской визуализации несколько медицинских учреждений (клиентов) сотрудничают в обучении общей модели фундаментального зрения, одновременно защищая конфиденциальность собственных данных и справляясь с гетерогенностью распределения данных.

Архитектура модели

Дизайн двойного адаптера

FedOPAL использует архитектуру с двумя адаптерами LoRA:

Глобальный адаптер: Обновляется всеми клиентами совместно, изучает универсальные признаки
Персональный адаптер: Приватен для каждого клиента, изучает признаки, специфичные для клиента

Для предварительно обученной матрицы весов $W_0 \in \mathbb{R}^{d \times k}$ формула обновления имеет вид: $\Delta W = W_0 + B_{global}A_{global} + B_{personal}A_{personal}$

Механизм ортогональной констрейнты

1. Ортогонализация весов (FedOPAL-W) На основе метода O-LoRA применяется ортогональная констрейнта к весам адаптеров: $\ell_{orth} = \frac{1}{N} \sum_{i=1}^{N} |(A_i_{global})^T A_i_{personal}|$

2. Ортогонализация представлений (FedOPAL-R) Прямое ограничение изученных представлений путем минимизации косинусного сходства: $\ell_{orth} = \frac{1}{NB} \sum_{i=1}^{N} \sum_{j=1}^{B} |\cos(z_{global}^{i,j}, z_{personal}^{i,j})|$

Общая функция потерь: $\ell_{total} = \ell_{task} + \lambda \ell_{orth}$

Технические инновации

Механизм разделения знаний: Ортогональная констрейнта принуждает два адаптера изучать различные подпространства признаков
Двухуровневая ортогонализация: Предоставляет две стратегии ортогонализации - на уровне весов и на уровне представлений
Федеративная персонализация: Достигает персонализации клиента при сохранении глобального сотрудничества

Экспериментальная установка

Наборы данных

1. Fed-ISIC 2019

Масштаб: 6 клиентов из медицинских учреждений Австралии, Австрии, США и Испании
Задача: Классификация поражений кожи (9 диагностических категорий)
Особенности: Значительное смещение меток и неравномерный размер выборок

2. Camelyon17-WILDS

Масштаб: 5 клиентов (больницы), 7-10 пациентов на клиента
Задача: Классификация на уровне патчей метастазов рака молочной железы в срезах лимфатических узлов
Особенности: Цветовые вариации, вызванные различиями в процедурах окрашивания

Метрики оценки

Использована сбалансированная точность (balanced accuracy) для обработки дисбаланса классов

Методы сравнения

FedIT: Обучение матриц A и B единого глобального адаптера
FFA-LoRA: Фиксирование матрицы A, обучение только матрицы B
FedSA: Совместное использование матрицы A, персонализация матрицы B
FedDPA: Обучение независимых глобального и персонального адаптеров
FedPAL: Базовый метод без ортогональной констрейнты

Детали реализации

Модель: ViT-Tiny (9,7 млн параметров), предварительное обучение на ImageNet-21K
Оптимизатор: SGD, скорость обучения η ∈ {1e-4, 5e-4, 1e-3, 5e-3, 1e-2}
Федеративная установка: FedAvg, 100% участие клиентов, 1 эпоха локального обучения за раунд

Результаты экспериментов

Основные результаты

Результаты на задаче Fed-ISIC 2019:

FedOPAL-R достигает лучшего среднего рейтинга (3,17) со средней точностью 0,726
Базовый метод FedPAL показывает хорошие результаты (средний рейтинг 3,50, точность 0,726)
На клиенте 2 FedPAL достигает максимальной точности 0,931

Результаты на задаче Camelyon17-WILDS:

FedDPA показывает лучшие результаты (средний рейтинг 2,40, точность 0,909)
FedOPAL-R получает вторую лучшую среднюю точность 0,870
Все федеративные методы близки к производительности централизованного обучения (0,905)

Ключевые выводы

Конкурентоспособность метода: Метод FedOPAL конкурентоспособен с существующими передовыми методами
Проблема согласованности: Ни один метод не показывает постоянно лучшие результаты на всех клиентах и задачах
Эффект ортогонализации: Ортогонализация представлений (FedOPAL-R) обычно превосходит ортогонализацию весов (FedOPAL-W)
Пространство для улучшения: Результаты указывают на возможность дальнейшего совершенствования

Связанные работы

Комбинация федеративного обучения и LoRA

Параметрическая эффективность: LoRA снижает коммуникационные издержки и вычислительные требования
Методы персонализации: Частичная персонализация модели смягчает проблему гетерогенности данных
Последние достижения: Методы FedDPA, FedSA и другие исследуют различные стратегии персонализации

Методы ортогонального обучения

O-LoRA: Использование ортогональной констрейнты при непрерывном обучении для предотвращения катастрофического забывания
Обучение подпространствам: Ограничение изучения различных подпространств признаков

Заключение и обсуждение

Основные выводы

FedOPAL успешно достигает разделения универсальных и специфичных знаний через ортогональные адаптеры LoRA
Метод демонстрирует конкурентоспособность с существующими методами на реальных медицинских наборах данных
Ортогонализация на уровне представлений более эффективна, чем ортогонализация на уровне весов

Ограничения

Непостоянство производительности: Метод показывает непостоянные результаты на различных клиентах и задачах
Предварительные результаты: Текущие результаты носят предварительный характер и требуют более глубокого анализа
Чувствительность гиперпараметров: Выбор параметра λ может влиять на производительность метода
Вычислительные издержки: Дизайн с двойным адаптером увеличивает вычислительную сложность

Направления будущих исследований

Оптимизация ранга адаптера: Исследование оптимальных рангов для глобального и локального адаптеров
Улучшение разделения знаний: Совершенствование методов разделения знаний, независимых от клиента и специфичных для клиента
Расширенная оценка: Оценка на больших моделях и большем количестве задач
Теоретический анализ: Предоставление теоретических гарантий и анализа сходимости метода

Глубокая оценка

Преимущества

Высокая инновационность: Впервые вводит ортогональную констрейнту в федеративную тонкую настройку LoRA, новаторский подход
Высокая практическая ценность: Непосредственно решает реальные потребности и вызовы медицинского ИИ
Полнота метода: Предоставляет две стратегии ортогонализации на различных уровнях
Достаточная экспериментальная база: Систематическая оценка на реальных медицинских наборах данных

Недостатки

Слабая теоретическая база: Отсутствует теоретический анализ эффективности ортогональной констрейнты
Недостаточная глубина экспериментов: Отсутствуют детальные абляционные исследования и анализ чувствительности параметров
Ограниченное улучшение производительности: Улучшение по сравнению с существующими методами незначительно
Ограниченный диапазон оценки: Оценка проведена только на двух наборах данных

Влияние

Академический вклад: Предоставляет новые идеи для пересечения федеративного обучения и медицинского ИИ
Практические перспективы: Может быть применен в реальных сценариях федеративного обучения в здравоохранении
Масштабируемость: Методологическая структура может быть расширена на другие области и задачи

Применимые сценарии

Многоучреждческое медицинское сотрудничество: Применимо к сценариям федеративного обучения между больницами
Задачи, чувствительные к конфиденциальности: Подходит для приложений, требующих строгой защиты конфиденциальности данных
Среда с гетерогенными данными: Особенно подходит для случаев с большими различиями в распределении данных между клиентами

Библиография

Данная работа опирается на важные исследования в области федеративного обучения (McMahan et al., 2017), адаптеров LoRA (Hu et al., 2022), ортогонального обучения (Wang et al., 2023) и других смежных областей, предоставляя новое решение для проблемы федеративной тонкой настройки в медицинском ИИ.

Резюме: Это инновационная работа, адресующая вызовы федеративного обучения в медицинском ИИ, достигающая разделения знаний через ортогональные адаптеры LoRA, одновременно повышая эффективность персонализации при защите конфиденциальности. Хотя текущие результаты носят предварительный характер, работа предоставляет ценные новые идеи и методологическую структуру для данной области.