Inclusive, Differentially Private Federated Learning for Clinical Data
Parampottupadam, CoÅÄun, Pati et al.
Federated Learning (FL) offers a promising approach for training clinical AI models without centralizing sensitive patient data. However, its real-world adoption is hindered by challenges related to privacy, resource constraints, and compliance. Existing Differential Privacy (DP) approaches often apply uniform noise, which disproportionately degrades model performance, even among well-compliant institutions. In this work, we propose a novel compliance-aware FL framework that enhances DP by adaptively adjusting noise based on quantifiable client compliance scores. Additionally, we introduce a compliance scoring tool based on key healthcare and security standards to promote secure, inclusive, and equitable participation across diverse clinical settings. Extensive experiments on public datasets demonstrate that integrating under-resourced, less compliant clinics with highly regulated institutions yields accuracy improvements of up to 15% over traditional FL. This work advances FL by balancing privacy, compliance, and performance, making it a viable solution for real-world clinical workflows in global healthcare.
academic
Инклюзивное дифференциально приватное федеративное обучение для клинических данных
Федеративное обучение (FL) предоставляет перспективный подход для обучения клинических моделей искусственного интеллекта без централизации конфиденциальных данных пациентов. Однако его применение в реальных условиях затруднено проблемами конфиденциальности, ограничениями ресурсов и требованиями соответствия. Существующие методы дифференциальной приватности (DP) обычно применяют унифицированный шум, что непропорционально снижает производительность модели даже в хорошо соответствующих учреждениях. В данной статье предлагается новая структура федеративного обучения, учитывающая соответствие, которая улучшает DP путем адаптивной регулировки шума на основе количественно измеримых оценок соответствия клиентов. Кроме того, представлен инструмент оценки соответствия, основанный на критических стандартах здравоохранения и безопасности, для содействия безопасному, инклюзивному и справедливому участию в различных клинических условиях. Обширные эксперименты на открытых наборах данных показывают, что интеграция клиник с недостаточными ресурсами и низким соответствием с высокорегулируемыми учреждениями может дать повышение точности до 15% по сравнению с традиционным FL.
Исследование решает три основные проблемы применения федеративного обучения в медицинской области:
Недостаточная защита конфиденциальности: традиционное FL уязвимо для атак реконструкции, обновления модели могут раскрыть конфиденциальную информацию
Исключение из-за ограничения ресурсов: реализация дифференциальной приватности требует специализированного оборудования, что препятствует участию небольших медицинских учреждений с ограниченными ресурсами
Различия в соответствии: существующие методы DP применяют унифицированный шум ко всем клиентам, игнорируя различия в соответствии между учреждениями
Развитие медицинского искусственного интеллекта требует крупномасштабного сотрудничества в области данных, однако нормативные акты по конфиденциальности (такие как HIPAA, GDPR) и политика учреждений ограничивают обмен данными. Федеративное обучение предоставляет решение, но существующие методы имеют значительные ограничения:
Только 5,2% исследований FL касаются реальных клинических приложений
Медицинские учреждения с ограниченными ресурсами маргинализированы
Унифицированные стратегии защиты конфиденциальности неэффективны
Предложена структура FL, учитывающая соответствие: адаптивная регулировка шума DP на основе оценок соответствия клиентов, балансирующая конфиденциальность, соответствие и производительность
Разработан инструмент оценки соответствия: веб-инструмент на основе стандартов здравоохранения и безопасности, предоставляющий количественные оценки соответствия
Реализована адаптивная серверная DP: позволяет клиникам с ограниченными ресурсами участвовать при балансировании конфиденциальности и производительности
Подтверждена инклюзивная эффективность: эксперименты доказывают, что интеграция учреждений с низким соответствием дает повышение точности на 1%-15%
Алгоритм 1: Федеративное обучение с адаптивным шумом и дифференциальной приватностью
1. Инициализация глобальной модели
2. Для раунда федеративного обучения = 1 до 50:
a. Обучение клиентов (3 локальных эпохи)
b. Отправка обновлений агрегатору
c. Применение адаптивного шума DP на основе оценки соответствия
d. Обучение агрегатора (1 эпоха с DP)
e. Глобальная агрегация (FedAvg/FedYogi/FedAdam и т.д.)
f. Трансляция обновленной глобальной модели
Инновация: динамическая регулировка шума в зависимости от уровня соответствия клиента, а не унифицированный шум
Преимущества: учреждения с высоким соответствием испытывают меньше потерь производительности, учреждения с низким соответствием все еще получают защиту конфиденциальности
Преимущества инклюзивности: Эксперимент 1 (4 с соответствием + 12 без соответствия) по сравнению с Экспериментом 4 (только 4 с соответствием) показывает повышение точности на 1%-15% по большинству стратегий
Лучшая производительность:
PneumoniaMNIST: FedYogi в Эксперименте 1 достигает 86,62%
BreastMNIST: FedYogi в Эксперименте 1 достигает 75,50%
Чувствительность стратегии: FedMedian чувствителен к распределению соответствия, производительность значительно снижается при высокой доле клиентов без соответствия
Влияние распределения соответствия: FedMedian показывает плохую производительность (50,01%) при 75% клиентов без соответствия, близко к производительности Vanilla FL при 37%
Инклюзивность ресурсов: структура успешно позволяет учреждениям с ограниченными ресурсами участвовать без специализированного оборудования
Баланс конфиденциальности и полезности: механизм адаптивного шума эффективно балансирует защиту конфиденциальности и производительность модели
Высокая инновационность: первое предложение механизма адаптивной DP, учитывающего соответствие
Высокая практическая ценность: решение ключевых препятствий развертывания медицинского FL в реальных условиях
Достаточные эксперименты: 61 конфигурация экспериментов, множество стратегий агрегации и наборов данных
Стандартизированный инструмент: предоставление настраиваемого инструмента оценки соответствия
Инклюзивный дизайн: позволяет учреждениям с ограниченными ресурсами участвовать в высококачественном сотрудничестве в области искусственного интеллекта
Общая оценка: Это статья с важной практической ценностью в области медицинского федеративного обучения. Благодаря механизму адаптивной дифференциальной приватности, учитывающему соответствие, она эффективно решает недостатки существующих методов в отношении инклюзивности и полезности. Хотя есть место для улучшения в проверке в реальной среде и предположениях о безопасности, она предоставляет перспективный технический путь для содействия глобальному сотрудничеству в области медицинского искусственного интеллекта.