Inclusive, Differentially Private Federated Learning for Clinical Data
Parampottupadam, CoÅÄun, Pati et al.
Federated Learning (FL) offers a promising approach for training clinical AI models without centralizing sensitive patient data. However, its real-world adoption is hindered by challenges related to privacy, resource constraints, and compliance. Existing Differential Privacy (DP) approaches often apply uniform noise, which disproportionately degrades model performance, even among well-compliant institutions. In this work, we propose a novel compliance-aware FL framework that enhances DP by adaptively adjusting noise based on quantifiable client compliance scores. Additionally, we introduce a compliance scoring tool based on key healthcare and security standards to promote secure, inclusive, and equitable participation across diverse clinical settings. Extensive experiments on public datasets demonstrate that integrating under-resourced, less compliant clinics with highly regulated institutions yields accuracy improvements of up to 15% over traditional FL. This work advances FL by balancing privacy, compliance, and performance, making it a viable solution for real-world clinical workflows in global healthcare.
يوفر التعلم الفيدرالي (FL) طريقة واعدة لتدريب نماذج الذكاء الاصطناعي السريرية دون الحاجة إلى تجميع بيانات المرضى الحساسة بشكل مركزي. ومع ذلك، يتم عرقلة تطبيقاته في العالم الحقيقي بسبب تحديات الخصوصية والقيود المتعلقة بالموارد والامتثال. عادةً ما تطبق الطرق الحالية للخصوصية التفاضلية (DP) ضوضاء موحدة، مما يقلل من أداء النموذج بشكل غير متناسب، حتى في المؤسسات ذات الامتثال الجيد. تقترح هذه الورقة إطار عمل فيدرالي جديد يراعي الامتثال، يعزز DP من خلال تعديل الضوضاء بشكل تكيفي بناءً على درجات امتثال العميل القابلة للقياس. بالإضافة إلى ذلك، يتم تقديم أداة تسجيل الامتثال بناءً على معايير الرعاية الصحية والسلامة الحرجة، لتعزيز المشاركة الآمنة والشاملة والعادلة في بيئات سريرية مختلفة. تُظهر التجارب الشاملة على مجموعات البيانات العامة أن دمج العيادات ذات الموارد المحدودة والامتثال المنخفض مع المؤسسات المنظمة بشدة يمكن أن ينتج عنه تحسن في الدقة يصل إلى 15% مقارنة بـ FL التقليدي.
يتطلب تطوير الذكاء الاصطناعي الطبي تعاونًا واسع النطاق في البيانات، لكن لوائح الخصوصية (مثل HIPAA و GDPR) والسياسات المؤسسية تحد من مشاركة البيانات. يوفر التعلم الفيدرالي حلاً، لكن الطرق الحالية تعاني من قيود كبيرة:
1. تهيئة النموذج العام
2. للجولة الفيدرالية = 1 إلى 50:
أ. تدريب العميل (3 حقب محلية)
ب. إرسال التحديثات إلى المجمّع
ج. تطبيق ضوضاء DP تكيفية بناءً على درجة الامتثال
د. تدريب المجمّع (حقبة واحدة مع DP)
هـ. التجميع العام (FedAvg/FedYogi/FedAdam وغيرها)
و. بث النموذج العام المحدّث
ممارسات التعاون في مجال الذكاء الاصطناعي الطبي 25,29,30
هجمات الخصوصية والحماية 8,32
أطر العمل التقنية ذات الصلة 4,11,34
التقييم الشامل: هذه ورقة ذات قيمة عملية مهمة في مجال التعلم الفيدرالي الطبي. من خلال آلية الخصوصية التفاضلية التكيفية التي تراعي الامتثال، تحل بشكل فعال أوجه القصور في الطرق الموجودة من حيث الشمول والفائدة. على الرغم من وجود مجال للتحسين في التحقق في البيئات الحقيقية والافتراضات الأمنية، فإنها توفر مسارًا تقنيًا واعدًا لتعزيز التعاون العالمي في مجال الذكاء الاصطناعي الطبي.