2025-11-13T11:58:11.146801

RedDino: A foundation model for red blood cell analysis

Zedda, Loddo, Di Ruberto et al.
Red blood cells (RBCs) are essential to human health, and their precise morphological analysis is important for diagnosing hematological disorders. Despite the promise of foundation models in medical diagnostics, comprehensive AI solutions for RBC analysis remain scarce. We present RedDino, a self-supervised foundation model designed for RBC image analysis. RedDino uses an RBC-specific adaptation of the DINOv2 self-supervised learning framework and is trained on a curated dataset of 1.25 million RBC images from diverse acquisition modalities and sources. Extensive evaluations show that RedDino outperforms existing state-of-the-art models on RBC shape classification. Through assessments including linear probing and nearest neighbor classification, we confirm its strong feature representations and generalization ability. Our main contributions are: (1) a foundation model tailored for RBC analysis, (2) ablation studies exploring DINOv2 configurations for RBC modeling, and (3) a detailed evaluation of generalization performance. RedDino addresses key challenges in computational hematology by capturing nuanced morphological features, advancing the development of reliable diagnostic tools. The source code and pretrained models for RedDino are available at https://github.com/Snarci/RedDino, and the pretrained models can be downloaded from our Hugging Face collection at https://huggingface.co/collections/Snarcy/reddino-689a13e29241d2e5690202fc
academic

RedDino: نموذج أساسي لتحليل خلايا الدم الحمراء

المعلومات الأساسية

  • معرّف الورقة: 2508.08180
  • العنوان: RedDino: A foundation model for red blood cell analysis
  • المؤلفون: Luca Zedda, Andrea Loddo, Cecilia Di Ruberto, Carsten Marr
  • التصنيف: eess.IV cs.AI cs.CV
  • تاريخ النشر: 22 أغسطس 2025 (arXiv v2)
  • رابط الورقة: https://arxiv.org/abs/2508.08180

الملخص

تعتبر خلايا الدم الحمراء (RBCs) ذات أهمية حيوية لصحة الإنسان، وتحليل الشكل الدقيق ضروري لتشخيص أمراض الدم. على الرغم من الإمكانيات الهائلة للنماذج الأساسية في التشخيص الطبي، لا تزال الحلول الشاملة القائمة على الذكاء الاصطناعي لتحليل RBC نادرة. تقدم هذه الورقة RedDino، وهو نموذج أساسي ذاتي الإشراف مصمم خصيصاً لتحليل صور RBC. يستخدم RedDino إطار عمل DINOv2 للتعلم ذاتي الإشراف المتخصص لـ RBC، ويتم تدريبه على مجموعة بيانات منسقة بعناية تحتوي على 1.25 مليون صورة RBC من أنماط وأصول جمع مختلفة. تُظهر التقييمات الشاملة أن RedDino يتفوق بشكل كبير على النماذج الحالية المتقدمة في مهام تصنيف شكل RBC. تم التحقق من قوة تمثيل الميزات وقدرة التعميم للنموذج من خلال طرق التقييم مثل الاستشعار الخطي وتصنيف أقرب الجيران.

الخلفية البحثية والدافع

تعريف المشكلة

يمثل تحليل شكل خلايا الدم الحمراء أساس التشخيص الهيماتولوجي، لكنه يواجه التحديات الرئيسية التالية:

  1. تباين الصبغ والتصوير: تقدم بروتوكولات الصبغ المختلفة وأجهزة التصوير انحيازات تزيد من تعقيد التحليل
  2. تأثيرات الدفعات: توجد اختلافات منهجية كبيرة في السيناريوهات متعددة المصادر والمرضى
  3. متطلبات تدريب الموظفين: يتطلب التحليل التقليدي تدريباً مكثفاً
  4. نقص أدوات الذكاء الاصطناعي المتخصصة: مقارنة بتحليل خلايا الدم البيضاء، يفتقر تحليل RBC إلى نماذج أساسية ناضجة

الدافع البحثي

على الرغم من أن النماذج الأساسية أظهرت مزايا كبيرة في تحليل خلايا الدم البيضاء، وقادرة على التنبؤ الفعال بالنتائج السريرية وحل مشاكل تأثيرات الدفعات، لم يتم استكشاف إمكانات هذه التقنيات المتقدمة بشكل كافٍ في مجال تحليل RBC. يهدف هذا البحث إلى سد هذه الفجوة بتطوير نموذج أساسي متخصص لتحليل RBC.

المساهمات الأساسية

  1. نموذج أساسي متخصص: تقديم RedDino، أول عائلة نماذج أساسية ذاتية الإشراف محسّنة خصيصاً لتحليل RBC
  2. دراسة تكوين معمقة: تحليل مقارن صارم لتكوينات DINOv2 في نمذجة شكل RBC
  3. تقييم أداء شامل: معايير واسعة النطاق على مجموعات بيانات RBC متعددة، مما يثبت التفوق على النماذج الحالية المتقدمة
  4. قدرة تعميم قوية: التخفيف الفعال من تحديات تأثيرات الدفعات، مع إظهار أداء تعميم متقاطع المجال ممتازة

شرح الطريقة

تعريف المهمة

يهدف RedDino إلى تعلم تمثيل ميزات عام لـ RBC، يدعم مهام تصنيف شكل RBC والكشف عن الشذوذ والتحليل الشكلي اللاحقة. الإدخال عبارة عن صور مجهرية RBC، والإخراج عبارة عن متجه ميزات عالي الأبعاد يمكن استخدامه لمختلف مهام تحليل RBC.

معمارية النموذج

الإطار الأساسي

يتم بناء RedDino على أساس إطار عمل DINOv2 للتعلم ذاتي الإشراف، باستخدام Vision Transformer (ViT) كشبكة العمود الفقري. تتضمن عائلة النماذج ثلاث نسخ:

  • RedDino Small: بُعد الميزة 384، حجم الدفعة 512، 22 مليون معامل
  • RedDino Base: بُعد الميزة 768، حجم الدفعة 384، 86 مليون معامل
  • RedDino Large: بُعد الميزة 1024، حجم الدفعة 256، 304 مليون معامل

تحسينات تقنية رئيسية

  1. إزالة منظم Koleo: يستخدم DINOv2 الأصلي تنظيم Koleo لمنع انهيار الميزات، لكن في سيناريوهات RBC، بسبب التناسق الطبيعي لشكل ولون RBC، يقوم هذا المنظم بقمع مفرط لتعبير ميزات RBC المرضية والشاذة
  2. مركزية Sinkhorn-Knopp: استبدال مركزية المتوسط المتحرك، مما يحسن جودة التمثيل
  3. تعزيز بيانات مخصص: استبدال استراتيجية التعزيز الأصلية لـ DINOv2 بـ 32 تعزيزاً على مستوى البكسل من مكتبة Albumentations

استراتيجية معالجة البيانات

بناء بيانات التدريب

  • حجم البيانات: 56,712 صورة أصلية من 18 مجموعة بيانات، تغطي أكثر من 420 فرداً
  • استخراج البيانات: استخدام طريقتين
    1. استخدام CellPose المحسّن لتقسيم الخلايا، ينتج 3,076,269 خلية مقسمة
    2. استخراج رقع صور غير متداخلة بحجم 224×224 بكسل، مما ينتج 1,250,781 رقعة صورة
  • توازن البيانات: للتخفيف من عدم التوازن الطبيعي بين خلايا الدم الحمراء والبيضاء، تم إدراج مجموعات بيانات صور خلايا الدم البيضاء

استراتيجية التدريب المحسّنة

من خلال التجارب المنهجية، تم اكتشاف:

  1. التدريب باستخدام رقع الصور أفضل من تدريب الخلايا الفردية
  2. إزالة المحاصيل المحلية تحسن الأداء بشكل كبير
  3. خط أنابيب التعزيز المخصص يحسن جودة الميزات بشكل إضافي

إعداد التجارب

مجموعات البيانات

بيانات التدريب: 18 مجموعة بيانات RBC عامة، تتضمن أنماط تصوير وقرارات وتقنيات صبغ مختلفة بيانات الاختبار:

  • مجموعة بيانات Elsafty: 240,000 صورة، 9 فئات، من 4 مصادر مختلفة
  • مجموعة بيانات Chula: 20,875 صورة، 12 فئة RBC
  • مجموعة بيانات DSE: 5,659 صورة، 8 فئات

مؤشرات التقييم

  • الدقة (Acc)
  • الدقة المتوازنة (bAcc)
  • درجة F1 المرجحة (wF1)

طرق المقارنة

  • ResNet50
  • DINOv2 (Small/Base/Large)
  • DinoBloom (Small/Base/Large) - أفضل مستخرج ميزات حالي لبيانات الدم

طرق التقييم

  1. الاستشعار الخطي: تقييم قدرة الميزات على التكيف مع المهام اللاحقة
  2. تصنيف K أقرب جار (1-NN, 20-NN): تقييم قوة الميزات تحت تأثيرات الدفعات
  3. التقييم عبر المصادر: استخدام استراتيجية التحقق من ترك مصدر واحد
  4. التحقق المتقاطع بخمس طيات: للمجموعات البيانية غير المتوازنة

نتائج التجارب

النتائج الرئيسية

تقييم عبر المصادر لمجموعة بيانات Elsafty

في التقييم الأكثر تحدياً عبر المصادر، حقق RedDino مزايا كبيرة:

النموذجwF1 الاستشعار الخطي1-NN wF120-NN wF1
ResNet5077.6±8.164.3±4.866.2±4.9
DinoBloom-L85.4±5.274.1±5.077.0±4.5
DINOv2 large86.0±5.673.7±6.276.4±7.0
RedDino base88.1±4.978.8±3.682.6±2.8
RedDino large88.5±5.578.5±4.681.6±4.7

النتائج الرئيسية:

  • يحقق RedDino تحسناً يزيد عن 2.1% (الاستشعار الخطي) و 3.0% (تصنيف الجيران) مقارنة بأفضل الطرق الأساسية
  • يصل متوسط التحسن إلى 4.0-6.5%، مما يدل على ميزة أداء متسقة

الأداء على مجموعات بيانات أخرى

في التحقق المتقاطع بخمس طيات لمجموعات بيانات Chula و DSE، أظهر RedDino أداءً متفوقاً أيضاً، متفوقاً على الطرق الأساسية في جميع المؤشرات تقريباً.

تجارب الاستئصال

تأثير تحسينات التكوين الرئيسية:

  1. إزالة منظم Koleo: تحسن الأداء بشكل كبير، مما يمنع قمع ميزات RBC المرضية
  2. مركزية Sinkhorn-Knopp: يحسن الأداء بشكل إضافي عند استبدال مركزية المتوسط المتحرك
  3. رقع الصور مقابل تدريب الخلايا الفردية: استراتيجية تدريب رقع الصور تتفوق على تدريب الخلايا الفردية
  4. خط أنابيب التعزيز المخصص: تحسن واضح مقارنة باستراتيجية التعزيز الأصلية لـ DINOv2

تحليل التصور

تصور PCA

يتم التحقق من فعالية ميزات RedDino من خلال تصور PCA ثلاثي المكونات:

  • القدرة على التمييز بين الخلفية والخلايا وهياكل الأغشية والطفيليات
  • إظهار قدرة تمييز ممتازة لـ RBC المصابة بالملاريا والخلايا الشوكية وغيرها من الأشكال الشاذة

تصور UMAP

يُظهر إسقاط UMAP لمجموعة بيانات Elsafty:

  • تشكيل فئات مختلفة عناقيد واضحة، بدون تأثيرات دفعات واضحة
  • تداخل الفئات التي يصعب تمييزها سريرياً (مثل RBC الدائرية والخلايا البيضاوية) في الواقع في فضاء الميزات
  • تشكيل مجموعات الخلايا عناقيد فريدة، مما يثبت قدرة النموذج على التمييز بين الخلايا الفردية والمجاميع

الأعمال ذات الصلة

الحالة الحالية لتحليل الدم بالذكاء الاصطناعي

  • تحليل خلايا الدم البيضاء: نماذج أساسية ناضجة موجودة مثل DinoBloom، تُظهر أداءً ممتازة في التنبؤ بالنتائج السريرية
  • تحليل خلايا الدم الحمراء: متخلفة نسبياً في التطور، تفتقر إلى نماذج أساسية متخصصة
  • التشخيص بمساعدة الحاسوب: تصبح تدريجياً أداة مهمة لحل التحديات التشخيصية الرئيسية في الدم

تطبيق التعلم ذاتي الإشراف في الصور الطبية

حققت الطرق ذاتية الإشراف مثل DINOv2 نجاحاً هائلاً على الصور الطبيعية، لكن تطبيقها في الصور الطبية وخاصة تحليل RBC لا يزال يتطلب استكشافاً شاملاً.

الاستنتاج والمناقشة

الاستنتاجات الرئيسية

  1. اختراق الأداء: حقق RedDino أداءً متقدماً جديداً في مهام تصنيف RBC
  2. قدرة تعميم قوية: التخفيف الفعال من تأثيرات الدفعات، مع أداء ممتازة في السيناريوهات عبر المصادر
  3. قيمة عملية عالية: توفير أداة أساسية موثوقة للتشخيص الهيماتولوجي الآلي

القيود

  1. قيود بيانات التدريب: على الرغم من حجم مجموعة البيانات الكبير نسبياً، قد لا تزال هناك تمثيل غير كافٍ لبعض أشكال RBC النادرة
  2. متطلبات الموارد الحسابية: تتطلب نسخ النماذج الكبيرة موارد حسابية أعلى
  3. الاعتماد على البيانات المُسمّاة: لا تزال المهام اللاحقة تتطلب كمية معينة من البيانات المُسمّاة للضبط الدقيق

الاتجاهات المستقبلية

  1. توسيع سيناريوهات التطبيق: استكشاف التطبيقات في مهام هيماتولوجية أخرى
  2. ضغط النموذج: تطوير نسخ أخف وزناً للبيئات محدودة الموارد
  3. دمج متعدد الأنماط: دمج أنواع أخرى من البيانات الطبية لتحسين دقة التشخيص

التقييم المتعمق

المزايا

  1. استهداف المشكلة قوي: معالجة متخصصة لمجال تحليل RBC المهم لكن المهمل
  2. تصميم الطريقة معقول: تحسينات موجهة لـ DINOv2 بناءً على خصائص RBC
  3. تصميم التجارب صارم: استخدام طرق تقييم صارمة مثل التحقق من ترك مصدر واحد، مما يضمن موثوقية النتائج
  4. مساهمة مجموعة البيانات كبيرة: بناء أكبر مجموعة بيانات تدريب صور RBC حتى الآن
  5. ودود للمصدر المفتوح: توفير تطبيق مفتوح المصدر كامل والنماذج المدربة مسبقاً

أوجه القصور

  1. تحليل نظري محدود: الشرح النظري لسبب فعالية إزالة منظم Koleo غير كافٍ
  2. تحليل تكلفة الحساب غير كافٍ: لم يتم تحليل المقايضات بين الكفاءة الحسابية لنسخ النماذج المختلفة بالتفصيل
  3. نقص التحقق السريري: عدم وجود نتائج التحقق في بيئة سريرية حقيقية

التأثير

  1. القيمة الأكاديمية: توفير أداة أساسية مهمة ومعايير لمجال تحليل RBC
  2. القيمة العملية: لديها إمكانية تحسين مستوى الأتمتة في التشخيص الهيماتولوجي بشكل كبير
  3. قابلية إعادة الإنتاج: توفير تطبيق مفتوح المصدر كامل، مما يسهل استخدام المجتمع البحثي وتحسينه

السيناريوهات القابلة للتطبيق

  • مساعدة تشخيص أمراض الدم المرضية
  • الفحص الدموي على نطاق واسع
  • أبحاث شكل خلايا الدم الحمراء
  • تطوير أدوات التدريب التعليمي الهيماتولوجي

ملخص الابتكار التقني

يكمن الابتكار الأساسي لـ RedDino في التكيف الناجح لإطار عمل التعلم ذاتي الإشراف العام مع المجال الطبي المتخصص، من خلال إزالة قيود التنظيم غير المناسبة وتحسين استراتيجيات التدريب، مما يحقق تحسناً كبيراً في الأداء. يوفر هذا مرجعاً قيماً لتطوير النماذج الأساسية لمهام تحليل الصور الطبية الأخرى.


بيان التأثير البيئي: تقرر الورقة انبعاثات الكربون للتجارب بمقدار 4.15 كجم CO2eq، مما يعكس الاهتمام بالمسؤولية البيئية.