Red blood cells (RBCs) are essential to human health, and their precise morphological analysis is important for diagnosing hematological disorders. Despite the promise of foundation models in medical diagnostics, comprehensive AI solutions for RBC analysis remain scarce. We present RedDino, a self-supervised foundation model designed for RBC image analysis. RedDino uses an RBC-specific adaptation of the DINOv2 self-supervised learning framework and is trained on a curated dataset of 1.25 million RBC images from diverse acquisition modalities and sources. Extensive evaluations show that RedDino outperforms existing state-of-the-art models on RBC shape classification. Through assessments including linear probing and nearest neighbor classification, we confirm its strong feature representations and generalization ability. Our main contributions are: (1) a foundation model tailored for RBC analysis, (2) ablation studies exploring DINOv2 configurations for RBC modeling, and (3) a detailed evaluation of generalization performance. RedDino addresses key challenges in computational hematology by capturing nuanced morphological features, advancing the development of reliable diagnostic tools. The source code and pretrained models for RedDino are available at https://github.com/Snarci/RedDino, and the pretrained models can be downloaded from our Hugging Face collection at https://huggingface.co/collections/Snarcy/reddino-689a13e29241d2e5690202fc
- Papier-ID: 2508.08180
- Titel: RedDino: A foundation model for red blood cell analysis
- Autoren: Luca Zedda, Andrea Loddo, Cecilia Di Ruberto, Carsten Marr
- Klassifizierung: eess.IV cs.AI cs.CV
- Veröffentlichungsdatum: 22. August 2025 (arXiv v2)
- Papierlink: https://arxiv.org/abs/2508.08180
Rote Blutkörperchen (RBCs) sind für die menschliche Gesundheit von entscheidender Bedeutung, und eine präzise morphologische Analyse ist für die Diagnose hämatologischer Erkrankungen von großer Bedeutung. Obwohl Grundlagenmodelle großes Potenzial in der medizinischen Diagnostik zeigen, fehlt es noch immer an umfassenden KI-Lösungen für die RBC-Analyse. Dieser Artikel stellt RedDino vor, ein selbstüberwachtes Grundlagenmodell, das speziell für die RBC-Bildanalyse entwickelt wurde. RedDino nutzt das auf RBCs spezialisierte DINOv2-Framework für selbstüberwachtes Lernen und wird auf einem sorgfältig zusammengestellten Datensatz mit 1,25 Millionen RBC-Bildern aus verschiedenen Erfassungsmodi und Quellen trainiert. Umfangreiche Bewertungen zeigen, dass RedDino bei RBC-Formklassifizierungsaufgaben erheblich besser abschneidet als bestehende hochmoderne Modelle. Durch Evaluierungsmethoden wie lineare Sondierung und nächste-Nachbar-Klassifizierung wird die starke Merkmaldarstellung und Verallgemeinerungsfähigkeit des Modells validiert.
Die morphologische Analyse roter Blutkörperchen ist die Grundlage der hämatologischen Diagnostik, steht aber vor folgenden Schlüsselherausforderungen:
- Färbungs- und Abbildungsvariabilität: Unterschiedliche Färbungsprotokolle und Abbildungsgeräte führen zu Verzerrungen und erhöhen die Analysekomplexität
- Batch-Effekte: Signifikante systematische Unterschiede in Multi-Source-, Multi-Patienten-Szenarien
- Bedarf an Fachpersonalschulung: Traditionelle Analyse erfordert umfangreiche Fachschulung
- Mangel an speziellen KI-Tools: Im Vergleich zur Analyse weißer Blutkörperchen fehlt der Analyse roter Blutkörperchen ein ausgereiftes Grundlagenmodell
Während Grundlagenmodelle in der Analyse weißer Blutkörperchen bereits erhebliche Vorteile gezeigt haben und klinische Ergebnisse effektiv vorhersagen sowie Batch-Effekte beheben können, ist das Potenzial dieser fortschrittlichen Techniken im Bereich der RBC-Analyse noch nicht vollständig erforscht. Diese Forschung zielt darauf ab, diese Lücke zu schließen und ein speziell für die RBC-Analyse optimiertes Grundlagenmodell zu entwickeln.
- Spezialisiertes Grundlagenmodell: Präsentation von RedDino, der ersten Familie selbstüberwachter Grundlagenmodelle, die speziell für die RBC-Analyse optimiert wurden
- Eingehende Konfigurationsforschung: Strenge vergleichende Analyse der DINOv2-Konfiguration in der RBC-Morphologie-Modellierung
- Umfassende Leistungsbewertung: Umfangreiche Benchmarking-Tests auf mehreren RBC-Datensätzen, die die Überlegenheit gegenüber bestehenden hochmodernen Modellen demonstrieren
- Starke Verallgemeinerungsfähigkeit: Effektive Bewältigung von Batch-Effekt-Herausforderungen mit ausgezeichneter Cross-Domain-Verallgemeinerungsleistung
RedDino zielt darauf ab, universelle RBC-Merkmaldarstellungen zu erlernen, die nachgelagerte RBC-Formklassifizierung, Anomalieerkennung und morphologische Analyseaufgaben unterstützen. Die Eingabe sind RBC-Mikroskopiebilder, die Ausgabe sind hochdimensionale Merkmalsvektoren, die für verschiedene RBC-Analyseaufgaben verwendet werden können.
RedDino basiert auf dem DINOv2-Framework für selbstüberwachtes Lernen und nutzt Vision Transformer (ViT) als Backbone-Netzwerk. Die Modellfamilie umfasst drei Versionen:
- RedDino Small: Merkmalsdimension 384, Batch-Größe 512, 22 Millionen Parameter
- RedDino Base: Merkmalsdimension 768, Batch-Größe 384, 86 Millionen Parameter
- RedDino Large: Merkmalsdimension 1024, Batch-Größe 256, 304 Millionen Parameter
- Entfernung des Koleo-Regularisators: Das ursprüngliche DINOv2 verwendet Koleo-Regularisierung zur Verhinderung von Merkmalskollaps, aber in RBC-Szenarien unterdrückt dieser Regularisator aufgrund der natürlichen Konsistenz von RBC-Form und -Farbe übermäßig die Merkmalausdrücke pathologischer und anomaler RBCs
- Sinkhorn-Knopp-Zentrierung: Ersatz der exponentiellen Durchschnittszentrierung zur Verbesserung der Darstellungsqualität
- Benutzerdefinierte Datenerweiterung: Ersatz der ursprünglichen DINOv2-Erweiterungsstrategie durch 32 Pixel-Level-Erweiterungen aus der Albumentations-Bibliothek
- Datengröße: 56.712 Originalbilder aus 18 Datensätzen, die über 420 Personen verteilt sind
- Datenextraktion: Zwei Methoden werden verwendet
- Zellsegmentierung mit verbessertem CellPose, das 3.076.269 segmentierte Zellen erzeugt
- Extraktion von nicht überlappenden 224×224-Pixel-Bildblöcken, die 1.250.781 Bildblöcke erzeugen
- Datenausgleich: Zur Abschwächung des natürlichen Ungleichgewichts zwischen roten und weißen Blutkörperchen wurden Bilddatensätze weißer Blutkörperchen einbezogen
Durch systematische Experimente wurde festgestellt:
- Das Training mit Bildblöcken ist effektiver als das Training mit einzelnen Zellen
- Das Entfernen lokaler Zuschneide verbessert die Leistung erheblich
- Die benutzerdefinierte Erweiterungspipeline verbessert die Merkmalqualität weiter
Trainingsdaten: 18 öffentliche RBC-Datensätze mit verschiedenen Abbildungsmodi, Auflösungen und Färbungstechniken
Testdaten:
- Elsafty-Datensatz: 240.000 Bilder, 9 Kategorien, aus 4 verschiedenen Quellen
- Chula-Datensatz: 20.875 Bilder, 12 RBC-Kategorien
- DSE-Datensatz: 5.659 Bilder, 8 Kategorien
- Genauigkeit (Acc)
- Ausgeglichene Genauigkeit (bAcc)
- Gewichteter F1-Score (wF1)
- ResNet50
- DINOv2 (Small/Base/Large)
- DinoBloom (Small/Base/Large) - Aktueller hochmoderner Merkmalextraktor für hämatologische Daten
- Lineare Sondierung: Bewertung der Fähigkeit von Merkmalen, sich an nachgelagerte Aufgaben anzupassen
- K-Nearest-Neighbor-Klassifizierung (1-NN, 20-NN): Bewertung der Robustheit von Merkmalen unter Batch-Effekten
- Cross-Source-Bewertung: Verwendung der Leave-One-Source-Out-Validierungsstrategie
- Fünffach-Kreuzvalidierung: Für unausgeglichene Datensätze
In der anspruchsvollsten Cross-Source-Bewertung erreicht RedDino erhebliche Vorteile:
| Modell | Lineare Sondierung wF1 | 1-NN wF1 | 20-NN wF1 |
|---|
| ResNet50 | 77,6±8,1 | 64,3±4,8 | 66,2±4,9 |
| DinoBloom-L | 85,4±5,2 | 74,1±5,0 | 77,0±4,5 |
| DINOv2 large | 86,0±5,6 | 73,7±6,2 | 76,4±7,0 |
| RedDino base | 88,1±4,9 | 78,8±3,6 | 82,6±2,8 |
| RedDino large | 88,5±5,5 | 78,5±4,6 | 81,6±4,7 |
Wichtigste Erkenntnisse:
- RedDino verbessert sich um mehr als 2,1% (lineare Sondierung) und 3,0% (Nachbarklassifizierung) gegenüber der besten Baseline-Methode
- Die durchschnittliche Verbesserung beträgt 4,0-6,5%, was eine konsistente Leistungsüberlegenheit zeigt
Bei der fünffachen Kreuzvalidierung auf den Chula- und DSE-Datensätzen zeigt RedDino ebenfalls hervorragende Leistungen und übertrifft die Baseline-Methoden bei fast allen Metriken.
Auswirkungen wichtiger Konfigurationsverbesserungen:
- Entfernung des Koleo-Regularisators: Signifikante Leistungsverbesserung, vermeidet übermäßige Unterdrückung pathologischer RBC-Merkmale
- Sinkhorn-Knopp-Zentrierung: Weitere Leistungsverbesserung nach Ersatz der exponentiellen Durchschnittszentrierung
- Bildblöcke vs. Einzelzelltraining: Bildblock-Trainingsstrategie übertrifft Einzelzelltraining
- Benutzerdefinierte Erweiterungspipeline: Deutliche Verbesserung gegenüber der ursprünglichen DINOv2-Erweiterungsstrategie
Validierung der Effektivität von RedDino-Merkmalen durch dreidimensionale PCA-Visualisierung:
- Kann Hintergrund, Zellen, Membranstrukturen und Parasiten unterscheiden
- Zeigt ausgezeichnete Unterscheidungsfähigkeit für abnormale Morphologien wie malariabefallene RBCs und Stechzellen
UMAP-Projektion unter Verwendung des Elsafty-Datensatzes zeigt:
- Verschiedene Kategorien bilden klare Cluster ohne offensichtliche Batch-Effekte
- Klinisch schwer zu unterscheidende Kategorien (wie runde RBCs, Elliptozyten usw.) überlappen sich tatsächlich im Merkmalsraum
- Zellcluster bilden einzigartige Cluster und beweisen, dass das Modell zwischen einzelnen Zellen und Aggregaten unterscheiden kann
- Analyse weißer Blutkörperchen: Bereits ausgereifter Grundlagenmodelle wie DinoBloom, die bei der Vorhersage klinischer Ergebnisse hervorragende Leistungen zeigen
- Analyse roter Blutkörperchen: Im Vergleich dazu weniger entwickelt, mangelnde spezialisierte Grundlagenmodelle
- Computergestützte Diagnose: Wird in der Hämatologie allmählich zu einem wichtigen Werkzeug zur Bewältigung kritischer diagnostischer Herausforderungen
Selbstüberwachte Methoden wie DINOv2 haben auf natürlichen Bildern großen Erfolg erzielt, aber ihre Anwendung in der medizinischen Bildgebung, besonders in der RBC-Analyse, muss noch vollständig erforscht werden.
- Leistungsdurchbruch: RedDino erreicht hochmoderne Leistung bei RBC-Klassifizierungsaufgaben
- Starke Verallgemeinerungsfähigkeit: Effektive Bewältigung von Batch-Effekten mit ausgezeichneter Cross-Source-Leistung
- Hoher praktischer Wert: Bietet zuverlässige Grundwerkzeuge für automatisierte hämatologische Diagnostik
- Einschränkungen bei Trainingsdaten: Obwohl die Datensatzgröße relativ groß ist, kann es zu unzureichender Repräsentation einiger seltener RBC-Morphologien kommen
- Anforderungen an Rechenressourcen: Große Modellversionen erfordern höhere Rechenressourcen
- Abhängigkeit von annotierten Daten: Nachgelagerte Aufgaben erfordern immer noch eine bestimmte Menge an annotierten Daten für die Feinabstimmung
- Erweiterung von Anwendungsszenarien: Erkundung von Anwendungen in anderen hämatologischen Aufgaben
- Modellkomprimierung: Entwicklung leichterer Versionen für ressourcenbegrenzte Umgebungen
- Multimodale Fusion: Kombination anderer Arten von medizinischen Daten zur Verbesserung der Diagnosegenauigkeit
- Starke Problembezogenheit: Speziell auf das wichtige, aber vernachlässigte Feld der RBC-Analyse ausgerichtet
- Vernünftige Methodengestaltung: Zielgerichtete Verbesserungen von DINOv2 basierend auf RBC-Charakteristiken
- Strenge Experimentalgestaltung: Verwendung von Cross-Source-Validierung und anderen strengen Bewertungsmethoden zur Gewährleistung der Zuverlässigkeit der Ergebnisse
- Großer Datensatzbeitrag: Konstruktion der bisher größten RBC-Bildtrainingssatzsammlung
- Open-Source-freundlich: Bereitstellung vollständiger Code und vortrainierter Modelle
- Begrenzte theoretische Analyse: Theoretische Erklärung für die Effektivität der Entfernung des Koleo-Regularisators ist nicht ausreichend tiefgreifend
- Unzureichende Analyse der Rechenkosten: Keine detaillierte Analyse des Recheneffizienz-Kompromisses zwischen verschiedenen Modellversionen
- Mangel an klinischer Validierung: Fehlende Validierungsergebnisse in echten klinischen Umgebungen
- Akademischer Wert: Bietet wichtige Grundwerkzeuge und Benchmarks für das RBC-Analysefeld
- Praktischer Wert: Hat das Potenzial, die Automatisierungsebene der hämatologischen Diagnostik erheblich zu verbessern
- Reproduzierbarkeit: Bietet vollständige Open-Source-Implementierung für die Verwendung und Verbesserung durch die Forschungsgemeinschaft
- Unterstützung bei der Blutpathologie-Diagnose
- Großflächiges Blut-Screening
- RBC-Morphologie-Forschung
- Entwicklung von Werkzeugen zur hämatologischen Ausbildung
Die Kerninnnovation von RedDino liegt in der erfolgreichen Anpassung eines universellen selbstüberwachten Lernrahmens an spezialisierte medizinische Bereiche. Durch das Entfernen ungeeigneter Regularisierungsbeschränkungen und die Optimierung von Trainingsstrategien wird eine signifikante Leistungsverbesserung erreicht. Dies bietet wertvolle Referenzen für die Entwicklung von Grundlagenmodellen für andere medizinische Bildanalysaufgaben.
Erklärung zur Umweltauswirkung: Das Papier berichtet über Kohlenstoffemissionen von 4,15 kg CO2eq für die Experimente und zeigt damit Aufmerksamkeit für Umweltverantwortung.