2025-11-13T11:58:11.146801

RedDino: A foundation model for red blood cell analysis

Zedda, Loddo, Di Ruberto et al.
Red blood cells (RBCs) are essential to human health, and their precise morphological analysis is important for diagnosing hematological disorders. Despite the promise of foundation models in medical diagnostics, comprehensive AI solutions for RBC analysis remain scarce. We present RedDino, a self-supervised foundation model designed for RBC image analysis. RedDino uses an RBC-specific adaptation of the DINOv2 self-supervised learning framework and is trained on a curated dataset of 1.25 million RBC images from diverse acquisition modalities and sources. Extensive evaluations show that RedDino outperforms existing state-of-the-art models on RBC shape classification. Through assessments including linear probing and nearest neighbor classification, we confirm its strong feature representations and generalization ability. Our main contributions are: (1) a foundation model tailored for RBC analysis, (2) ablation studies exploring DINOv2 configurations for RBC modeling, and (3) a detailed evaluation of generalization performance. RedDino addresses key challenges in computational hematology by capturing nuanced morphological features, advancing the development of reliable diagnostic tools. The source code and pretrained models for RedDino are available at https://github.com/Snarci/RedDino, and the pretrained models can be downloaded from our Hugging Face collection at https://huggingface.co/collections/Snarcy/reddino-689a13e29241d2e5690202fc
academic

RedDino: Un modello fondamentale per l'analisi dei globuli rossi

Informazioni Fondamentali

  • ID Articolo: 2508.08180
  • Titolo: RedDino: A foundation model for red blood cell analysis
  • Autori: Luca Zedda, Andrea Loddo, Cecilia Di Ruberto, Carsten Marr
  • Classificazione: eess.IV cs.AI cs.CV
  • Data di Pubblicazione: 22 agosto 2025 (arXiv v2)
  • Link Articolo: https://arxiv.org/abs/2508.08180

Riassunto

I globuli rossi (RBC) sono fondamentali per la salute umana e l'analisi morfologica precisa è essenziale per la diagnosi di malattie ematologiche. Sebbene i modelli fondamentali abbiano dimostrato un enorme potenziale nella diagnostica medica, mancano ancora soluzioni AI comprehensive per l'analisi dei RBC. Questo articolo propone RedDino, un modello fondamentale auto-supervisionato progettato specificamente per l'analisi di immagini di RBC. RedDino utilizza il framework di apprendimento auto-supervisionato DINOv2 specializzato per i RBC, addestrato su un dataset accuratamente curato contenente 1,25 milioni di immagini di RBC provenienti da diverse modalità di acquisizione e fonti. Una valutazione estensiva dimostra che RedDino supera significativamente i modelli all'avanguardia esistenti nei compiti di classificazione della forma dei RBC. Attraverso metodi di valutazione come il linear probing e la classificazione dei vicini più prossimi, sono state verificate le forti capacità di rappresentazione delle caratteristiche e la generalizzazione del modello.

Contesto di Ricerca e Motivazione

Definizione del Problema

L'analisi morfologica dei globuli rossi è fondamentale nella diagnostica ematologica, ma affronta le seguenti sfide critiche:

  1. Variabilità di colorazione e imaging: Diversi protocolli di colorazione e apparecchiature di imaging introducono distorsioni, aumentando la complessità dell'analisi
  2. Effetti batch: Esistono differenze sistematiche significative in scenari multi-fonte e multi-paziente
  3. Necessità di formazione specializzata: L'analisi tradizionale richiede una formazione professionale estensiva
  4. Mancanza di strumenti AI specializzati: Rispetto all'analisi dei globuli bianchi, l'analisi dei RBC manca di modelli fondamentali maturi

Motivazione della Ricerca

Sebbene i modelli fondamentali abbiano già dimostrato vantaggi significativi nell'analisi dei globuli bianchi, riuscendo a prevedere efficacemente gli esiti clinici e risolvere i problemi degli effetti batch, il campo dell'analisi dei RBC non ha ancora pienamente esplorato il potenziale di queste tecnologie avanzate. Questa ricerca mira a colmare questa lacuna sviluppando un modello fondamentale specializzato per l'analisi dei RBC.

Contributi Principali

  1. Modello fondamentale specializzato: Propone RedDino, la prima famiglia di modelli fondamentali auto-supervisionati ottimizzati specificamente per l'analisi dei RBC
  2. Ricerca approfondita sulla configurazione: Analisi comparativa rigorosa delle configurazioni di DINOv2 nella modellazione morfologica dei RBC
  3. Valutazione delle prestazioni completa: Benchmark estensivo su più dataset di RBC, dimostrando la superiorità rispetto ai modelli all'avanguardia esistenti
  4. Forte capacità di generalizzazione: Mitiga efficacemente le sfide degli effetti batch, mostrando eccellenti prestazioni di generalizzazione cross-domain

Spiegazione Dettagliata del Metodo

Definizione del Compito

RedDino mira ad apprendere rappresentazioni di caratteristiche universali dei RBC, supportando compiti downstream di classificazione della forma dei RBC, rilevamento di anomalie e analisi morfologica. L'input è costituito da immagini al microscopio di RBC, mentre l'output è un vettore di caratteristiche ad alta dimensionalità utilizzabile per vari compiti di analisi dei RBC.

Architettura del Modello

Framework Fondamentale

RedDino è costruito sul framework di apprendimento auto-supervisionato DINOv2, utilizzando Vision Transformer (ViT) come rete backbone. La famiglia di modelli include tre versioni:

  • RedDino Small: dimensione delle caratteristiche 384, dimensione batch 512, 22 milioni di parametri
  • RedDino Base: dimensione delle caratteristiche 768, dimensione batch 384, 86 milioni di parametri
  • RedDino Large: dimensione delle caratteristiche 1024, dimensione batch 256, 304 milioni di parametri

Miglioramenti Tecnici Chiave

  1. Rimozione del regolarizzatore Koleo: Il DINOv2 originale utilizza la regolarizzazione Koleo per prevenire il collasso delle caratteristiche, ma nello scenario dei RBC, a causa della coerenza naturale della forma e del colore dei RBC, questo regolarizzatore sopprime eccessivamente l'espressione delle caratteristiche dei RBC patologici e anomali
  2. Centralizzazione Sinkhorn-Knopp: Sostituisce la centralizzazione della media mobile, migliorando la qualità della rappresentazione
  3. Aumento dati personalizzato: Sostituisce la strategia di aumento originale di DINOv2 con 32 aumenti a livello di pixel dalla libreria Albumentations

Strategia di Elaborazione dei Dati

Costruzione dei Dati di Addestramento

  • Scala dei dati: 56.712 immagini grezze da 18 dataset, coprendo oltre 420 individui
  • Estrazione dei dati: Due metodi adottati
    1. Segmentazione cellulare utilizzando CellPose migliorato, producendo 3.076.269 cellule segmentate
    2. Estrazione di patch di immagine non sovrapposte di 224×224 pixel, generando 1.250.781 patch di immagine
  • Bilanciamento dei dati: Per mitigare lo squilibrio naturale tra globuli rossi e bianchi, sono stati inclusi dataset di immagini di globuli bianchi

Ottimizzazione della Strategia di Addestramento

Attraverso esperimenti sistematici è stato scoperto che:

  1. L'addestramento con patch di immagine è più efficace dell'addestramento con singole cellule
  2. La rimozione dei ritagli locali migliora significativamente le prestazioni
  3. La pipeline di aumento personalizzata migliora ulteriormente la qualità delle caratteristiche

Configurazione Sperimentale

Dataset

Dati di addestramento: 18 dataset pubblici di RBC, includendo diverse modalità di imaging, risoluzioni e tecniche di colorazione Dati di test:

  • Dataset Elsafty: 240.000 immagini, 9 classi, provenienti da 4 fonti diverse
  • Dataset Chula: 20.875 immagini, 12 classi di RBC
  • Dataset DSE: 5.659 immagini, 8 classi

Metriche di Valutazione

  • Accuratezza (Acc)
  • Accuratezza Bilanciata (bAcc)
  • Punteggio F1 Ponderato (wF1)

Metodi di Confronto

  • ResNet50
  • DINOv2 (Small/Base/Large)
  • DinoBloom (Small/Base/Large) - estrattore di caratteristiche all'avanguardia attuale per dati ematologici

Metodi di Valutazione

  1. Linear Probing: Valuta la capacità delle caratteristiche di adattarsi ai compiti downstream
  2. Classificazione K-Nearest Neighbor (1-NN, 20-NN): Valuta la robustezza delle caratteristiche sotto effetti batch
  3. Valutazione Cross-Source: Utilizza la strategia di validazione leave-one-source-out
  4. Validazione Incrociata a Cinque Fold: Per dataset sbilanciati

Risultati Sperimentali

Risultati Principali

Valutazione Cross-Source del Dataset Elsafty

Nella valutazione cross-source più impegnativa, RedDino ottiene vantaggi significativi:

ModelloLinear Probing wF11-NN wF120-NN wF1
ResNet5077,6±8,164,3±4,866,2±4,9
DinoBloom-L85,4±5,274,1±5,077,0±4,5
DINOv2 large86,0±5,673,7±6,276,4±7,0
RedDino base88,1±4,978,8±3,682,6±2,8
RedDino large88,5±5,578,5±4,681,6±4,7

Scoperte Chiave:

  • RedDino supera il metodo di base migliore di oltre il 2,1% (linear probing) e il 3,0% (classificazione dei vicini)
  • Il miglioramento medio raggiunge il 4,0-6,5%, mostrando un vantaggio di prestazione coerente

Prestazioni su Altri Dataset

Nella validazione incrociata a cinque fold sui dataset Chula e DSE, RedDino mostra ugualmente eccellenti prestazioni, superando i metodi di base in quasi tutte le metriche.

Esperimenti di Ablazione

Impatto dei miglioramenti di configurazione chiave:

  1. Rimozione del regolarizzatore Koleo: Migliora significativamente le prestazioni, evitando che le caratteristiche dei RBC patologici vengano eccessivamente soppresse
  2. Centralizzazione Sinkhorn-Knopp: Le prestazioni migliorano ulteriormente dopo la sostituzione della centralizzazione della media mobile
  3. Patch di immagine vs addestramento con singole cellule: La strategia di addestramento con patch di immagine è superiore all'addestramento con singole cellule
  4. Pipeline di aumento personalizzata: Mostra miglioramenti evidenti rispetto alla strategia di aumento originale di DINOv2

Analisi di Visualizzazione

Visualizzazione PCA

La visualizzazione PCA a tre componenti verifica l'efficacia delle caratteristiche di RedDino:

  • Riesce a distinguere sfondo, cellule, strutture di membrana e parassiti
  • Mostra eccellenti capacità di discriminazione per RBC infetti da malaria e morfologie anomale come le cellule spinose

Visualizzazione UMAP

La proiezione UMAP utilizzando il dataset Elsafty mostra:

  • Diverse classi formano cluster chiari, senza evidenti effetti batch
  • Le classi clinicamente difficili da distinguere (come RBC rotondi, elliptociti, ecc.) si sovrappongono effettivamente nello spazio delle caratteristiche
  • Gli aggregati cellulari formano cluster unici, provando che il modello può distinguere tra singole cellule e aggregati

Lavori Correlati

Stato Attuale dell'Analisi AI Ematologica

  • Analisi dei globuli bianchi: Già dispone di modelli fondamentali maturi come DinoBloom, che mostrano eccellenti prestazioni nella previsione degli esiti clinici
  • Analisi dei globuli rossi: Relativamente in ritardo nello sviluppo, manca di modelli fondamentali specializzati
  • Diagnostica Assistita da Computer: Sta gradualmente diventando uno strumento importante per affrontare le sfide diagnostiche critiche in ematologia

Applicazione dell'Apprendimento Auto-Supervisionato nell'Imaging Medico

Metodi auto-supervisionati come DINOv2 hanno ottenuto enormi successi su immagini naturali, ma la loro applicazione nell'imaging medico, in particolare nell'analisi dei RBC, rimane ancora da esplorare pienamente.

Conclusioni e Discussione

Conclusioni Principali

  1. Avanzamento delle Prestazioni: RedDino realizza nuove prestazioni all'avanguardia nei compiti di classificazione dei RBC
  2. Forte Capacità di Generalizzazione: Mitiga efficacemente gli effetti batch, mostrando eccellenti prestazioni in scenari cross-source
  3. Alto Valore Pratico: Fornisce uno strumento fondamentale affidabile per la diagnostica ematologica automatizzata

Limitazioni

  1. Limitazioni dei Dati di Addestramento: Sebbene la scala del dataset sia relativamente grande, potrebbe ancora mancare una rappresentazione sufficiente di alcune morfologie rare di RBC
  2. Requisiti di Risorse Computazionali: Le versioni di modelli più grandi richiedono risorse computazionali più elevate
  3. Dipendenza da Dati Annotati: I compiti downstream richiedono ancora una certa quantità di dati annotati per il fine-tuning

Direzioni Future

  1. Estensione degli Scenari Applicativi: Esplorare le applicazioni in altri compiti ematologici
  2. Compressione del Modello: Sviluppare versioni più leggere per ambienti con risorse limitate
  3. Fusione Multimodale: Combinare altri tipi di dati medici per migliorare l'accuratezza diagnostica

Valutazione Approfondita

Punti di Forza

  1. Forte Specificità del Problema: Affronta specificamente il campo importante ma trascurato dell'analisi dei RBC
  2. Design Metodologico Razionale: Miglioramenti mirati di DINOv2 in base alle caratteristiche dei RBC
  3. Rigoroso Design Sperimentale: Utilizza metodi di valutazione rigorosi come la validazione cross-source, garantendo l'affidabilità dei risultati
  4. Grande Contributo del Dataset: Costruisce il più grande insieme di addestramento di immagini di RBC fino ad oggi
  5. Favorevole all'Open Source: Fornisce codice completo e modelli pre-addestrati

Carenze

  1. Analisi Teorica Limitata: La spiegazione teorica del perché la rimozione del regolarizzatore Koleo sia efficace non è sufficientemente approfondita
  2. Analisi Insufficiente dei Costi Computazionali: Manca un'analisi dettagliata dei compromessi di efficienza computazionale tra diverse versioni di modelli
  3. Mancanza di Validazione Clinica: Assenza di risultati di validazione in ambienti clinici reali

Impatto

  1. Valore Accademico: Fornisce uno strumento fondamentale importante e benchmark per il campo dell'analisi dei RBC
  2. Valore Pratico: Ha il potenziale di migliorare significativamente il livello di automazione della diagnostica ematologica
  3. Riproducibilità: Fornisce un'implementazione open source completa, facilitando l'uso e il miglioramento da parte della comunità di ricerca

Scenari Applicabili

  • Diagnostica assistita in patologia ematologica
  • Screening ematologico su larga scala
  • Ricerca sulla morfologia dei RBC
  • Sviluppo di strumenti di formazione educativa in ematologia

Sintesi dell'Innovazione Tecnica

L'innovazione principale di RedDino risiede nell'adattamento con successo di un framework di apprendimento auto-supervisionato generico a un dominio medico specializzato, realizzando miglioramenti significativi delle prestazioni attraverso la rimozione di vincoli di regolarizzazione inadatti e l'ottimizzazione della strategia di addestramento. Questo fornisce un riferimento prezioso per lo sviluppo di modelli fondamentali per altri compiti di analisi di imaging medico.


Dichiarazione di Impatto Ambientale: L'articolo riporta un'impronta di carbonio sperimentale di 4,15 kg CO2eq, riflettendo l'attenzione verso la responsabilità ambientale.