2025-11-13T13:28:10.924524

Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay

Jacobs, Morris, Shaik et al.
Sperm DNA fragmentation (SDF) is a critical parameter in male fertility assessment that conventional semen analysis fails to evaluate. This study presents the validation of a novel artificial intelligence (AI) tool designed to detect SDF through digital analysis of phase contrast microscopy images, using the terminal deoxynucleotidyl transferase dUTP nick end labeling (TUNEL) assay as the gold standard reference. Utilising the established link between sperm morphology and DNA integrity, the present work proposes a morphology assisted ensemble AI model that combines image processing techniques with state-of-the-art transformer based machine learning models (GC-ViT) for the prediction of DNA fragmentation in sperm from phase contrast images. The ensemble model is benchmarked against a pure transformer `vision' model as well as a `morphology-only` model. Promising results show the proposed framework is able to achieve sensitivity of 60\% and specificity of 75\%. This non-destructive methodology represents a significant advancement in reproductive medicine by enabling real-time sperm selection based on DNA integrity for clinical diagnostic and therapeutic applications.
academic

Validazione di uno Strumento di Intelligenza Artificiale per la Rilevazione della Frammentazione del DNA dello Sperma Utilizzando l'Analisi TUNEL In Situ Hybridization

Informazioni Fondamentali

  • ID Articolo: 2510.11142
  • Titolo: Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay
  • Autori: B. A. Jacobs, A. Morris, I. Shaik, F. Lin
  • Classificazione: cs.CV (Visione Artificiale)
  • Data di Pubblicazione: 13 ottobre 2025 (preprint arXiv)
  • Link Articolo: https://arxiv.org/abs/2510.11142v1

Riassunto

La frammentazione del DNA dello sperma (SDF) è un parametro cruciale nella valutazione della fertilità maschile, tuttavia l'analisi seminale tradizionale non è in grado di valutare questo indicatore. Questo studio propone e convalida un nuovo strumento di intelligenza artificiale per rilevare l'SDF attraverso l'analisi digitale di immagini di microscopia a contrasto di fase, utilizzando il metodo di marcatura terminale dUTP deossinucleotidil transferasi (TUNEL) come standard di riferimento. Sfruttando l'associazione consolidata tra la morfologia dello sperma e l'integrità del DNA, questo studio propone un modello AI integrato assistito dalla morfologia che combina tecniche di elaborazione delle immagini e modelli di apprendimento automatico basati su Transformer all'avanguardia (GC-ViT) per prevedere la frammentazione del DNA dello sperma nelle immagini a contrasto di fase. Il modello integrato è stato confrontato con modelli Transformer visivi puri e modelli basati esclusivamente sulla morfologia. I risultati mostrano che il framework proposto raggiunge una sensibilità del 60% e una specificità del 75%. Questo metodo non distruttivo rappresenta un progresso significativo per le applicazioni diagnostiche cliniche e terapeutiche in medicina riproduttiva, consentendo la selezione dello sperma in tempo reale basata sull'integrità del DNA.

Contesto di Ricerca e Motivazione

Definizione del Problema

  1. Problema Centrale: L'analisi seminale tradizionale non è in grado di valutare la frammentazione del DNA dello sperma (SDF), un parametro cruciale della fertilità, mentre l'SDF è strettamente correlato a tassi di fecondazione ridotti, sviluppo embrionale compromesso e aumento dei tassi di aborto spontaneo.
  2. Importanza Clinica:
    • L'infertilità colpisce circa il 15% delle coppie in età riproduttiva a livello mondiale, con fattori maschili che rappresentano il 30-50%
    • L'SDF influisce direttamente sul tasso di successo delle tecniche di riproduzione assistita (ART)
    • I metodi di rilevazione esistenti compromettono la vitalità dello sperma, rendendoli inadatti per i trattamenti successivi
  3. Limitazioni dei Metodi Esistenti:
    • Metodo TUNEL: Richiede apparecchiature specializzate e personale addestrato, è dispendioso in termini di tempo e costi, e il processo di fissazione e colorazione inattiva lo sperma
    • Incoerenza nei Metodi di Rilevazione: Molteplici metodi di rilevazione (AOT, CMA3, SCSA, COMET, SCD) producono risultati incoerenti
    • Forte Soggettività: L'interpretazione manuale presenta variabilità intra-osservatore e inter-osservatore
  4. Motivazione della Ricerca: Sviluppare uno strumento di rilevazione dell'SDF basato su AI non distruttivo, rapido e obiettivo, in grado di mantenere la vitalità dello sperma per i successivi protocolli ART.

Contributi Principali

  1. Propone un Modello AI Integrato Assistito dalla Morfologia: Combina tecniche di elaborazione delle immagini e il modello Transformer GC-ViT, sfruttando l'associazione tra la morfologia dello sperma e l'integrità del DNA per la previsione
  2. Sviluppa un Metodo di Rilevazione Non Distruttivo: Utilizza solo immagini di microscopia a contrasto di fase per la rilevazione dell'SDF, mantenendo la vitalità dello sperma per i trattamenti successivi
  3. Costruisce un Dataset Annotato: Contiene 1825 terzetti di immagini di sperma (campo luminoso, contrasto di fase, fluorescenza) provenienti da 35 pazienti
  4. Quantifica la Variabilità Intra-Osservatore: Rivela attraverso l'analisi digitale la soggettività della valutazione manuale tradizionale (coerenza intra-osservatore solo dell'81%)
  5. Stabilisce Benchmark di Prestazione: Convalida la fattibilità dello strumento assistito da AI con sensibilità del 60% e specificità del 75%

Dettagli Metodologici

Definizione del Compito

  • Input: Immagini di microscopia a contrasto di fase dello sperma
  • Output: Risultato di classificazione binaria (frammentazione del DNA/non frammentato)
  • Vincoli: Non distruttivo, elaborazione in tempo reale, applicabile a sperma vivo e morto

Architettura del Modello

1. Modello Integrato (Ensemble Model)

Input: Immagine a contrasto di fase + Caratteristiche morfologiche
     ↓
GC-ViT Transformer → Caratteristiche Visive
     ↓
Estrazione Caratteristiche Morfologiche → Caratteristiche Morfologiche  
     ↓
Modulo di Fusione Caratteristiche → Testa di Classificazione (1024→256 nodi)
     ↓
Output: Probabilità di Frammentazione del DNA

2. Modelli di Confronto

  • Modello Puramente Visivo: Utilizza solo GC-ViT per elaborare immagini a contrasto di fase
  • Modello Puramente Morfologico: Utilizza solo parametri morfologici estratti da immagini a contrasto di fase

3. Componenti Tecnici Chiave

  • GC-ViT Transformer: Transformer Visivo con Contesto Globale come rete backbone
  • Caratteristiche Morfologiche: Parametri quali lunghezza della testa, larghezza, presenza di vacuoli, area dell'acrosoma
  • Fusione Caratteristiche: Selezione adattiva di caratteristiche visive, morfologiche o entrambe
  • Testa di Classificazione: Rete a due strati completamente connessa (1024→256 nodi), con attivazione LeakyReLU e regolarizzazione Dropout

Punti di Innovazione Tecnica

  1. Fusione Multimodale: Prima applicazione della combinazione di modelli Transformer visivi con caratteristiche morfologiche dello sperma per la rilevazione dell'SDF
  2. Rilevazione Non Distruttiva: Supera i limiti della rilevazione chimica tradizionale, realizzando la rilevazione con mantenimento della vitalità
  3. Strategia di Apprendimento per Trasferimento: Adotta tassi di apprendimento decrescenti gerarchici e strategie di arresto anticipato per dataset di piccole dimensioni
  4. Quantificazione Oggettiva: Fornisce analisi quantitativa ripetibile, riducendo la soggettività umana

Configurazione Sperimentale

Dataset

  • Fonte dei Campioni: Campioni di sperma da 35 pazienti che hanno dato il consenso
  • Numero di Immagini: 1825 terzetti di immagini (campo luminoso, contrasto di fase, fluorescenza)
  • Distribuzione Annotazioni:
    • Frammentato: 512
    • Non frammentato: 715
    • Indeterminato: 591 (escluso)
  • Divisione dei Dati:
    • Set di Addestramento: 1017 immagini (28 pazienti)
    • Set di Validazione: 210 immagini (7 pazienti)
    • Raggruppamento per paziente per evitare perdita di dati

Metriche di Valutazione

  • Sensibilità (Recall): Proporzione di sperma frammentato correttamente identificato
  • Specificità: Proporzione di sperma non frammentato correttamente identificato
  • Precisione: Proporzione di veri positivi tra i predetti come frammentati
  • Accuratezza: Tasso di classificazione corretto complessivo
  • Punteggio F1: Media armonica di precisione e recall
  • Curva ROC: Curva Caratteristica Operativa del Ricevitore

Metodi di Confronto

  • Modello GC-ViT puramente visivo
  • Modello puramente morfologico
  • Modello integrato

Dettagli di Implementazione

  • Ottimizzatore: Adam, tasso di apprendimento iniziale 5×10⁻⁵
  • Strategia di Tasso di Apprendimento: Decadimento gerarchico (fattore di decadimento 0,12), rapporto di riscaldamento 0,1
  • Funzione di Perdita: Entropia incrociata binaria
  • Regolarizzazione: Dropout (0,6, 0,3), arresto anticipato (10 epoche)
  • Aumento dei Dati: Rotazione e capovolgimento casuali
  • Epoche di Addestramento: Massimo 50

Risultati Sperimentali

Risultati Principali

Tipo di ModelloSensibilitàSpecificitàPrecisioneAccuratezzaPunteggio F1
Modello Integrato0,600,750,600,690,60
Modello Morfologico0,780,440,470,570,59
Modello Puramente Visivo0,780,460,480,590,60

Scoperte Chiave

  1. Prestazioni Ottimali del Modello Integrato: Supera i modelli a modalità singola in termini di prestazioni bilanciate, raggiungendo un buon equilibrio tra sensibilità e specificità
  2. Variabilità Intra-Osservatore: La coerenza della riannotazione dello stesso esperto dopo 10 mesi è solo dell'81%, con una differenza media assoluta della percentuale di SDF a livello paziente di 13,7%±19,5%
  3. Stabilità del Modello: Le curve di apprendimento mostrano che il modello non presenta evidente overfitting, e la curva ROC è significativamente superiore alla classificazione casuale

Analisi di Casi

  • Casi Classificati Correttamente: Il modello integrato bilancia le informazioni visive e morfologiche, classificando correttamente anche quando una singola modalità fallisce
  • Casi di Classificazione Errata: Principalmente dovuti alla presenza di code di sperma multiple nell'immagine o sfocatura dell'immagine che causa errori nella misurazione morfologica

Lavori Correlati

Metodi Tradizionali di Rilevazione dell'SDF

  • Rilevazione TUNEL: Standard di riferimento ma distruttivo per la vitalità dello sperma
  • Altri Metodi: AOT, CMA3, SCSA, COMET, SCD, ecc., con risultati incoerenti

Applicazioni dell'AI nell'Analisi dello Sperma

  • Serrano Berenguer et al. (2022): Utilizza Random Forest e CNN per prevedere i risultati COMET
  • Wang et al. (2019): Modelli di regressione lineare e non lineare basati su dati AOT, accuratezza di test del 82,7%
  • Vantaggi di Questo Studio: Non distruttivo, fusione multimodale, capacità di elaborazione in tempo reale

Conclusioni e Discussione

Conclusioni Principali

  1. Sviluppo riuscito di uno strumento di rilevazione dell'SDF non distruttivo basato su AI
  2. Il modello integrato raggiunge prestazioni bilanciate con sensibilità del 60% e specificità del 75%
  3. Fornisce una nuova soluzione per la selezione dello sperma nelle tecniche di riproduzione assistita

Limitazioni

  1. Dimensione del Dataset: Il dataset relativamente piccolo limita il miglioramento ulteriore delle prestazioni del modello
  2. Annotazione di un Singolo Esperto: Manca l'annotazione di più esperti per valutare la variabilità inter-osservatore
  3. Sensibilità da Migliorare: La sensibilità del 60% ha ancora spazio per il miglioramento

Direzioni Future

  1. Espandere la dimensione del dataset di addestramento
  2. Condurre validazione clinica multicentrica
  3. Integrare intuizioni da molteplici metodi di rilevazione dell'SDF
  4. Sviluppare un sistema di applicazione clinica in tempo reale

Valutazione Approfondita

Punti di Forza

  1. Significato Clinico Importante: Affronta esigenze cliniche pratiche reali in medicina riproduttiva
  2. Forte Innovazione Tecnologica: Prima combinazione di Transformer con caratteristiche morfologiche dello sperma per la rilevazione dell'SDF
  3. Metodologia Rigorosa: Raggruppamento per paziente per evitare perdita di dati, quantificazione della variabilità intra-osservatore
  4. Alto Valore Pratico: La rilevazione non distruttiva mantiene la vitalità dello sperma, adatta all'applicazione clinica

Insufficienze

  1. Limitazione della Dimensione del Campione: 1825 campioni sono relativamente piccoli per modelli di deep learning
  2. Studio Monocentrico: Manca validazione multicentrica, la capacità di generalizzazione rimane da verificare
  3. Prestazioni da Migliorare: La sensibilità del 60% potrebbe non essere ideale per l'applicazione clinica
  4. Mancanza di Analisi Costo-Beneficio: Non fornisce confronto economico con i metodi tradizionali

Impatto

  1. Contributo Accademico: Fornisce nuove prospettive per l'applicazione dell'AI in medicina riproduttiva
  2. Potenziale di Traslazione Clinica: Potrebbe migliorare il tasso di successo dell'ART, beneficiando i pazienti infertili
  3. Valore di Promozione Tecnologica: Estensibile ad altri compiti di analisi di immagini mediche

Scenari Applicabili

  1. Procedure IVF/ICSI: Valutazione e selezione della qualità dello sperma preoperatoria
  2. Diagnosi di Infertilità Maschile: Fornisce valutazione oggettiva dell'SDF
  3. Ricerca in Medicina Riproduttiva: Strumento standardizzato di rilevazione dell'SDF
  4. Telemedicina: L'analisi automatizzata riduce la dipendenza dal personale specializzato

Bibliografia

Questo studio cita letteratura importante nei campi della medicina riproduttiva, dell'apprendimento automatico e dell'elaborazione delle immagini, inclusi il manuale WHO per l'esame seminale, i protocolli standard per la rilevazione TUNEL e le recenti ricerche sull'applicazione dell'AI nell'analisi di immagini mediche.


Valutazione Complessiva: Questo è uno studio interdisciplinare di importante valore clinico che applica tecnologie AI avanzate per risolvere problemi pratici reali in medicina riproduttiva. Sebbene vi sia ancora spazio per miglioramenti nella scala dei dati e nelle prestazioni, il concetto innovativo di rilevazione non distruttiva e l'approccio tecnico di fusione multimodale indicano la direzione dello sviluppo futuro in questo campo.