2025-11-13T13:28:10.924524

Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay

Jacobs, Morris, Shaik et al.
Sperm DNA fragmentation (SDF) is a critical parameter in male fertility assessment that conventional semen analysis fails to evaluate. This study presents the validation of a novel artificial intelligence (AI) tool designed to detect SDF through digital analysis of phase contrast microscopy images, using the terminal deoxynucleotidyl transferase dUTP nick end labeling (TUNEL) assay as the gold standard reference. Utilising the established link between sperm morphology and DNA integrity, the present work proposes a morphology assisted ensemble AI model that combines image processing techniques with state-of-the-art transformer based machine learning models (GC-ViT) for the prediction of DNA fragmentation in sperm from phase contrast images. The ensemble model is benchmarked against a pure transformer `vision' model as well as a `morphology-only` model. Promising results show the proposed framework is able to achieve sensitivity of 60\% and specificity of 75\%. This non-destructive methodology represents a significant advancement in reproductive medicine by enabling real-time sperm selection based on DNA integrity for clinical diagnostic and therapeutic applications.
academic

Validierung eines Künstliche-Intelligenz-Tools zur Erkennung von Spermien-DNA-Fragmentierung mittels TUNEL-In-situ-Hybridisierungs-Assay

Grundinformationen

  • Paper-ID: 2510.11142
  • Titel: Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay
  • Autoren: B. A. Jacobs, A. Morris, I. Shaik, F. Lin
  • Klassifizierung: cs.CV (Computervision)
  • Veröffentlichungsdatum: 13. Oktober 2025 (arXiv-Preprint)
  • Paper-Link: https://arxiv.org/abs/2510.11142v1

Zusammenfassung

Die Spermien-DNA-Fragmentierung (SDF) ist ein Schlüsselparameter bei der Bewertung der männlichen Fertilität, kann aber durch traditionelle Spermiogramme nicht beurteilt werden. Diese Studie schlägt ein neuartiges Künstliche-Intelligenz-Tool vor und validiert es, das SDF durch digitale Analyse von Phasenkontrastmikroskopie-Bildern unter Verwendung der Terminalen Desoxynukleotidyl-Transferase dUTP Nick End Labeling (TUNEL)-Methode als Goldstandard erkennt. Unter Nutzung der etablierten Verbindung zwischen Spermien-Morphologie und DNA-Integrität wird ein morphologie-gestütztes integriertes KI-Modell vorgeschlagen, das Bildverarbeitungstechniken und ein hochmodernes Transformer-basiertes Maschinenlernmodell (GC-ViT) kombiniert, um die DNA-Fragmentierung von Spermien in Phasenkontrastbildern vorherzusagen. Das integrierte Modell wurde mit einem reinen Transformer-Sichtmodell und einem rein morphologie-basierten Modell verglichen. Die Ergebnisse zeigen, dass das vorgeschlagene Framework eine Sensitivität von 60% und eine Spezifität von 75% erreicht. Diese nicht-invasive Methode ermöglicht durch die Realisierung einer echtzeitgestützten Spermienauswahl basierend auf DNA-Integrität bedeutende Fortschritte in der klinischen Diagnostik und therapeutischen Anwendung der Reproduktionsmedizin.

Forschungshintergrund und Motivation

Problemdefinition

  1. Kernproblem: Traditionelle Spermiogramme können die Spermien-DNA-Fragmentierung (SDF), einen kritischen Fertilitätsparameter, nicht beurteilen, während SDF eng mit verminderter Befruchtungsrate, beeinträchtigter Embryonalentwicklung und erhöhter Fehlgeburtsrate verbunden ist.
  2. Klinische Bedeutung:
    • Infertilität betrifft etwa 15% der Paare im reproduktiven Alter weltweit, wobei männliche Faktoren 30-50% ausmachen
    • SDF beeinflusst direkt die Erfolgsrate der assistierten Reproduktionstechnologie (ART)
    • Bestehende Nachweismethoden beeinträchtigen die Spermien-Vitalität und können nicht für nachfolgende Behandlungen verwendet werden
  3. Einschränkungen bestehender Methoden:
    • TUNEL-Methode: Erfordert spezialisierte Ausrüstung und geschultes Personal, zeitaufwändig und kostspielig, Fixierungs- und Färbungsprozesse inaktivieren Spermien
    • Inkonsistente Nachweismethoden: Mehrere Nachweismethoden (AOT, CMA3, SCSA, COMET, SCD usw.) zeigen inkonsistente Ergebnisse
    • Hohe Subjektivität: Manuelle Interpretation weist Unterschiede innerhalb und zwischen Experten auf
  4. Forschungsmotivation: Entwicklung eines KI-gestützten, nicht-invasiven, schnellen und objektiven SDF-Nachweistools, das die Spermien-Vitalität für nachfolgende ART-Verfahren bewahrt.

Kernbeiträge

  1. Vorschlag eines morphologie-gestützten integrierten KI-Modells: Kombiniert Bildverarbeitungstechniken und das GC-ViT-Transformer-Modell und nutzt die Assoziation zwischen Spermien-Morphologie und DNA-Integrität für Vorhersagen
  2. Entwicklung einer nicht-invasiven Nachweismethode: Verwendet nur Phasenkontrastmikroskopie-Bilder zur SDF-Erkennung und bewahrt die Spermien-Vitalität für nachfolgende Behandlungen
  3. Konstruktion eines annotierten Datensatzes: Enthält 1825 Spermien-Bildtripel (Hellfeld, Phasenkontrast, Fluoreszenz) von 35 Patienten
  4. Quantifizierung der Intra-Experten-Variabilität: Offenbart durch digitale Analyse die Subjektivität der traditionellen manuellen Bewertung (Intra-Experten-Übereinstimmung nur 81%)
  5. Etablierung von Leistungs-Benchmarks: Validierung der Machbarkeit des KI-gestützten Tools bei Sensitivität von 60% und Spezifität von 75%

Methodische Details

Aufgabendefinition

  • Eingabe: Phasenkontrastmikroskopie-Bilder von Spermien
  • Ausgabe: Binäres Klassifizierungsergebnis (DNA-fragmentiert/nicht fragmentiert)
  • Einschränkungen: Nicht-invasiv, Echtzeitverarbeitung, anwendbar auf lebende und tote Spermien

Modellarchitektur

1. Integriertes Modell (Ensemble Model)

Eingabe: Phasenkontrastbild + Morphologische Merkmale
     ↓
GC-ViT Transformer → Visuelle Merkmale
     ↓
Morphologische Merkmalsextraktion → Morphologische Merkmale
     ↓
Merkmalsfusions-Modul → Klassifizierungskopf (1024→256 Knoten)
     ↓
Ausgabe: DNA-Fragmentierungs-Wahrscheinlichkeit

2. Vergleichsmodelle

  • Reines Sichtmodell: Verwendet nur GC-ViT zur Verarbeitung von Phasenkontrastbildern
  • Reines Morphologie-Modell: Verwendet nur aus Phasenkontrastbildern extrahierte morphologische Parameter

3. Schlüsseltechnische Komponenten

  • GC-ViT Transformer: Global Context Vision Transformer als Backbone-Netzwerk
  • Morphologische Merkmale: Kopflänge, -breite, Vakuolenvorhandensein, Akrosom-Region und andere Parameter
  • Merkmalsfusion: Adaptives Modul wählt visuelle Merkmale, morphologische Merkmale oder beide
  • Klassifizierungskopf: Zwei-schichtige vollständig verbundene Netzwerke (1024→256 Knoten) mit LeakyReLU-Aktivierung und Dropout-Regularisierung

Technische Innovationspunkte

  1. Multimodale Fusion: Erstmalige Kombination von Transformer-Sichtmodellen mit Spermien-Morphologie-Merkmalen zur SDF-Erkennung
  2. Nicht-invasiver Nachweis: Überwindet die Einschränkungen traditioneller chemischer Nachweismethoden und ermöglicht den Nachweis mit Vitalitätserhalt
  3. Transfer-Learning-Strategie: Hierarchisches Learning-Rate-Decay und Early-Stopping-Strategie für kleine Datensätze
  4. Objektive Quantifizierung: Bietet wiederholbare quantitative Analyse und reduziert menschliche Subjektivität

Experimentelle Einrichtung

Datensatz

  • Probenquelle: Spermaproben von 35 zustimmenden Patienten
  • Bildanzahl: 1825 Bildtripel (Hellfeld, Phasenkontrast, Fluoreszenz)
  • Annotationsverteilung:
    • Fragmentiert: 512
    • Nicht fragmentiert: 715
    • Nicht zu bestimmen: 591 (ausgeschlossen)
  • Datenteilung:
    • Trainingssatz: 1017 Bilder (28 Patienten)
    • Validierungssatz: 210 Bilder (7 Patienten)
    • Patientenbasierte Aufteilung zur Vermeidung von Datenlecks

Bewertungsmetriken

  • Sensitivität (Recall): Anteil der korrekt erkannten fragmentierten Spermien
  • Spezifität: Anteil der korrekt erkannten nicht fragmentierten Spermien
  • Präzision: Anteil der tatsächlich fragmentierten unter den als fragmentiert vorhergesagten
  • Genauigkeit (Accuracy): Gesamte Klassifizierungskorrektheit
  • F1-Score: Harmonisches Mittel von Präzision und Recall
  • ROC-Kurve: Receiver Operating Characteristic Curve

Vergleichsmethoden

  • GC-ViT reines Sichtmodell
  • Reines Morphologie-Modell
  • Integriertes Modell

Implementierungsdetails

  • Optimierer: Adam mit initialem Learning-Rate 5×10⁻⁵
  • Learning-Rate-Strategie: Hierarchisches Decay (Decay-Faktor 0,12), Aufwärmverhältnis 0,1
  • Verlustfunktion: Binäre Kreuzentropie
  • Regularisierung: Dropout (0,6, 0,3), Early Stopping (10 Runden)
  • Datenerweiterung: Zufällige Rotation und Spiegelung
  • Trainingsrunden: Maximal 50 Runden

Experimentelle Ergebnisse

Hauptergebnisse

ModelltypSensitivitätSpezifitätPräzisionGenauigkeitF1-Score
Integriertes Modell0,600,750,600,690,60
Morphologie-Modell0,780,440,470,570,59
Reines Sichtmodell0,780,460,480,590,60

Wichtigste Erkenntnisse

  1. Beste Leistung des integrierten Modells: Übertrifft Single-Modality-Modelle in ausgeglichener Leistung und erreicht ein gutes Gleichgewicht zwischen Sensitivität und Spezifität
  2. Intra-Experten-Variabilität: Die Übereinstimmung desselben Experten bei erneuter Annotation nach 10 Monaten beträgt nur 81%, mit absoluter mittlerer Differenz des Patienten-Level-SDF-Prozentsatzes von 13,7%±19,5%
  3. Modellstabilität: Lernkurven zeigen keine offensichtliche Überanpassung, ROC-Kurve ist deutlich besser als zufällige Klassifizierung

Fallstudien

  • Korrekt klassifizierte Fälle: Das integrierte Modell kann visuelle und morphologische Informationen ausgleichen und korrekt klassifizieren, wenn ein einzelnes Modality ausfällt
  • Fehlklassifizierte Fälle: Hauptsächlich verursacht durch mehrere Spermien-Schwänze im Bild oder verschwommene Bilder, die zu Fehlern bei der morphologischen Messung führen

Verwandte Arbeiten

Traditionelle SDF-Nachweismethoden

  • TUNEL-Methode: Goldstandard, aber beeinträchtigt die Spermien-Vitalität
  • Andere Methoden: AOT, CMA3, SCSA, COMET, SCD usw., mit inkonsistenten Ergebnissen

KI-Anwendungen in der Spermiogramm-Analyse

  • Serrano Berenguer et al. (2022): Verwendung von Random Forest und CNN zur Vorhersage von COMET-Ergebnissen
  • Wang et al. (2019): Lineare und nichtlineare Regressionsmodelle basierend auf AOT-Daten mit Test-Genauigkeit von 82,7%
  • Vorteile dieser Studie: Nicht-invasiv, multimodale Fusion, Echtzeit-Verarbeitungsfähigkeit

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Erfolgreiche Entwicklung eines KI-gestützten nicht-invasiven SDF-Nachweistools
  2. Das integrierte Modell erreicht ausgeglichene Leistung mit 60% Sensitivität und 75% Spezifität
  3. Bietet eine neue Lösung für die Spermienauswahl in der assistierten Reproduktionstechnologie

Einschränkungen

  1. Datensatzgröße: Relativ kleiner Datensatz begrenzt weitere Verbesserungen der Modellleistung
  2. Annotation durch einen Experten: Mangel an Multi-Experten-Annotation zur Bewertung der Inter-Experten-Variabilität
  3. Verbesserungsbedürftige Sensitivität: 60% Sensitivität hat noch Verbesserungspotenzial

Zukünftige Richtungen

  1. Erweiterung des Trainingsdatensatzes
  2. Durchführung von Multi-Center-Klinischen Validierungen
  3. Integration von Erkenntnissen mehrerer SDF-Nachweismethoden
  4. Entwicklung von Echtzeit-Klinischen-Anwendungssystemen

Tiefgreifende Bewertung

Stärken

  1. Große klinische Bedeutung: Löst tatsächliche klinische Anforderungen in der Reproduktionsmedizin
  2. Starke technische Innovation: Erstmalige Kombination von Transformer mit Spermien-Morphologie-Merkmalen zur SDF-Erkennung
  3. Strenge Methodologie: Patientenbasierte Aufteilung vermeidet Datenlecks, Intra-Experten-Variabilität wird quantifiziert
  4. Hoher praktischer Wert: Nicht-invasiver Nachweis bewahrt Spermien-Vitalität und ist für klinische Anwendungen geeignet

Mängel

  1. Begrenzte Stichprobengröße: 1825 Proben sind für Deep-Learning-Modelle relativ klein
  2. Single-Center-Studie: Mangel an Multi-Center-Validierung, Generalisierungsfähigkeit muss überprüft werden
  3. Leistung muss noch verbessert werden: 60% Sensitivität könnte für klinische Anwendungen nicht ideal sein
  4. Fehlende Kosteneffizienz-Analyse: Keine wirtschaftliche Vergleichbarkeit mit traditionellen Methoden

Auswirkungen

  1. Akademischer Beitrag: Bietet neue Perspektiven für KI-Anwendungen in der Reproduktionsmedizin
  2. Potenzial für klinische Übersetzung: Könnte die ART-Erfolgsrate verbessern und unfruchtbaren Patienten zugute kommen
  3. Wert der Technologieverbreitung: Erweiterbar auf andere medizinische Bildanalysaufgaben

Anwendungsszenarien

  1. IVF/ICSI-Verfahren: Präoperative Spermienqualitätsbewertung und -auswahl
  2. Diagnose männlicher Infertilität: Objektive SDF-Bewertung
  3. Reproduktionsmedizinische Forschung: Standardisiertes SDF-Nachweistool
  4. Telemedizin: Automatisierte Analyse reduziert Abhängigkeit von Fachpersonal

Literaturverzeichnis

Diese Studie zitiert wichtige Literatur aus den Bereichen Reproduktionsmedizin, Maschinelles Lernen und Bildverarbeitung, einschließlich WHO-Handbuch zur Spermiogramm-Analyse, standardisierte TUNEL-Nachweissprotokolle und aktuelle Forschungen zu KI-Anwendungen in der medizinischen Bildanalyse.


Gesamtbewertung: Dies ist eine wichtige interdisziplinäre Forschungsarbeit, die fortschrittliche KI-Technologie auf praktische Probleme in der Reproduktionsmedizin anwendet. Obwohl es noch Raum für Verbesserungen bei Datengröße und Leistung gibt, zeigt das innovative Konzept des nicht-invasiven Nachweises und die technische Route der multimodalen Fusion die Richtung für die Entwicklung dieses Feldes auf.