2025-11-13T13:28:10.924524

Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay

Jacobs, Morris, Shaik et al.
Sperm DNA fragmentation (SDF) is a critical parameter in male fertility assessment that conventional semen analysis fails to evaluate. This study presents the validation of a novel artificial intelligence (AI) tool designed to detect SDF through digital analysis of phase contrast microscopy images, using the terminal deoxynucleotidyl transferase dUTP nick end labeling (TUNEL) assay as the gold standard reference. Utilising the established link between sperm morphology and DNA integrity, the present work proposes a morphology assisted ensemble AI model that combines image processing techniques with state-of-the-art transformer based machine learning models (GC-ViT) for the prediction of DNA fragmentation in sperm from phase contrast images. The ensemble model is benchmarked against a pure transformer `vision' model as well as a `morphology-only` model. Promising results show the proposed framework is able to achieve sensitivity of 60\% and specificity of 75\%. This non-destructive methodology represents a significant advancement in reproductive medicine by enabling real-time sperm selection based on DNA integrity for clinical diagnostic and therapeutic applications.
academic

Validation d'un outil d'intelligence artificielle pour la détection de la fragmentation de l'ADN du sperme utilisant le dosage TUNEL par hybridation in situ

Informations de base

  • ID de l'article: 2510.11142
  • Titre: Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay
  • Auteurs: B. A. Jacobs, A. Morris, I. Shaik, F. Lin
  • Classification: cs.CV (Vision par ordinateur)
  • Date de publication: 13 octobre 2025 (prépublication arXiv)
  • Lien de l'article: https://arxiv.org/abs/2510.11142v1

Résumé

La fragmentation de l'ADN du sperme (SDF) est un paramètre clé dans l'évaluation de la fertilité masculine, mais l'analyse conventionnelle du sperme ne peut pas évaluer cet indicateur. Cette étude propose et valide un nouvel outil d'intelligence artificielle pour détecter la SDF par analyse numérique d'images de microscopie en contraste de phase, en utilisant le dosage TUNEL (Terminal deoxynucleotidyl transferase dUTP nick end labeling) comme référence étalon-or. En exploitant la relation établie entre la morphologie du sperme et l'intégrité de l'ADN, cette étude propose un modèle d'IA intégré assisté par la morphologie, qui combine des techniques de traitement d'images et un modèle d'apprentissage automatique de pointe basé sur Transformer (GC-ViT) pour prédire la fragmentation de l'ADN du sperme dans les images en contraste de phase. Le modèle intégré a été comparé à un modèle de vision Transformer pur et à un modèle basé uniquement sur la morphologie. Les résultats montrent que le cadre proposé atteint une sensibilité de 60 % et une spécificité de 75 %. Cette approche non destructive apporte des progrès significatifs aux applications diagnostiques et thérapeutiques cliniques en médecine reproductive en permettant la sélection des spermatozoïdes en temps réel basée sur l'intégrité de l'ADN.

Contexte et motivation de la recherche

Définition du problème

  1. Problème fondamental: L'analyse conventionnelle du sperme ne peut pas évaluer la fragmentation de l'ADN du sperme (SDF), un paramètre clé de la fertilité, qui est étroitement associée à une diminution des taux de fécondation, à une altération du développement embryonnaire et à une augmentation des taux de fausse couche.
  2. Importance clinique:
    • L'infertilité affecte environ 15 % des couples en âge de procréer dans le monde, le facteur masculin représentant 30-50 %
    • La SDF affecte directement le taux de succès des techniques de procréation médicalement assistée (PMA)
    • Les méthodes de détection existantes détruisent la viabilité du sperme et ne peuvent pas être utilisées pour les traitements ultérieurs
  3. Limitations des méthodes existantes:
    • Dosage TUNEL: Nécessite un équipement spécialisé et du personnel qualifié, est chronophage et coûteux, et le processus de fixation et de coloration inactif les spermatozoïdes
    • Incohérence des méthodes de détection: Plusieurs méthodes de détection (AOT, CMA3, SCSA, COMET, SCD, etc.) donnent des résultats incohérents
    • Forte subjectivité: L'interprétation manuelle présente des variations intra-observateur et inter-observateur
  4. Motivation de la recherche: Développer un outil de détection SDF basé sur l'IA, non destructif, rapide et objectif, capable de maintenir la viabilité du sperme pour les procédures PMA ultérieures.

Contributions principales

  1. Proposition d'un modèle d'IA intégré assisté par la morphologie: Combinant des techniques de traitement d'images et le modèle Transformer GC-ViT, utilisant l'association entre la morphologie du sperme et l'intégrité de l'ADN pour la prédiction
  2. Développement d'une méthode de détection non destructive: Utilisant uniquement des images de microscopie en contraste de phase pour la détection SDF, maintenant la viabilité du sperme pour les traitements ultérieurs
  3. Construction d'un ensemble de données annotées: Contenant 1825 triplets d'images de spermatozoïdes (champ clair, contraste de phase, fluorescence) provenant de 35 patients
  4. Quantification de la variabilité intra-observateur: Révélant la subjectivité de l'évaluation manuelle traditionnelle par analyse numérique (cohérence intra-observateur de seulement 81 %)
  5. Établissement d'un repère de performance: Validation de la faisabilité de l'outil assisté par IA avec une sensibilité de 60 % et une spécificité de 75 %

Détails méthodologiques

Définition de la tâche

  • Entrée: Image de microscopie en contraste de phase du spermatozoïde
  • Sortie: Résultat de classification binaire (fragmentation de l'ADN / pas de fragmentation)
  • Contraintes: Non destructif, traitement en temps réel, applicable aux spermatozoïdes vivants et morts

Architecture du modèle

1. Modèle intégré (Ensemble Model)

Entrée: Image en contraste de phase + Caractéristiques morphologiques
     ↓
GC-ViT Transformer → Caractéristiques visuelles
     ↓
Extraction de caractéristiques morphologiques → Caractéristiques morphologiques  
     ↓
Module de fusion de caractéristiques → Tête de classification (1024→256 nœuds)
     ↓
Sortie: Probabilité de fragmentation de l'ADN

2. Modèles de comparaison

  • Modèle de vision pur: Utilisant uniquement GC-ViT pour traiter les images en contraste de phase
  • Modèle morphologique pur: Utilisant uniquement les paramètres morphologiques extraits des images en contraste de phase

3. Composants techniques clés

  • GC-ViT Transformer: Transformateur de vision avec contexte global comme réseau de base
  • Caractéristiques morphologiques: Paramètres tels que la longueur et la largeur de la tête, la présence de vacuoles, la région acrosomale, etc.
  • Fusion de caractéristiques: Module de sélection adaptative des caractéristiques visuelles, morphologiques ou les deux
  • Tête de classification: Réseau de deux couches entièrement connectées (1024→256 nœuds), utilisant l'activation LeakyReLU et la régularisation Dropout

Points d'innovation technique

  1. Fusion multimodale: Première combinaison d'un modèle de vision Transformer avec des caractéristiques morphologiques du sperme pour la détection SDF
  2. Détection non destructive: Dépassant les limitations de la détection chimique traditionnelle, réalisant une détection préservant la viabilité
  3. Stratégie d'apprentissage par transfert: Utilisant une décroissance du taux d'apprentissage hiérarchisée et un arrêt précoce adaptés aux petits ensembles de données
  4. Quantification objective: Fournissant une analyse quantitative reproductible, réduisant la subjectivité humaine

Configuration expérimentale

Ensemble de données

  • Source des échantillons: Échantillons de sperme de 35 patients consentants
  • Nombre d'images: 1825 triplets d'images (champ clair, contraste de phase, fluorescence)
  • Distribution des annotations:
    • Fragmenté: 512
    • Non fragmenté: 715
    • Indéterminé: 591 (exclu)
  • Division des données:
    • Ensemble d'entraînement: 1017 images (28 patients)
    • Ensemble de validation: 210 images (7 patients)
    • Groupement par patient pour éviter les fuites de données

Métriques d'évaluation

  • Sensibilité (Rappel): Proportion de spermatozoïdes fragmentés correctement identifiés
  • Spécificité: Proportion de spermatozoïdes non fragmentés correctement identifiés
  • Précision: Proportion de vrais positifs parmi les prédictions positives
  • Exactitude: Taux de classification correcte global
  • Score F1: Moyenne harmonique de la précision et du rappel
  • Courbe ROC: Courbe caractéristique de fonctionnement du récepteur

Méthodes de comparaison

  • Modèle de vision pur GC-ViT
  • Modèle morphologique pur
  • Modèle intégré

Détails d'implémentation

  • Optimiseur: Adam, taux d'apprentissage initial 5×10⁻⁵
  • Stratégie de taux d'apprentissage: Décroissance hiérarchisée (facteur de décroissance 0,12), ratio de préchauffage 0,1
  • Fonction de perte: Entropie croisée binaire
  • Régularisation: Dropout (0,6, 0,3), arrêt précoce (10 tours)
  • Augmentation des données: Rotation et retournement aléatoires
  • Nombre de tours d'entraînement: Maximum 50

Résultats expérimentaux

Résultats principaux

Type de modèleSensibilitéSpécificitéPrécisionExactitudeScore F1
Modèle intégré0,600,750,600,690,60
Modèle morphologique0,780,440,470,570,59
Modèle de vision pur0,780,460,480,590,60

Découvertes clés

  1. Meilleure performance du modèle intégré: Surpassant les modèles unimodaux en termes de performance équilibrée, réalisant un bon équilibre entre sensibilité et spécificité
  2. Variabilité intra-observateur: La cohérence du même observateur lors d'une ré-annotation après 10 mois n'était que de 81 %, avec une différence absolue moyenne de 13,7 % ± 19,5 % pour le pourcentage SDF au niveau du patient
  3. Stabilité du modèle: Les courbes d'apprentissage montrent que le modèle ne présente pas de surapprentissage évident, et la courbe ROC est significativement supérieure à la classification aléatoire

Analyse de cas

  • Cas de classification correcte: Le modèle intégré équilibre les informations visuelles et morphologiques, classant correctement même lorsqu'une modalité unique échoue
  • Cas de mauvaise classification: Principalement dus à la présence de plusieurs queues de spermatozoïdes dans l'image ou à des images floues entraînant des erreurs de mesure morphologique

Travaux connexes

Méthodes traditionnelles de détection SDF

  • Dosage TUNEL: Étalon-or mais détruit la viabilité du sperme
  • Autres méthodes: AOT, CMA3, SCSA, COMET, SCD, etc., avec des résultats incohérents

Applications de l'IA dans l'analyse du sperme

  • Serrano Berenguer et al. (2022): Utilisation de forêts aléatoires et CNN pour prédire les résultats COMET
  • Wang et al. (2019): Modèles de régression linéaire et non linéaire basés sur les données AOT, précision de test de 82,7 %
  • Avantages de cette étude: Non destructif, fusion multimodale, capacité de traitement en temps réel

Conclusions et discussion

Conclusions principales

  1. Développement réussi d'un outil de détection SDF basé sur l'IA non destructif
  2. Le modèle intégré réalise une performance équilibrée avec une sensibilité de 60 % et une spécificité de 75 %
  3. Fournit une nouvelle solution pour la sélection des spermatozoïdes dans les techniques de procréation médicalement assistée

Limitations

  1. Taille de l'ensemble de données: Un ensemble de données relativement petit limite l'amélioration ultérieure de la performance du modèle
  2. Annotation par un seul expert: Manque d'annotation par plusieurs experts pour évaluer la variabilité inter-observateur
  3. Sensibilité à améliorer: Une sensibilité de 60 % laisse place à l'amélioration

Directions futures

  1. Augmenter la taille de l'ensemble de données d'entraînement
  2. Mener une validation clinique multicentrique
  3. Intégrer les perspectives de plusieurs méthodes de détection SDF
  4. Développer un système d'application clinique en temps réel

Évaluation approfondie

Points forts

  1. Importance clinique majeure: Résout un besoin clinique réel en médecine reproductive
  2. Innovation technologique forte: Première combinaison de Transformer avec des caractéristiques morphologiques du sperme pour la détection SDF
  3. Méthodologie rigoureuse: Groupement par patient pour éviter les fuites de données, quantification de la variabilité intra-observateur
  4. Valeur pratique élevée: La détection non destructive maintient la viabilité du sperme, applicable cliniquement

Insuffisances

  1. Limitation de la taille d'échantillon: 1825 échantillons sont relativement petits pour les modèles d'apprentissage profond
  2. Étude monocentrique: Manque de validation multicentrique, la capacité de généralisation reste à vérifier
  3. Performance à améliorer: Une sensibilité de 60 % peut ne pas être idéale pour l'application clinique
  4. Absence d'analyse coût-efficacité: Pas de comparaison économique avec les méthodes traditionnelles

Impact

  1. Contribution académique: Fournit de nouvelles perspectives pour l'application de l'IA en médecine reproductive
  2. Potentiel de traduction clinique: Susceptible d'améliorer le taux de succès de la PMA, bénéficiant aux patients infertiles
  3. Valeur de promotion technologique: Extensible à d'autres tâches d'analyse d'images médicales

Scénarios d'application

  1. Procédures FIV/ICSI: Évaluation et sélection de la qualité du sperme avant intervention
  2. Diagnostic de l'infertilité masculine: Fournir une évaluation objective de la SDF
  3. Recherche en médecine reproductive: Outil de détection SDF standardisé
  4. Télémédecine: L'analyse automatisée réduit la dépendance envers le personnel spécialisé

Références bibliographiques

Cette étude cite des références importantes dans les domaines de la médecine reproductive, de l'apprentissage automatique et du traitement d'images, notamment le manuel d'examen du sperme de l'OMS, les protocoles standards de dosage TUNEL, ainsi que les recherches récentes sur l'application de l'IA dans l'analyse d'images médicales.


Évaluation globale: Il s'agit d'une recherche interdisciplinaire d'importance clinique majeure, appliquant la technologie d'IA avancée pour résoudre des problèmes pratiques en médecine reproductive. Bien qu'il y ait encore place à l'amélioration en termes de taille de données et de performance, son concept innovant de détection non destructive et son approche de fusion multimodale indiquent la direction du développement futur dans ce domaine.