2025-11-13T13:28:10.924524

Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay

Jacobs, Morris, Shaik et al.
Sperm DNA fragmentation (SDF) is a critical parameter in male fertility assessment that conventional semen analysis fails to evaluate. This study presents the validation of a novel artificial intelligence (AI) tool designed to detect SDF through digital analysis of phase contrast microscopy images, using the terminal deoxynucleotidyl transferase dUTP nick end labeling (TUNEL) assay as the gold standard reference. Utilising the established link between sperm morphology and DNA integrity, the present work proposes a morphology assisted ensemble AI model that combines image processing techniques with state-of-the-art transformer based machine learning models (GC-ViT) for the prediction of DNA fragmentation in sperm from phase contrast images. The ensemble model is benchmarked against a pure transformer `vision' model as well as a `morphology-only` model. Promising results show the proposed framework is able to achieve sensitivity of 60\% and specificity of 75\%. This non-destructive methodology represents a significant advancement in reproductive medicine by enabling real-time sperm selection based on DNA integrity for clinical diagnostic and therapeutic applications.
academic

Validación de una Herramienta de Inteligencia Artificial para la Detección de Fragmentación del ADN de Espermatozoides Utilizando el Ensayo de Hibridación In Situ TUNEL

Información Básica

  • ID del Artículo: 2510.11142
  • Título: Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay
  • Autores: B. A. Jacobs, A. Morris, I. Shaik, F. Lin
  • Clasificación: cs.CV (Visión por Computadora)
  • Fecha de Publicación: 13 de octubre de 2025 (preimpresión en arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2510.11142v1

Resumen

La fragmentación del ADN de espermatozoides (SDF) es un parámetro clave en la evaluación de la fertilidad masculina, pero el análisis seminal tradicional no puede evaluar este indicador. Este estudio propone y valida una nueva herramienta de inteligencia artificial para detectar SDF mediante análisis digital de imágenes de microscopía de contraste de fases, utilizando la detección por marcaje terminal de desoxinucleótidos (TUNEL) como estándar de referencia. Aprovechando la relación establecida entre la morfología de espermatozoides y la integridad del ADN, este estudio propone un modelo de IA integrado asistido por morfología que combina técnicas de procesamiento de imágenes y un modelo de aprendizaje automático basado en Transformer de última generación (GC-ViT) para predecir la fragmentación del ADN de espermatozoides en imágenes de contraste de fases. El modelo integrado se comparó con un modelo visual Transformer puro y un modelo basado únicamente en morfología. Los resultados muestran que el marco propuesto logra una sensibilidad del 60% y una especificidad del 75%. Este método no destructivo representa un avance significativo en las aplicaciones clínicas de diagnóstico y tratamiento en medicina reproductiva al permitir la selección de espermatozoides en tiempo real basada en la integridad del ADN.

Antecedentes y Motivación de la Investigación

Definición del Problema

  1. Problema Central: El análisis seminal tradicional no puede evaluar la fragmentación del ADN de espermatozoides (SDF), un parámetro clave de fertilidad que está estrechamente asociado con tasas de fertilización reducidas, desarrollo embrionario comprometido e incremento de tasas de aborto.
  2. Importancia Clínica:
    • La infertilidad afecta aproximadamente al 15% de parejas en edad reproductiva a nivel mundial, siendo el factor masculino responsable del 30-50%
    • SDF afecta directamente la tasa de éxito de las técnicas de reproducción asistida (ART)
    • Los métodos de detección existentes destruyen la viabilidad de los espermatozoides, impidiendo su uso en tratamientos posteriores
  3. Limitaciones de los Métodos Existentes:
    • Detección TUNEL: Requiere equipos especializados y personal capacitado, es consumidor de tiempo y costoso; los procesos de fijación y tinción inactivan los espermatozoides
    • Inconsistencia en Métodos de Detección: Múltiples métodos (AOT, CMA3, SCSA, COMET, SCD) producen resultados inconsistentes
    • Alta Subjetividad: La interpretación manual presenta variabilidad intra e interobservador
  4. Motivación de la Investigación: Desarrollar una herramienta de detección SDF basada en IA que sea no destructiva, rápida y objetiva, capaz de mantener la viabilidad de los espermatozoides para procedimientos ART posteriores.

Contribuciones Principales

  1. Propuesta de un Modelo de IA Integrado Asistido por Morfología: Combina técnicas de procesamiento de imágenes y el modelo Transformer GC-ViT, aprovechando la asociación entre la morfología de espermatozoides y la integridad del ADN para realizar predicciones
  2. Desarrollo de un Método de Detección No Destructivo: Utiliza únicamente imágenes de microscopía de contraste de fases para detectar SDF, manteniendo la viabilidad de los espermatozoides para tratamientos posteriores
  3. Construcción de un Conjunto de Datos Anotado: Contiene 1825 tripletes de imágenes de espermatozoides (campo claro, contraste de fases, fluorescencia) de 35 pacientes
  4. Cuantificación de la Variabilidad Intraobservador: Mediante análisis digital se revela la subjetividad de la evaluación manual tradicional (consistencia intraobservador de solo 81%)
  5. Establecimiento de Puntos de Referencia de Desempeño: Validación de la viabilidad de la herramienta asistida por IA con niveles de sensibilidad del 60% y especificidad del 75%

Explicación Detallada de la Metodología

Definición de la Tarea

  • Entrada: Imágenes de microscopía de contraste de fases de espermatozoides
  • Salida: Resultado de clasificación binaria (fragmentación del ADN/sin fragmentación)
  • Restricciones: No destructivo, procesamiento en tiempo real, aplicable a espermatozoides vivos y muertos

Arquitectura del Modelo

1. Modelo Integrado (Ensemble Model)

Entrada: Imagen de contraste de fases + Características morfológicas
     ↓
GC-ViT Transformer → Características visuales
     ↓
Extracción de características morfológicas → Características morfológicas  
     ↓
Módulo de fusión de características → Cabeza de clasificación (1024→256 nodos)
     ↓
Salida: Probabilidad de fragmentación del ADN

2. Modelos de Comparación

  • Modelo Visual Puro: Utiliza únicamente GC-ViT para procesar imágenes de contraste de fases
  • Modelo Morfológico Puro: Utiliza únicamente parámetros morfológicos extraídos de imágenes de contraste de fases

3. Componentes Técnicos Clave

  • GC-ViT Transformer: Transformer Visual de Contexto Global como red troncal
  • Características Morfológicas: Parámetros como longitud de cabeza, ancho, presencia de vacuolas, región acrosomal, etc.
  • Fusión de Características: Módulo de selección adaptativa que elige características visuales, morfológicas o ambas
  • Cabeza de Clasificación: Red neuronal completamente conectada de dos capas (1024→256 nodos), con activación LeakyReLU y regularización Dropout

Puntos de Innovación Técnica

  1. Fusión Multimodal: Primera aplicación que combina modelos Transformer visuales con características morfológicas de espermatozoides para detección de SDF
  2. Detección No Destructiva: Supera las limitaciones de la detección química tradicional, permitiendo detección con preservación de viabilidad
  3. Estrategia de Aprendizaje por Transferencia: Implementa decaimiento de tasa de aprendizaje jerárquico y parada temprana adaptados para conjuntos de datos pequeños
  4. Cuantificación Objetiva: Proporciona análisis cuantitativos reproducibles, reduciendo la subjetividad humana

Configuración Experimental

Conjunto de Datos

  • Fuente de Muestras: Muestras de semen de 35 pacientes que dieron consentimiento
  • Cantidad de Imágenes: 1825 tripletes de imágenes (campo claro, contraste de fases, fluorescencia)
  • Distribución de Anotaciones:
    • Fragmentado: 512 imágenes
    • Sin fragmentación: 715 imágenes
    • Indeterminado: 591 imágenes (excluidas)
  • División de Datos:
    • Conjunto de entrenamiento: 1017 imágenes (28 pacientes)
    • Conjunto de validación: 210 imágenes (7 pacientes)
    • Agrupación por paciente para evitar fuga de datos

Métricas de Evaluación

  • Sensibilidad (Recall): Proporción de espermatozoides fragmentados identificados correctamente
  • Especificidad: Proporción de espermatozoides sin fragmentación identificados correctamente
  • Precisión: Proporción de verdaderos positivos entre los predichos como fragmentados
  • Exactitud (Accuracy): Tasa general de clasificación correcta
  • Puntuación F1: Media armónica de precisión y recall
  • Curva ROC: Curva Característica Operativa del Receptor

Métodos de Comparación

  • Modelo visual puro GC-ViT
  • Modelo morfológico puro
  • Modelo integrado

Detalles de Implementación

  • Optimizador: Adam, tasa de aprendizaje inicial 5×10⁻⁵
  • Estrategia de Tasa de Aprendizaje: Decaimiento jerárquico (factor de decaimiento 0.12), proporción de precalentamiento 0.1
  • Función de Pérdida: Entropía cruzada binaria
  • Regularización: Dropout (0.6, 0.3), parada temprana (10 épocas)
  • Aumento de Datos: Rotación y volteo aleatorios
  • Número de Épocas de Entrenamiento: Máximo 50

Resultados Experimentales

Resultados Principales

Tipo de ModeloSensibilidadEspecificidadPrecisiónExactitudPuntuación F1
Modelo Integrado0.600.750.600.690.60
Modelo Morfológico0.780.440.470.570.59
Modelo Visual Puro0.780.460.480.590.60

Hallazgos Clave

  1. Mejor Desempeño del Modelo Integrado: Supera los modelos de modalidad única en términos de rendimiento equilibrado, logrando un buen balance entre sensibilidad y especificidad
  2. Variabilidad Intraobservador: La consistencia cuando el mismo experto reanotó después de 10 meses fue de solo 81%, con una diferencia absoluta promedio en el porcentaje de SDF a nivel de paciente de 13.7%±19.5%
  3. Estabilidad del Modelo: Las curvas de aprendizaje muestran que el modelo no presenta sobreajuste evidente, y la curva ROC es significativamente superior a la clasificación aleatoria

Análisis de Casos

  • Casos Clasificados Correctamente: El modelo integrado puede equilibrar información visual y morfológica, clasificando correctamente incluso cuando una modalidad única falla
  • Casos Mal Clasificados: Principalmente causados por la presencia de múltiples colas de espermatozoides en la imagen o imágenes borrosas que resultan en mediciones morfológicas erróneas

Trabajo Relacionado

Métodos Tradicionales de Detección de SDF

  • Detección TUNEL: Estándar de referencia pero destructivo para la viabilidad de espermatozoides
  • Otros Métodos: AOT, CMA3, SCSA, COMET, SCD, etc., con resultados inconsistentes

Aplicaciones de IA en Análisis de Espermatozoides

  • Serrano Berenguer et al. (2022): Utiliza bosques aleatorios y CNN para predecir resultados de COMET
  • Wang et al. (2019): Modelos de regresión lineal y no lineal basados en datos de AOT, con precisión de prueba del 82.7%
  • Ventajas de Este Estudio: No destructivo, fusión multimodal, capacidad de procesamiento en tiempo real

Conclusiones y Discusión

Conclusiones Principales

  1. Desarrollo exitoso de una herramienta de detección SDF basada en IA no destructiva
  2. El modelo integrado logra un rendimiento equilibrado con sensibilidad del 60% y especificidad del 75%
  3. Proporciona una nueva solución para la selección de espermatozoides en técnicas de reproducción asistida

Limitaciones

  1. Tamaño del Conjunto de Datos: El conjunto de datos relativamente pequeño limita la mejora adicional del desempeño del modelo
  2. Anotación por Experto Único: Falta de anotación por múltiples expertos para evaluar variabilidad interobservador
  3. Sensibilidad Requiere Mejora: La sensibilidad del 60% aún tiene espacio para mejora

Direcciones Futuras

  1. Expandir el tamaño del conjunto de datos de entrenamiento
  2. Realizar validación clínica multicéntrica
  3. Integrar perspectivas de múltiples métodos de detección de SDF
  4. Desarrollar un sistema de aplicación clínica en tiempo real

Evaluación Profunda

Fortalezas

  1. Significancia Clínica Importante: Aborda necesidades clínicas reales en medicina reproductiva
  2. Fuerte Innovación Tecnológica: Primera combinación de Transformer visual con características morfológicas de espermatozoides para detección de SDF
  3. Metodología Rigurosa: Agrupación por paciente para evitar fuga de datos, cuantificación de variabilidad intraobservador
  4. Alto Valor Práctico: La detección no destructiva preserva la viabilidad de espermatozoides, aplicable clínicamente

Insuficiencias

  1. Limitación del Tamaño de Muestra: 1825 muestras son relativamente pequeñas para modelos de aprendizaje profundo
  2. Estudio de Centro Único: Falta validación multicéntrica, la capacidad de generalización requiere verificación
  3. Desempeño Aún Necesita Mejora: La sensibilidad del 60% puede ser insuficiente para aplicación clínica
  4. Falta Análisis de Costo-Beneficio: No proporciona comparación económica con métodos tradicionales

Impacto

  1. Contribución Académica: Proporciona nuevas perspectivas para la aplicación de IA en medicina reproductiva
  2. Potencial de Traducción Clínica: Promete mejorar las tasas de éxito de ART, beneficiando a pacientes infértiles
  3. Valor de Promoción Tecnológica: Extensible a otras tareas de análisis de imágenes médicas

Escenarios de Aplicación

  1. Procedimientos IVF/ICSI: Evaluación y selección de calidad de espermatozoides preoperatoria
  2. Diagnóstico de Infertilidad Masculina: Proporciona evaluación objetiva de SDF
  3. Investigación en Medicina Reproductiva: Herramienta de detección de SDF estandarizada
  4. Telemedicina: Análisis automatizado reduce la dependencia de personal especializado

Referencias Bibliográficas

Este estudio cita literatura importante en los campos de medicina reproductiva, aprendizaje automático y procesamiento de imágenes, incluyendo el Manual de Examen de Semen de la OMS, protocolos estándar de detección TUNEL, e investigaciones recientes sobre aplicaciones de IA en análisis de imágenes médicas.


Evaluación General: Este es un estudio interdisciplinario con importante valor clínico que aplica tecnología de IA avanzada para resolver problemas prácticos en medicina reproductiva. Aunque hay espacio para mejora en escala de datos y desempeño, su concepto innovador de detección no destructiva y su enfoque de fusión multimodal señalan la dirección del desarrollo en este campo.