2025-11-14T03:19:10.909198

Post-surgical Endometriosis Segmentation in Laparoscopic Videos

Leibetseder, Schoeffmann, Keckstein et al.
Endometriosis is a common women's condition exhibiting a manifold visual appearance in various body-internal locations. Having such properties makes its identification very difficult and error-prone, at least for laymen and non-specialized medical practitioners. In an attempt to provide assistance to gynecologic physicians treating endometriosis, this demo paper describes a system that is trained to segment one frequently occurring visual appearance of endometriosis, namely dark endometrial implants. The system is capable of analyzing laparoscopic surgery videos, annotating identified implant regions with multi-colored overlays and displaying a detection summary for improved video browsing.
academic

Segmentación de Endometriosis Posquirúrgica en Videos Laparoscópicos

Información Básica

  • ID del Artículo: 2510.13899
  • Título: Post-surgical Endometriosis Segmentation in Laparoscopic Videos
  • Autores: Andreas Leibetseder, Klaus Schoeffmann (Universidad de Klagenfurt), Jörg Keckstein (Universidad de Ulm), Simon Keckstein (Universidad Ludwig-Maximilians de Múnich)
  • Clasificación: cs.CV cs.LG cs.MM
  • Fecha de Publicación: 14 de octubre de 2025 (preimpresión en arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2510.13899

Resumen

La endometriosis es una enfermedad común en mujeres que presenta diversas manifestaciones visuales en diferentes localizaciones anatómicas. Esta característica hace que su identificación sea extremadamente difícil y propensa a errores, particularmente para médicos no especializados. Para asistir a los ginecólogos en el tratamiento de la endometriosis, este artículo de demostración describe un sistema entrenado para segmentar manifestaciones visuales comunes de endometriosis, específicamente implantes endometriales oscuros. El sistema es capaz de analizar videos de cirugía laparoscópica, anotar las regiones de implantes identificadas con capas de cobertura multicolor, y mostrar resúmenes de detección para mejorar la experiencia de visualización de videos.

Antecedentes de Investigación y Motivación

1. Problema de Investigación

Esta investigación aborda el problema de la identificación y segmentación automática de focos de endometriosis durante cirugía laparoscópica. La endometriosis se refiere a la enfermedad caracterizada por el crecimiento anómalo de tejido similar al uterino fuera del útero, afectando a mujeres en edad reproductiva.

2. Importancia del Problema

  • Dificultad Diagnóstica: La endometriosis presenta manifestaciones visuales diversas en diferentes localizaciones, aumentando la dificultad de identificación
  • Calidad Médica: La identificación y documentación completa de todos los focos es crucial para mejorar los síntomas y la calidad de vida de los pacientes
  • Necesidades Educativas: Los médicos con experiencia insuficiente bajo presión de tiempo corren riesgo de diagnósticos incompletos
  • Sistemas de Clasificación: Existen dos sistemas de clasificación principales (rASRM y Enzian) que requieren evaluación visual precisa

3. Limitaciones de Métodos Existentes

  • Dependencia de la evaluación visual subjetiva del cirujano
  • Detección limitada en áreas extensas de pelvis y peritoneo
  • Mayor dificultad en la identificación de lesiones endometriales con diferentes colores y apariencias
  • Riesgo de diagnóstico erróneo debido a capacitación insuficiente y presión de tiempo

4. Motivación de la Investigación

Aprovechar las aplicaciones exitosas del aprendizaje profundo en imágenes médicas para desarrollar un sistema que pueda identificar y segmentar automáticamente implantes endometriales oscuros, apoyando el análisis intraoperatorio o posoperatorio y mejorando la efectividad de la capacitación educativa.

Contribuciones Principales

  1. Adaptación de Modelo: Adaptación de Mask R-CNN para la tarea de segmentación binaria de implantes endometriales
  2. Sistema de Visualización: Proporciona visualización espacial y temporal de implantes endometriales en videos de cirugía laparoscópica
  3. Herramienta de Código Abierto: Proporciona código fuente de herramientas y modelos preentrenados para uso académico
  4. Demostración Práctica: Demuestra la viabilidad de aplicar detección de objetos de aprendizaje automático tradicional a casos de uso médicos reales

Explicación Detallada de Métodos

Definición de Tarea

Entrada: Video de cirugía laparoscópica Salida: Anotaciones de implantes endometriales oscuros con máscaras de segmentación y confianza Restricciones: Enfoque en la identificación de implantes endometriales oscuros de una sola clase

Arquitectura del Modelo

1. Arquitectura General

El sistema contiene tres pasos principales:

  • Creación de Conjunto de Datos: Extracción de conjunto de datos de lesiones de una sola clase del conjunto de datos GLENDA
  • Entrenamiento del Modelo: Aprendizaje por transferencia utilizando Mask R-CNN
  • Análisis de Video: Aplicación del modelo y visualización de resultados

2. Construcción del Conjunto de Datos

  • Datos Base: Extracción del Conjunto de Datos de Endometriosis de Laparoscopia Ginecológica (GLENDA)
  • Escala: Más de 350 anotaciones de implantes endometriales basadas en regiones, cubriendo 160 fotogramas de imagen, procedentes de más de 100 casos de pacientes
  • Aumento de Datos: Técnicas empleadas incluyen rotación, desenfoque, transformación de perspectiva, desaturación y seguimiento de objetos

3. Diseño del Modelo

  • Red Base: Mask R-CNN con ResNet-101 como red troncal
  • Función de Pérdida: Función de pérdida multitarea que incluye:
    • Pérdida de clasificación (pérdida logarítmica)
    • Pérdida de cuadro delimitador (pérdida L1 suave)
    • Pérdida de segmentación de máscara (pérdida de entropía cruzada binaria)
  • Parámetros de Entrenamiento: 50 épocas, tasa de aprendizaje 0.001, optimizador de descenso de gradiente estocástico

4. Flujo de Procesamiento de Video

Video quirúrgico original → Análisis fotograma a fotograma → Extracción de cuadros delimitadores, máscaras y etiquetas → Generación de fotogramas anotados → Creación de barra de resumen de detección → Video anotado de salida

Puntos de Innovación Técnica

  1. Adaptación a Dominio Médico: Adaptación exitosa de red de detección de objetos genérica a escenario médico específico
  2. Visualización Temporal: Proporciona innovadoramente barra de indicadores temporal de confianza de detección para localización rápida de fotogramas clave
  3. Capacidad de Procesamiento en Tiempo Real: Optimización de velocidad de procesamiento, promedio de 150-250ms por fotograma
  4. Salida Multimodal: Proporciona simultáneamente anotaciones visuales y datos estructurados en formato JSON

Configuración Experimental

Conjunto de Datos

  • Nombre: Conjunto de datos personalizado de una sola clase basado en GLENDA
  • Escala: 350+ anotaciones, 160 fotogramas, 100+ casos de pacientes
  • Características: Enfoque en implantes endometriales oscuros
  • División: Conjunto de entrenamiento, validación y prueba

Métricas de Evaluación

  • Métrica Principal: Precisión Promedio Media (mAP) para segmentación de máscaras
  • Configuración de Umbral: Umbral IoU 0.5 y rango 0.5-0.95
  • Confianza: Umbral de confianza de detección 0.50

Detalles de Implementación

  • Entrada de Imagen: Redimensionamiento a 800 píxeles (lado corto) y 1333 píxeles (lado largo)
  • Mejor Modelo: Rendimiento óptimo alcanzado después de 29 épocas
  • Estrategia de Aumento: Rotación y recorte muestran mejor efecto de aumento

Resultados Experimentales

Resultados Principales

  • Rendimiento Óptimo:
    • mAP@0.50IoU: 0.642 (umbral IoU 0.5)
    • mAP@0.50:0.95: 0.324 (umbral IoU 0.5-0.95)
  • Eficiencia de Entrenamiento: Aproximadamente 2 horas para completar el entrenamiento del modelo
  • Velocidad de Procesamiento: Comparación de tiempo de procesamiento en diferentes resoluciones
ResoluciónTiempo de Procesamiento Promedio (ms)
640×360153
1280×720158
1920×1080170
3840×2160207

Análisis de Rendimiento

  • Estimación de Procesamiento: 1 hora de video en resolución HD (25fps) requiere aproximadamente 4 horas 15 minutos de procesamiento
  • Requisitos de Hardware: Intel Core i7-5820K, 32GB RAM, GTX 1080
  • Compatibilidad Multiplataforma: Compatible con Linux, Windows, se prevé compatibilidad con MacOS

Análisis de Casos

El artículo proporciona cuatro ejemplos de anotación de implantes endometriales oscuros, demostrando que el sistema puede identificar áreas patológicas que son visiblemente distintas del tejido circundante pero similares a manchas de sangre o vasos sanguíneos oscuros.

Trabajo Relacionado

1. Segmentación de Imágenes Médicas

La aplicación generalizada del aprendizaje profundo en imágenes médicas proporciona la base técnica para esta investigación.

2. Redes de Detección de Objetos

  • Faster R-CNN: Proporciona base de red de propuesta de región
  • Mask R-CNN: Arquitectura de red de segmentación principal
  • ResNet: Como red troncal de extracción de características

3. Clasificación de Endometriosis

  • Clasificación rASRM: Aplicable al registro de lesiones peritoneales
  • Clasificación Enzian: Cubre endometriosis profunda

Conclusiones y Discusión

Conclusiones Principales

  1. Demuestra exitosamente la viabilidad de Mask R-CNN en la tarea de segmentación de endometriosis
  2. Desarrolla una cadena de herramientas de análisis de video completa que apoya el análisis de archivos de video posoperatorio
  3. Proporciona interfaz de visualización que ayuda en la planificación del tratamiento y educación clínica

Limitaciones

  1. Tipo Único: Solo se enfoca en implantes endometriales oscuros, sin cubrir otras manifestaciones visuales
  2. Escala de Datos: El conjunto de datos relativamente pequeño puede limitar la capacidad de generalización del modelo
  3. Naturaleza de Demostración: La versión actual es una prueba de concepto, carece de interfaz de usuario completa
  4. Velocidad de Procesamiento: La capacidad de procesamiento en tiempo real requiere mejora

Direcciones Futuras

  1. Extensión a detección de lesiones de endometriosis multiclase
  2. Construcción de sistema interactivo de navegación de video posoperatorio
  3. Mejora de interfaz de usuario y experiencia del usuario
  4. Aumento de conjunto de datos anotado de mayor escala

Evaluación Profunda

Fortalezas

1. Innovación Técnica

  • Adaptación de Dominio: Adaptación exitosa de tecnología de visión por computadora genérica a escenario médico profesional
  • Herramienta Práctica: Proporciona solución completa de extremo a extremo, desde entrenamiento de modelo hasta análisis de video
  • Contribución de Código Abierto: Proporciona código fuente y modelos preentrenados, promoviendo investigación académica

2. Suficiencia Experimental

  • Evaluación Multidimensional: Incluye análisis integral de métricas de rendimiento, tiempo de procesamiento, requisitos de hardware, etc.
  • Aplicación Práctica: Diseñado basado en datos de pacientes reales y necesidades clínicas
  • Reproducibilidad: Detalles de implementación detallados y código de código abierto apoyan la reproducción de resultados

3. Valor Clínico

  • Significado Educativo: Ayuda en capacitación médica y mejora de habilidades
  • Asistencia Diagnóstica: Reduce riesgo de diagnóstico perdido, mejora precisión diagnóstica
  • Mejora de Eficiencia: Análisis automatizado ahorra tiempo del médico

Deficiencias

1. Limitaciones de Método

  • Clase Única: Solo maneja una manifestación visual, la aplicación práctica requiere identificar múltiples tipos de lesiones
  • Dependencia de Datos: El conjunto de datos relativamente pequeño puede afectar la capacidad de generalización del modelo entre diferentes hospitales y equipos
  • Sensibilidad de Umbral: El umbral de confianza fijo puede no ser aplicable a todas las situaciones

2. Evaluación Insuficiente

  • Falta de Validación Clínica: No se ha realizado investigación de validación en entorno clínico real
  • Líneas Base de Comparación Limitadas: Falta comparación detallada con otros métodos de segmentación médica
  • Ausencia de Investigación de Usuario: No se ha evaluado el efecto y aceptación del uso real de esta herramienta por médicos

3. Detalles Técnicos

  • Insuficiencia en Tiempo Real: La velocidad de procesamiento es difícil de satisfacer para análisis en tiempo real intraoperatorio
  • Interfaz Rudimentaria: La versión actual carece de diseño de interfaz de usuario refinado

Impacto

1. Contribución Académica

  • Proporciona nueva dirección de investigación para el campo del análisis de video médico
  • Demuestra el potencial de aplicación del aprendizaje profundo en diagnóstico de enfermedades ginecológicas
  • Proporciona conjunto de datos y herramientas reutilizables

2. Valor Práctico

  • Tiene potencial para mejorar la precisión diagnóstica de endometriosis
  • Puede utilizarse en educación médica y capacitación
  • Sienta las bases para desarrollar sistemas más completos de diagnóstico asistido médico

3. Reproducibilidad

  • Proporciona detalles técnicos de implementación detallados
  • Código de código abierto y modelos preentrenados
  • Instrucciones claras de instalación y uso

Escenarios Aplicables

  1. Análisis Posoperatorio: Análisis retrospectivo de videos quirúrgicos para asegurar identificación completa de lesiones
  2. Educación Médica: Capacitación de médicos jóvenes en identificación de lesiones de endometriosis
  3. Herramienta de Investigación: Apoyo a análisis de lesiones y anotación a gran escala en investigación clínica
  4. Control de Calidad: Verificación de integridad quirúrgica y precisión diagnóstica

Referencias

  1. Canis, M., et al. "Revised american society for reproductive medicine classification of endometriosis: 1996." Fertility and Sterility, 1997.
  2. He, K., et al. "Mask R-CNN." IEEE Trans. Pattern Anal. Mach. Intell., 2020.
  3. Leibetseder, A., et al. "GLENDA: gynecologic laparoscopy endometriosis dataset." MultiMedia Modeling, 2020.

Resumen: Este es un artículo de demostración que muestra la aplicación del aprendizaje profundo en análisis de video médico ginecológico. Aunque la versión actual presenta algunas limitaciones, proporciona una exploración valiosa en el campo del diagnóstico asistido por IA médica, con buenas perspectivas de desarrollo y valor práctico. La naturaleza de código abierto de este trabajo promoverá el desarrollo adicional de investigación relacionada.