2025-11-14T03:19:10.909198

Post-surgical Endometriosis Segmentation in Laparoscopic Videos

Leibetseder, Schoeffmann, Keckstein et al.

Endometriosis is a common women's condition exhibiting a manifold visual appearance in various body-internal locations. Having such properties makes its identification very difficult and error-prone, at least for laymen and non-specialized medical practitioners. In an attempt to provide assistance to gynecologic physicians treating endometriosis, this demo paper describes a system that is trained to segment one frequently occurring visual appearance of endometriosis, namely dark endometrial implants. The system is capable of analyzing laparoscopic surgery videos, annotating identified implant regions with multi-colored overlays and displaying a detection summary for improved video browsing.

academic

Segmentación de Endometriosis Posquirúrgica en Videos Laparoscópicos

Información Básica

ID del Artículo: 2510.13899
Título: Post-surgical Endometriosis Segmentation in Laparoscopic Videos
Autores: Andreas Leibetseder, Klaus Schoeffmann (Universidad de Klagenfurt), Jörg Keckstein (Universidad de Ulm), Simon Keckstein (Universidad Ludwig-Maximilians de Múnich)
Clasificación: cs.CV cs.LG cs.MM
Fecha de Publicación: 14 de octubre de 2025 (preimpresión en arXiv)
Enlace del Artículo: https://arxiv.org/abs/2510.13899

Resumen

La endometriosis es una enfermedad común en mujeres que presenta diversas manifestaciones visuales en diferentes localizaciones anatómicas. Esta característica hace que su identificación sea extremadamente difícil y propensa a errores, particularmente para médicos no especializados. Para asistir a los ginecólogos en el tratamiento de la endometriosis, este artículo de demostración describe un sistema entrenado para segmentar manifestaciones visuales comunes de endometriosis, específicamente implantes endometriales oscuros. El sistema es capaz de analizar videos de cirugía laparoscópica, anotar las regiones de implantes identificadas con capas de cobertura multicolor, y mostrar resúmenes de detección para mejorar la experiencia de visualización de videos.

Antecedentes de Investigación y Motivación

1. Problema de Investigación

Esta investigación aborda el problema de la identificación y segmentación automática de focos de endometriosis durante cirugía laparoscópica. La endometriosis se refiere a la enfermedad caracterizada por el crecimiento anómalo de tejido similar al uterino fuera del útero, afectando a mujeres en edad reproductiva.

2. Importancia del Problema

Dificultad Diagnóstica: La endometriosis presenta manifestaciones visuales diversas en diferentes localizaciones, aumentando la dificultad de identificación
Calidad Médica: La identificación y documentación completa de todos los focos es crucial para mejorar los síntomas y la calidad de vida de los pacientes
Necesidades Educativas: Los médicos con experiencia insuficiente bajo presión de tiempo corren riesgo de diagnósticos incompletos
Sistemas de Clasificación: Existen dos sistemas de clasificación principales (rASRM y Enzian) que requieren evaluación visual precisa

3. Limitaciones de Métodos Existentes

Dependencia de la evaluación visual subjetiva del cirujano
Detección limitada en áreas extensas de pelvis y peritoneo
Mayor dificultad en la identificación de lesiones endometriales con diferentes colores y apariencias
Riesgo de diagnóstico erróneo debido a capacitación insuficiente y presión de tiempo

4. Motivación de la Investigación

Aprovechar las aplicaciones exitosas del aprendizaje profundo en imágenes médicas para desarrollar un sistema que pueda identificar y segmentar automáticamente implantes endometriales oscuros, apoyando el análisis intraoperatorio o posoperatorio y mejorando la efectividad de la capacitación educativa.

Contribuciones Principales

Adaptación de Modelo: Adaptación de Mask R-CNN para la tarea de segmentación binaria de implantes endometriales
Sistema de Visualización: Proporciona visualización espacial y temporal de implantes endometriales en videos de cirugía laparoscópica
Herramienta de Código Abierto: Proporciona código fuente de herramientas y modelos preentrenados para uso académico
Demostración Práctica: Demuestra la viabilidad de aplicar detección de objetos de aprendizaje automático tradicional a casos de uso médicos reales

Explicación Detallada de Métodos

Definición de Tarea

Entrada: Video de cirugía laparoscópica Salida: Anotaciones de implantes endometriales oscuros con máscaras de segmentación y confianza Restricciones: Enfoque en la identificación de implantes endometriales oscuros de una sola clase

Arquitectura del Modelo

1. Arquitectura General

El sistema contiene tres pasos principales:

Creación de Conjunto de Datos: Extracción de conjunto de datos de lesiones de una sola clase del conjunto de datos GLENDA
Entrenamiento del Modelo: Aprendizaje por transferencia utilizando Mask R-CNN
Análisis de Video: Aplicación del modelo y visualización de resultados

2. Construcción del Conjunto de Datos

Datos Base: Extracción del Conjunto de Datos de Endometriosis de Laparoscopia Ginecológica (GLENDA)
Escala: Más de 350 anotaciones de implantes endometriales basadas en regiones, cubriendo 160 fotogramas de imagen, procedentes de más de 100 casos de pacientes
Aumento de Datos: Técnicas empleadas incluyen rotación, desenfoque, transformación de perspectiva, desaturación y seguimiento de objetos

3. Diseño del Modelo

Red Base: Mask R-CNN con ResNet-101 como red troncal
Función de Pérdida: Función de pérdida multitarea que incluye:
- Pérdida de clasificación (pérdida logarítmica)
- Pérdida de cuadro delimitador (pérdida L1 suave)
- Pérdida de segmentación de máscara (pérdida de entropía cruzada binaria)
Parámetros de Entrenamiento: 50 épocas, tasa de aprendizaje 0.001, optimizador de descenso de gradiente estocástico

4. Flujo de Procesamiento de Video

Video quirúrgico original → Análisis fotograma a fotograma → Extracción de cuadros delimitadores, máscaras y etiquetas → Generación de fotogramas anotados → Creación de barra de resumen de detección → Video anotado de salida

Puntos de Innovación Técnica

Adaptación a Dominio Médico: Adaptación exitosa de red de detección de objetos genérica a escenario médico específico
Visualización Temporal: Proporciona innovadoramente barra de indicadores temporal de confianza de detección para localización rápida de fotogramas clave
Capacidad de Procesamiento en Tiempo Real: Optimización de velocidad de procesamiento, promedio de 150-250ms por fotograma
Salida Multimodal: Proporciona simultáneamente anotaciones visuales y datos estructurados en formato JSON

Configuración Experimental

Conjunto de Datos

Nombre: Conjunto de datos personalizado de una sola clase basado en GLENDA
Escala: 350+ anotaciones, 160 fotogramas, 100+ casos de pacientes
Características: Enfoque en implantes endometriales oscuros
División: Conjunto de entrenamiento, validación y prueba

Métricas de Evaluación

Métrica Principal: Precisión Promedio Media (mAP) para segmentación de máscaras
Configuración de Umbral: Umbral IoU 0.5 y rango 0.5-0.95
Confianza: Umbral de confianza de detección 0.50

Detalles de Implementación

Entrada de Imagen: Redimensionamiento a 800 píxeles (lado corto) y 1333 píxeles (lado largo)
Mejor Modelo: Rendimiento óptimo alcanzado después de 29 épocas
Estrategia de Aumento: Rotación y recorte muestran mejor efecto de aumento

Resultados Experimentales

Resultados Principales

Rendimiento Óptimo:
- mAP@0.50IoU: 0.642 (umbral IoU 0.5)
- mAP@0.50:0.95: 0.324 (umbral IoU 0.5-0.95)
Eficiencia de Entrenamiento: Aproximadamente 2 horas para completar el entrenamiento del modelo
Velocidad de Procesamiento: Comparación de tiempo de procesamiento en diferentes resoluciones

Resolución	Tiempo de Procesamiento Promedio (ms)
640×360	153
1280×720	158
1920×1080	170
3840×2160	207

Análisis de Rendimiento

Estimación de Procesamiento: 1 hora de video en resolución HD (25fps) requiere aproximadamente 4 horas 15 minutos de procesamiento
Requisitos de Hardware: Intel Core i7-5820K, 32GB RAM, GTX 1080
Compatibilidad Multiplataforma: Compatible con Linux, Windows, se prevé compatibilidad con MacOS

Análisis de Casos

El artículo proporciona cuatro ejemplos de anotación de implantes endometriales oscuros, demostrando que el sistema puede identificar áreas patológicas que son visiblemente distintas del tejido circundante pero similares a manchas de sangre o vasos sanguíneos oscuros.

Trabajo Relacionado

1. Segmentación de Imágenes Médicas

La aplicación generalizada del aprendizaje profundo en imágenes médicas proporciona la base técnica para esta investigación.

2. Redes de Detección de Objetos

Faster R-CNN: Proporciona base de red de propuesta de región
Mask R-CNN: Arquitectura de red de segmentación principal
ResNet: Como red troncal de extracción de características

3. Clasificación de Endometriosis

Clasificación rASRM: Aplicable al registro de lesiones peritoneales
Clasificación Enzian: Cubre endometriosis profunda

Conclusiones y Discusión

Conclusiones Principales

Demuestra exitosamente la viabilidad de Mask R-CNN en la tarea de segmentación de endometriosis
Desarrolla una cadena de herramientas de análisis de video completa que apoya el análisis de archivos de video posoperatorio
Proporciona interfaz de visualización que ayuda en la planificación del tratamiento y educación clínica

Limitaciones

Tipo Único: Solo se enfoca en implantes endometriales oscuros, sin cubrir otras manifestaciones visuales
Escala de Datos: El conjunto de datos relativamente pequeño puede limitar la capacidad de generalización del modelo
Naturaleza de Demostración: La versión actual es una prueba de concepto, carece de interfaz de usuario completa
Velocidad de Procesamiento: La capacidad de procesamiento en tiempo real requiere mejora

Direcciones Futuras

Extensión a detección de lesiones de endometriosis multiclase
Construcción de sistema interactivo de navegación de video posoperatorio
Mejora de interfaz de usuario y experiencia del usuario
Aumento de conjunto de datos anotado de mayor escala

Evaluación Profunda

Fortalezas

1. Innovación Técnica

Adaptación de Dominio: Adaptación exitosa de tecnología de visión por computadora genérica a escenario médico profesional
Herramienta Práctica: Proporciona solución completa de extremo a extremo, desde entrenamiento de modelo hasta análisis de video
Contribución de Código Abierto: Proporciona código fuente y modelos preentrenados, promoviendo investigación académica

2. Suficiencia Experimental

Evaluación Multidimensional: Incluye análisis integral de métricas de rendimiento, tiempo de procesamiento, requisitos de hardware, etc.
Aplicación Práctica: Diseñado basado en datos de pacientes reales y necesidades clínicas
Reproducibilidad: Detalles de implementación detallados y código de código abierto apoyan la reproducción de resultados

3. Valor Clínico

Significado Educativo: Ayuda en capacitación médica y mejora de habilidades
Asistencia Diagnóstica: Reduce riesgo de diagnóstico perdido, mejora precisión diagnóstica
Mejora de Eficiencia: Análisis automatizado ahorra tiempo del médico

Deficiencias

1. Limitaciones de Método

Clase Única: Solo maneja una manifestación visual, la aplicación práctica requiere identificar múltiples tipos de lesiones
Dependencia de Datos: El conjunto de datos relativamente pequeño puede afectar la capacidad de generalización del modelo entre diferentes hospitales y equipos
Sensibilidad de Umbral: El umbral de confianza fijo puede no ser aplicable a todas las situaciones

2. Evaluación Insuficiente

Falta de Validación Clínica: No se ha realizado investigación de validación en entorno clínico real
Líneas Base de Comparación Limitadas: Falta comparación detallada con otros métodos de segmentación médica
Ausencia de Investigación de Usuario: No se ha evaluado el efecto y aceptación del uso real de esta herramienta por médicos

3. Detalles Técnicos

Insuficiencia en Tiempo Real: La velocidad de procesamiento es difícil de satisfacer para análisis en tiempo real intraoperatorio
Interfaz Rudimentaria: La versión actual carece de diseño de interfaz de usuario refinado

Impacto

1. Contribución Académica

Proporciona nueva dirección de investigación para el campo del análisis de video médico
Demuestra el potencial de aplicación del aprendizaje profundo en diagnóstico de enfermedades ginecológicas
Proporciona conjunto de datos y herramientas reutilizables

2. Valor Práctico

Tiene potencial para mejorar la precisión diagnóstica de endometriosis
Puede utilizarse en educación médica y capacitación
Sienta las bases para desarrollar sistemas más completos de diagnóstico asistido médico

3. Reproducibilidad

Proporciona detalles técnicos de implementación detallados
Código de código abierto y modelos preentrenados
Instrucciones claras de instalación y uso

Escenarios Aplicables

Análisis Posoperatorio: Análisis retrospectivo de videos quirúrgicos para asegurar identificación completa de lesiones
Educación Médica: Capacitación de médicos jóvenes en identificación de lesiones de endometriosis
Herramienta de Investigación: Apoyo a análisis de lesiones y anotación a gran escala en investigación clínica
Control de Calidad: Verificación de integridad quirúrgica y precisión diagnóstica

Referencias

Canis, M., et al. "Revised american society for reproductive medicine classification of endometriosis: 1996." Fertility and Sterility, 1997.
He, K., et al. "Mask R-CNN." IEEE Trans. Pattern Anal. Mach. Intell., 2020.
Leibetseder, A., et al. "GLENDA: gynecologic laparoscopy endometriosis dataset." MultiMedia Modeling, 2020.

Resumen: Este es un artículo de demostración que muestra la aplicación del aprendizaje profundo en análisis de video médico ginecológico. Aunque la versión actual presenta algunas limitaciones, proporciona una exploración valiosa en el campo del diagnóstico asistido por IA médica, con buenas perspectivas de desarrollo y valor práctico. La naturaleza de código abierto de este trabajo promoverá el desarrollo adicional de investigación relacionada.