2025-11-14T03:19:10.909198

Post-surgical Endometriosis Segmentation in Laparoscopic Videos

Leibetseder, Schoeffmann, Keckstein et al.

Endometriosis is a common women's condition exhibiting a manifold visual appearance in various body-internal locations. Having such properties makes its identification very difficult and error-prone, at least for laymen and non-specialized medical practitioners. In an attempt to provide assistance to gynecologic physicians treating endometriosis, this demo paper describes a system that is trained to segment one frequently occurring visual appearance of endometriosis, namely dark endometrial implants. The system is capable of analyzing laparoscopic surgery videos, annotating identified implant regions with multi-colored overlays and displaying a detection summary for improved video browsing.

academic

Segmentation de l'Endométriose Post-Chirurgicale dans les Vidéos Laparoscopiques

Informations Fondamentales

ID de l'article: 2510.13899
Titre: Post-surgical Endometriosis Segmentation in Laparoscopic Videos
Auteurs: Andreas Leibetseder, Klaus Schoeffmann (Université de Klagenfurt), Jörg Keckstein (Université d'Ulm), Simon Keckstein (Université Ludwig-Maximilians de Munich)
Classification: cs.CV cs.LG cs.MM
Date de publication: 14 octobre 2025 (prépublication arXiv)
Lien de l'article: https://arxiv.org/abs/2510.13899

Résumé

L'endométriose est une affection gynécologique courante qui présente une diversité d'apparences visuelles selon sa localisation dans l'organisme. Cette caractéristique rend son identification extrêmement difficile et sujette à erreur, particulièrement pour les médecins non spécialisés. Afin d'assister les gynécologues dans le traitement de l'endométriose, cet article de démonstration décrit un système entraîné pour segmenter les manifestations visuelles courantes de l'endométriose, à savoir les implants endométriosiques foncés. Le système est capable d'analyser les vidéos de chirurgie laparoscopique, d'annoter les zones d'implants identifiées avec des couches de superposition multicolores, et d'afficher un résumé des détections pour améliorer l'expérience de consultation vidéo.

Contexte de Recherche et Motivation

1. Problématique de Recherche

Cette recherche vise à résoudre le problème de l'identification et de la segmentation automatiques des foyers d'endométriose lors de la chirurgie laparoscopique. L'endométriose est une affection caractérisée par la croissance anormale de tissu semblable à l'endomètre en dehors de l'utérus, affectant les femmes en âge de procréer.

2. Importance du Problème

Difficulté diagnostique: L'endométriose présente des apparences visuelles diversifiées selon sa localisation, augmentant la difficulté de reconnaissance
Qualité médicale: L'identification et l'enregistrement complets de tous les foyers sont essentiels pour améliorer les symptômes et la qualité de vie des patients
Besoins éducatifs: Les médecins inexpérimentés risquent un diagnostic incomplet sous la pression du temps
Systèmes de classification: Deux principaux systèmes de classification existent (rASRM et Enzian), nécessitant une évaluation visuelle précise

3. Limitations des Approches Existantes

Dépendance à l'évaluation visuelle subjective du chirurgien
Détection limitée sur les vastes zones pelviennes et péritonéales
Augmentation de la difficulté de reconnaissance due aux différentes couleurs et apparences des foyers endométriosiques
Risque de diagnostic erroné dû à une formation insuffisante et à la pression du temps

4. Motivation de la Recherche

Exploiter les applications réussies de l'apprentissage profond en imagerie médicale pour développer un système capable d'identifier et de segmenter automatiquement les implants endométriosiques foncés, soutenant l'analyse peropératoire ou postopératoire et améliorant l'efficacité de la formation éducative.

Contributions Principales

Adaptation du modèle: Adaptation de Mask R-CNN pour la tâche de segmentation binaire des implants endométriosiques
Système de visualisation: Fourniture de visualisations spatiales et temporelles des implants endométriosiques dans les vidéos de chirurgie laparoscopique
Outil open-source: Mise à disposition du code source et du modèle pré-entraîné pour utilisation académique
Démonstration pratique: Démonstration de la faisabilité de l'application de la détection d'objets d'apprentissage automatique traditionnel à des cas d'usage médicaux réels

Détails de la Méthodologie

Définition de la Tâche

Entrée: Vidéo de chirurgie laparoscopique Sortie: Annotation des implants endométriosiques foncés avec masques de segmentation et scores de confiance Contraintes: Concentration sur l'identification d'une seule catégorie d'implants endométriosiques foncés

Architecture du Modèle

1. Architecture Générale

Le système comprend trois étapes principales:

Création du jeu de données: Extraction d'un jeu de données monoclass à partir du jeu de données GLENDA
Entraînement du modèle: Apprentissage par transfert utilisant Mask R-CNN
Analyse vidéo: Application du modèle et visualisation des résultats

2. Construction du Jeu de Données

Données de base: Extraction du Gynecologic Laparoscopy Endometriosis Dataset (GLENDA)
Échelle: Plus de 350 annotations d'implants endométriosiques basées sur des régions, couvrant 160 images provenant de plus de 100 cas de patients
Augmentation des données: Utilisation de techniques incluant rotation, flou, transformation de perspective, désaturation et suivi de cibles

3. Conception du Modèle

Réseau de base: Mask R-CNN avec ResNet-101 comme réseau de colonne vertébrale
Fonction de perte: Fonction de perte multi-tâche incluant:
- Perte de classification (perte logarithmique)
- Perte de boîte englobante (perte L1 lisse)
- Perte de segmentation de masque (perte d'entropie croisée binaire)
Paramètres d'entraînement: 50 epochs, taux d'apprentissage 0.001, optimiseur de descente de gradient stochastique

4. Pipeline de Traitement Vidéo

Vidéo chirurgicale brute → Analyse image par image → Extraction de boîtes englobantes, masques et étiquettes → Génération d'images annotées → Création de barre de résumé des détections → Sortie vidéo annotée

Points d'Innovation Technique

Adaptation au domaine médical: Adaptation réussie d'un réseau de détection d'objets générique à un scénario médical spécifique
Visualisation temporelle: Fourniture innovante d'une barre d'indication temporelle de la confiance de détection pour une localisation rapide des images clés
Capacité de traitement en temps réel: Optimisation de la vitesse de traitement, en moyenne 150-250ms par image
Sortie multimodale: Fourniture simultanée d'annotations visuelles et de données structurées au format JSON

Configuration Expérimentale

Jeu de Données

Nom: Jeu de données monoclass personnalisé basé sur GLENDA
Échelle: 350+ annotations, 160 images, 100+ cas de patients
Caractéristiques: Concentration sur les implants endométriosiques foncés
Division: Ensemble d'entraînement, ensemble de validation et ensemble de test

Métriques d'Évaluation

Métrique principale: Moyenne de la précision moyenne (mAP) pour la segmentation de masque
Paramètres de seuil: Seuil IoU 0.5 et plage 0.5-0.95
Confiance: Seuil de confiance de détection 0.50

Détails d'Implémentation

Entrée d'image: Redimensionnement à 800 pixels (côté court) et 1333 pixels (côté long)
Meilleur modèle: Performance optimale atteinte après 29 epochs
Stratégie d'augmentation: Rotation et recadrage montrent les meilleurs effets d'augmentation

Résultats Expérimentaux

Résultats Principaux

Performance optimale:
- mAP@0.50IoU: 0.642 (seuil IoU 0.5)
- mAP@0.50:0.95: 0.324 (seuil IoU 0.5-0.95)
Efficacité d'entraînement: Environ 2 heures pour compléter l'entraînement du modèle
Vitesse de traitement: Comparaison des temps de traitement à différentes résolutions

Résolution	Temps de traitement moyen (ms)
640×360	153
1280×720	158
1920×1080	170
3840×2160	207

Analyse de Performance

Estimation du traitement: Une vidéo d'une heure en résolution HD (25fps) nécessite environ 4 heures 15 minutes de traitement
Exigences matérielles: Intel Core i7-5820K, 32 Go de RAM, GTX 1080
Compatibilité multiplateforme: Support de Linux, Windows, support prévu pour macOS

Analyse de Cas

L'article fournit quatre exemples d'annotation d'implants endométriosiques foncés, démontrant la capacité du système à identifier les zones pathologiques distinctes des tissus environnants mais similaires aux taches de sang ou aux vaisseaux sanguins foncés.

Travaux Connexes

1. Segmentation en Imagerie Médicale

L'application généralisée de l'apprentissage profond en imagerie médicale fournit une base technique pour cette recherche.

2. Réseaux de Détection d'Objets

Faster R-CNN: Fournit la base du réseau de propositions de régions
Mask R-CNN: Architecture de réseau de segmentation centrale
ResNet: Réseau d'extraction de caractéristiques de colonne vertébrale

3. Classification de l'Endométriose

Classification rASRM: Applicable à l'enregistrement des foyers péritonéaux
Classification Enzian: Couvre l'endométriose profonde

Conclusions et Discussion

Conclusions Principales

Démonstration réussie de la faisabilité de Mask R-CNN pour la tâche de segmentation de l'endométriose
Développement d'une chaîne d'outils d'analyse vidéo complète, soutenant l'analyse d'archives vidéo postopératoires
Fourniture d'une interface de visualisation facilitant la planification thérapeutique et l'éducation clinique

Limitations

Type unique: Concentration uniquement sur les implants endométriosiques foncés, ne couvrant pas d'autres manifestations visuelles
Échelle des données: Le jeu de données relativement petit peut limiter la capacité de généralisation du modèle
Nature de démonstration: La version actuelle est une preuve de concept manquant d'une interface utilisateur complète
Vitesse de traitement: La capacité de traitement en temps réel nécessite une amélioration

Directions Futures

Extension à la détection de foyers d'endométriose multiclasse
Construction d'un système interactif de consultation vidéo postopératoire
Amélioration de l'interface utilisateur et de l'expérience utilisateur
Augmentation d'un jeu de données annoté de plus grande envergure

Évaluation Approfondie

Points Forts

1. Innovation Technique

Adaptation de domaine: Adaptation réussie de la technologie générale de vision par ordinateur à un scénario médical professionnel
Outil pratique: Fourniture d'une solution complète de bout en bout, de l'entraînement du modèle à l'analyse vidéo
Contribution open-source: Fourniture du code source et du modèle pré-entraîné, promouvant la recherche académique

2. Suffisance Expérimentale

Évaluation multidimensionnelle: Incluant les métriques de performance, le temps de traitement, les exigences matérielles et une analyse complète
Application pratique: Conception basée sur des données de patients réels et des besoins cliniques
Reproductibilité: Détails d'implémentation détaillés et code open-source soutenant la reproduction des résultats

3. Valeur Clinique

Signification éducative: Facilite la formation des médecins et l'amélioration des compétences
Assistance diagnostique: Réduit le risque de diagnostic manqué, améliore la précision diagnostique
Amélioration de l'efficacité: L'analyse automatisée économise le temps du médecin

Insuffisances

1. Limitations Méthodologiques

Classe unique: Traitement d'une seule manifestation visuelle, nécessitant l'identification de multiples types de foyers dans les applications réelles
Dépendance aux données: Le jeu de données relativement petit peut affecter la capacité de généralisation du modèle entre différents hôpitaux et équipements
Sensibilité au seuil: Le seuil de confiance fixe peut ne pas convenir à toutes les situations

2. Évaluation Insuffisante

Manque de validation clinique: Aucune étude de validation dans un environnement clinique réel
Lignes de base de comparaison limitées: Manque de comparaison détaillée avec d'autres méthodes de segmentation médicale
Absence d'étude utilisateur: Absence d'évaluation de l'efficacité et de l'acceptabilité de l'utilisation de cet outil par les médecins réels

3. Détails Techniques

Insuffisance du temps réel: La vitesse de traitement est difficile à satisfaire pour l'analyse en temps réel peropératoire
Interface rudimentaire: La version actuelle manque d'une conception d'interface utilisateur sophistiquée

Impact

1. Contribution Académique

Fournit une nouvelle direction de recherche pour le domaine de l'analyse vidéo médicale
Démontre le potentiel d'application de l'apprentissage profond dans le diagnostic des maladies gynécologiques
Fournit un jeu de données et des outils réutilisables

2. Valeur Pratique

Potentiel pour améliorer la précision diagnostique de l'endométriose
Utilisation possible dans l'éducation et la formation médicales
Pose les fondations pour le développement de systèmes d'assistance diagnostique médicale plus sophistiqués

3. Reproductibilité

Fourniture de détails techniques d'implémentation détaillés
Code open-source et modèle pré-entraîné
Instructions d'installation et d'utilisation claires

Scénarios d'Application

Analyse postopératoire: Analyse rétrospective des vidéos chirurgicales pour assurer l'identification complète des foyers
Éducation médicale: Formation des jeunes médecins à l'identification des foyers d'endométriose
Outil de recherche: Soutien de l'annotation et de l'analyse de foyers dans les études cliniques à grande échelle
Contrôle de qualité: Vérification de l'intégrité chirurgicale et de la précision diagnostique

Références

Canis, M., et al. "Revised american society for reproductive medicine classification of endometriosis: 1996." Fertility and Sterility, 1997.
He, K., et al. "Mask R-CNN." IEEE Trans. Pattern Anal. Mach. Intell., 2020.
Leibetseder, A., et al. "GLENDA: gynecologic laparoscopy endometriosis dataset." MultiMedia Modeling, 2020.

Résumé: Cet article de démonstration illustre l'application de l'apprentissage profond à l'analyse vidéo médicale gynécologique. Bien que la version actuelle présente certaines limitations, elle offre une exploration précieuse du domaine du diagnostic assisté par IA médicale, avec de bonnes perspectives de développement et une valeur pratique considérable. La nature open-source de ce travail favorisera le développement ultérieur de la recherche connexe.