2025-11-14T03:19:10.909198

Post-surgical Endometriosis Segmentation in Laparoscopic Videos

Leibetseder, Schoeffmann, Keckstein et al.
Endometriosis is a common women's condition exhibiting a manifold visual appearance in various body-internal locations. Having such properties makes its identification very difficult and error-prone, at least for laymen and non-specialized medical practitioners. In an attempt to provide assistance to gynecologic physicians treating endometriosis, this demo paper describes a system that is trained to segment one frequently occurring visual appearance of endometriosis, namely dark endometrial implants. The system is capable of analyzing laparoscopic surgery videos, annotating identified implant regions with multi-colored overlays and displaying a detection summary for improved video browsing.
academic

Segmentation de l'Endométriose Post-Chirurgicale dans les Vidéos Laparoscopiques

Informations Fondamentales

  • ID de l'article: 2510.13899
  • Titre: Post-surgical Endometriosis Segmentation in Laparoscopic Videos
  • Auteurs: Andreas Leibetseder, Klaus Schoeffmann (Université de Klagenfurt), Jörg Keckstein (Université d'Ulm), Simon Keckstein (Université Ludwig-Maximilians de Munich)
  • Classification: cs.CV cs.LG cs.MM
  • Date de publication: 14 octobre 2025 (prépublication arXiv)
  • Lien de l'article: https://arxiv.org/abs/2510.13899

Résumé

L'endométriose est une affection gynécologique courante qui présente une diversité d'apparences visuelles selon sa localisation dans l'organisme. Cette caractéristique rend son identification extrêmement difficile et sujette à erreur, particulièrement pour les médecins non spécialisés. Afin d'assister les gynécologues dans le traitement de l'endométriose, cet article de démonstration décrit un système entraîné pour segmenter les manifestations visuelles courantes de l'endométriose, à savoir les implants endométriosiques foncés. Le système est capable d'analyser les vidéos de chirurgie laparoscopique, d'annoter les zones d'implants identifiées avec des couches de superposition multicolores, et d'afficher un résumé des détections pour améliorer l'expérience de consultation vidéo.

Contexte de Recherche et Motivation

1. Problématique de Recherche

Cette recherche vise à résoudre le problème de l'identification et de la segmentation automatiques des foyers d'endométriose lors de la chirurgie laparoscopique. L'endométriose est une affection caractérisée par la croissance anormale de tissu semblable à l'endomètre en dehors de l'utérus, affectant les femmes en âge de procréer.

2. Importance du Problème

  • Difficulté diagnostique: L'endométriose présente des apparences visuelles diversifiées selon sa localisation, augmentant la difficulté de reconnaissance
  • Qualité médicale: L'identification et l'enregistrement complets de tous les foyers sont essentiels pour améliorer les symptômes et la qualité de vie des patients
  • Besoins éducatifs: Les médecins inexpérimentés risquent un diagnostic incomplet sous la pression du temps
  • Systèmes de classification: Deux principaux systèmes de classification existent (rASRM et Enzian), nécessitant une évaluation visuelle précise

3. Limitations des Approches Existantes

  • Dépendance à l'évaluation visuelle subjective du chirurgien
  • Détection limitée sur les vastes zones pelviennes et péritonéales
  • Augmentation de la difficulté de reconnaissance due aux différentes couleurs et apparences des foyers endométriosiques
  • Risque de diagnostic erroné dû à une formation insuffisante et à la pression du temps

4. Motivation de la Recherche

Exploiter les applications réussies de l'apprentissage profond en imagerie médicale pour développer un système capable d'identifier et de segmenter automatiquement les implants endométriosiques foncés, soutenant l'analyse peropératoire ou postopératoire et améliorant l'efficacité de la formation éducative.

Contributions Principales

  1. Adaptation du modèle: Adaptation de Mask R-CNN pour la tâche de segmentation binaire des implants endométriosiques
  2. Système de visualisation: Fourniture de visualisations spatiales et temporelles des implants endométriosiques dans les vidéos de chirurgie laparoscopique
  3. Outil open-source: Mise à disposition du code source et du modèle pré-entraîné pour utilisation académique
  4. Démonstration pratique: Démonstration de la faisabilité de l'application de la détection d'objets d'apprentissage automatique traditionnel à des cas d'usage médicaux réels

Détails de la Méthodologie

Définition de la Tâche

Entrée: Vidéo de chirurgie laparoscopique Sortie: Annotation des implants endométriosiques foncés avec masques de segmentation et scores de confiance Contraintes: Concentration sur l'identification d'une seule catégorie d'implants endométriosiques foncés

Architecture du Modèle

1. Architecture Générale

Le système comprend trois étapes principales:

  • Création du jeu de données: Extraction d'un jeu de données monoclass à partir du jeu de données GLENDA
  • Entraînement du modèle: Apprentissage par transfert utilisant Mask R-CNN
  • Analyse vidéo: Application du modèle et visualisation des résultats

2. Construction du Jeu de Données

  • Données de base: Extraction du Gynecologic Laparoscopy Endometriosis Dataset (GLENDA)
  • Échelle: Plus de 350 annotations d'implants endométriosiques basées sur des régions, couvrant 160 images provenant de plus de 100 cas de patients
  • Augmentation des données: Utilisation de techniques incluant rotation, flou, transformation de perspective, désaturation et suivi de cibles

3. Conception du Modèle

  • Réseau de base: Mask R-CNN avec ResNet-101 comme réseau de colonne vertébrale
  • Fonction de perte: Fonction de perte multi-tâche incluant:
    • Perte de classification (perte logarithmique)
    • Perte de boîte englobante (perte L1 lisse)
    • Perte de segmentation de masque (perte d'entropie croisée binaire)
  • Paramètres d'entraînement: 50 epochs, taux d'apprentissage 0.001, optimiseur de descente de gradient stochastique

4. Pipeline de Traitement Vidéo

Vidéo chirurgicale brute → Analyse image par image → Extraction de boîtes englobantes, masques et étiquettes → Génération d'images annotées → Création de barre de résumé des détections → Sortie vidéo annotée

Points d'Innovation Technique

  1. Adaptation au domaine médical: Adaptation réussie d'un réseau de détection d'objets générique à un scénario médical spécifique
  2. Visualisation temporelle: Fourniture innovante d'une barre d'indication temporelle de la confiance de détection pour une localisation rapide des images clés
  3. Capacité de traitement en temps réel: Optimisation de la vitesse de traitement, en moyenne 150-250ms par image
  4. Sortie multimodale: Fourniture simultanée d'annotations visuelles et de données structurées au format JSON

Configuration Expérimentale

Jeu de Données

  • Nom: Jeu de données monoclass personnalisé basé sur GLENDA
  • Échelle: 350+ annotations, 160 images, 100+ cas de patients
  • Caractéristiques: Concentration sur les implants endométriosiques foncés
  • Division: Ensemble d'entraînement, ensemble de validation et ensemble de test

Métriques d'Évaluation

  • Métrique principale: Moyenne de la précision moyenne (mAP) pour la segmentation de masque
  • Paramètres de seuil: Seuil IoU 0.5 et plage 0.5-0.95
  • Confiance: Seuil de confiance de détection 0.50

Détails d'Implémentation

  • Entrée d'image: Redimensionnement à 800 pixels (côté court) et 1333 pixels (côté long)
  • Meilleur modèle: Performance optimale atteinte après 29 epochs
  • Stratégie d'augmentation: Rotation et recadrage montrent les meilleurs effets d'augmentation

Résultats Expérimentaux

Résultats Principaux

  • Performance optimale:
    • mAP@0.50IoU: 0.642 (seuil IoU 0.5)
    • mAP@0.50:0.95: 0.324 (seuil IoU 0.5-0.95)
  • Efficacité d'entraînement: Environ 2 heures pour compléter l'entraînement du modèle
  • Vitesse de traitement: Comparaison des temps de traitement à différentes résolutions
RésolutionTemps de traitement moyen (ms)
640×360153
1280×720158
1920×1080170
3840×2160207

Analyse de Performance

  • Estimation du traitement: Une vidéo d'une heure en résolution HD (25fps) nécessite environ 4 heures 15 minutes de traitement
  • Exigences matérielles: Intel Core i7-5820K, 32 Go de RAM, GTX 1080
  • Compatibilité multiplateforme: Support de Linux, Windows, support prévu pour macOS

Analyse de Cas

L'article fournit quatre exemples d'annotation d'implants endométriosiques foncés, démontrant la capacité du système à identifier les zones pathologiques distinctes des tissus environnants mais similaires aux taches de sang ou aux vaisseaux sanguins foncés.

Travaux Connexes

1. Segmentation en Imagerie Médicale

L'application généralisée de l'apprentissage profond en imagerie médicale fournit une base technique pour cette recherche.

2. Réseaux de Détection d'Objets

  • Faster R-CNN: Fournit la base du réseau de propositions de régions
  • Mask R-CNN: Architecture de réseau de segmentation centrale
  • ResNet: Réseau d'extraction de caractéristiques de colonne vertébrale

3. Classification de l'Endométriose

  • Classification rASRM: Applicable à l'enregistrement des foyers péritonéaux
  • Classification Enzian: Couvre l'endométriose profonde

Conclusions et Discussion

Conclusions Principales

  1. Démonstration réussie de la faisabilité de Mask R-CNN pour la tâche de segmentation de l'endométriose
  2. Développement d'une chaîne d'outils d'analyse vidéo complète, soutenant l'analyse d'archives vidéo postopératoires
  3. Fourniture d'une interface de visualisation facilitant la planification thérapeutique et l'éducation clinique

Limitations

  1. Type unique: Concentration uniquement sur les implants endométriosiques foncés, ne couvrant pas d'autres manifestations visuelles
  2. Échelle des données: Le jeu de données relativement petit peut limiter la capacité de généralisation du modèle
  3. Nature de démonstration: La version actuelle est une preuve de concept manquant d'une interface utilisateur complète
  4. Vitesse de traitement: La capacité de traitement en temps réel nécessite une amélioration

Directions Futures

  1. Extension à la détection de foyers d'endométriose multiclasse
  2. Construction d'un système interactif de consultation vidéo postopératoire
  3. Amélioration de l'interface utilisateur et de l'expérience utilisateur
  4. Augmentation d'un jeu de données annoté de plus grande envergure

Évaluation Approfondie

Points Forts

1. Innovation Technique

  • Adaptation de domaine: Adaptation réussie de la technologie générale de vision par ordinateur à un scénario médical professionnel
  • Outil pratique: Fourniture d'une solution complète de bout en bout, de l'entraînement du modèle à l'analyse vidéo
  • Contribution open-source: Fourniture du code source et du modèle pré-entraîné, promouvant la recherche académique

2. Suffisance Expérimentale

  • Évaluation multidimensionnelle: Incluant les métriques de performance, le temps de traitement, les exigences matérielles et une analyse complète
  • Application pratique: Conception basée sur des données de patients réels et des besoins cliniques
  • Reproductibilité: Détails d'implémentation détaillés et code open-source soutenant la reproduction des résultats

3. Valeur Clinique

  • Signification éducative: Facilite la formation des médecins et l'amélioration des compétences
  • Assistance diagnostique: Réduit le risque de diagnostic manqué, améliore la précision diagnostique
  • Amélioration de l'efficacité: L'analyse automatisée économise le temps du médecin

Insuffisances

1. Limitations Méthodologiques

  • Classe unique: Traitement d'une seule manifestation visuelle, nécessitant l'identification de multiples types de foyers dans les applications réelles
  • Dépendance aux données: Le jeu de données relativement petit peut affecter la capacité de généralisation du modèle entre différents hôpitaux et équipements
  • Sensibilité au seuil: Le seuil de confiance fixe peut ne pas convenir à toutes les situations

2. Évaluation Insuffisante

  • Manque de validation clinique: Aucune étude de validation dans un environnement clinique réel
  • Lignes de base de comparaison limitées: Manque de comparaison détaillée avec d'autres méthodes de segmentation médicale
  • Absence d'étude utilisateur: Absence d'évaluation de l'efficacité et de l'acceptabilité de l'utilisation de cet outil par les médecins réels

3. Détails Techniques

  • Insuffisance du temps réel: La vitesse de traitement est difficile à satisfaire pour l'analyse en temps réel peropératoire
  • Interface rudimentaire: La version actuelle manque d'une conception d'interface utilisateur sophistiquée

Impact

1. Contribution Académique

  • Fournit une nouvelle direction de recherche pour le domaine de l'analyse vidéo médicale
  • Démontre le potentiel d'application de l'apprentissage profond dans le diagnostic des maladies gynécologiques
  • Fournit un jeu de données et des outils réutilisables

2. Valeur Pratique

  • Potentiel pour améliorer la précision diagnostique de l'endométriose
  • Utilisation possible dans l'éducation et la formation médicales
  • Pose les fondations pour le développement de systèmes d'assistance diagnostique médicale plus sophistiqués

3. Reproductibilité

  • Fourniture de détails techniques d'implémentation détaillés
  • Code open-source et modèle pré-entraîné
  • Instructions d'installation et d'utilisation claires

Scénarios d'Application

  1. Analyse postopératoire: Analyse rétrospective des vidéos chirurgicales pour assurer l'identification complète des foyers
  2. Éducation médicale: Formation des jeunes médecins à l'identification des foyers d'endométriose
  3. Outil de recherche: Soutien de l'annotation et de l'analyse de foyers dans les études cliniques à grande échelle
  4. Contrôle de qualité: Vérification de l'intégrité chirurgicale et de la précision diagnostique

Références

  1. Canis, M., et al. "Revised american society for reproductive medicine classification of endometriosis: 1996." Fertility and Sterility, 1997.
  2. He, K., et al. "Mask R-CNN." IEEE Trans. Pattern Anal. Mach. Intell., 2020.
  3. Leibetseder, A., et al. "GLENDA: gynecologic laparoscopy endometriosis dataset." MultiMedia Modeling, 2020.

Résumé: Cet article de démonstration illustre l'application de l'apprentissage profond à l'analyse vidéo médicale gynécologique. Bien que la version actuelle présente certaines limitations, elle offre une exploration précieuse du domaine du diagnostic assisté par IA médicale, avec de bonnes perspectives de développement et une valeur pratique considérable. La nature open-source de ce travail favorisera le développement ultérieur de la recherche connexe.