2025-11-14T03:19:10.909198

Post-surgical Endometriosis Segmentation in Laparoscopic Videos

Leibetseder, Schoeffmann, Keckstein et al.
Endometriosis is a common women's condition exhibiting a manifold visual appearance in various body-internal locations. Having such properties makes its identification very difficult and error-prone, at least for laymen and non-specialized medical practitioners. In an attempt to provide assistance to gynecologic physicians treating endometriosis, this demo paper describes a system that is trained to segment one frequently occurring visual appearance of endometriosis, namely dark endometrial implants. The system is capable of analyzing laparoscopic surgery videos, annotating identified implant regions with multi-colored overlays and displaying a detection summary for improved video browsing.
academic

Segmentazione della Endometriosi Post-Chirurgica in Video Laparoscopici

Informazioni Fondamentali

  • ID Articolo: 2510.13899
  • Titolo: Post-surgical Endometriosis Segmentation in Laparoscopic Videos
  • Autori: Andreas Leibetseder, Klaus Schoeffmann (Università di Klagenfurt), Jörg Keckstein (Università di Ulm), Simon Keckstein (Ludwig-Maximilians-Università di Monaco)
  • Classificazione: cs.CV cs.LG cs.MM
  • Data di Pubblicazione: 14 ottobre 2025 (preprint arXiv)
  • Link Articolo: https://arxiv.org/abs/2510.13899

Riassunto

L'endometriosi è una patologia femminile comune che presenta molteplici manifestazioni visive in diverse localizzazioni anatomiche. Questa caratteristica rende l'identificazione estremamente difficile e soggetta a errori, specialmente per medici non specializzati. Al fine di assistere i ginecologi nel trattamento dell'endometriosi, questo articolo dimostrativo descrive un sistema addestrato per segmentare le manifestazioni visive comuni dell'endometriosi, ovvero gli impianti endometriosici scuri. Il sistema è in grado di analizzare video laparoscopici, annotare le aree di impianto identificate con sovrapposizioni multicolori e visualizzare riepiloghi di rilevamento per migliorare l'esperienza di consultazione dei video.

Contesto di Ricerca e Motivazione

1. Problema di Ricerca

Questo studio affronta il problema dell'identificazione e segmentazione automatica delle lesioni endometriosiche durante interventi laparoscopici. L'endometriosi è una condizione caratterizzata dalla crescita anomala di tessuto simile all'endometrio al di fuori dell'utero, che colpisce le donne in età riproduttiva.

2. Importanza del Problema

  • Difficoltà Diagnostica: L'endometriosi presenta manifestazioni visive diversificate in diverse localizzazioni, aumentando la difficoltà di riconoscimento
  • Qualità Medica: L'identificazione e la documentazione complete di tutte le lesioni sono cruciali per migliorare i sintomi e la qualità della vita dei pazienti
  • Esigenze Educative: I medici meno esperti rischiano diagnosi incomplete sotto pressione temporale
  • Sistemi di Classificazione: Esistono due principali sistemi di classificazione (rASRM ed Enzian) che richiedono una valutazione visiva accurata

3. Limitazioni dei Metodi Esistenti

  • Dipendenza dalla valutazione visiva soggettiva del chirurgo
  • Rilevamento limitato su ampie aree pelviche e peritoneali
  • Difficoltà di riconoscimento dovuta ai diversi colori e aspetti delle lesioni endometriosiche
  • Rischio di errori diagnostici dovuti a insufficiente formazione e pressione temporale

4. Motivazione della Ricerca

Sfruttare il successo dell'apprendimento profondo nell'imaging medico per sviluppare un sistema in grado di identificare e segmentare automaticamente gli impianti endometriosici scuri, supportando l'analisi intraoperatoria o postoperatoria e migliorando l'efficacia della formazione educativa.

Contributi Principali

  1. Adattamento del Modello: Adattamento di Mask R-CNN per il compito di segmentazione binaria degli impianti endometriosici
  2. Sistema di Visualizzazione: Fornitura di visualizzazione locale e temporale degli impianti endometriosici nei video laparoscopici
  3. Strumento Open-Source: Fornitura del codice sorgente dello strumento e del modello preaddestrato per uso accademico
  4. Dimostrazione Pratica: Dimostrazione della fattibilità dell'applicazione della rilevazione di oggetti tradizionale al machine learning in casi d'uso medici reali

Spiegazione Dettagliata del Metodo

Definizione del Compito

Input: Video laparoscopico Output: Annotazione degli impianti endometriosici scuri con maschere di segmentazione e punteggi di confidenza Vincoli: Focalizzazione sull'identificazione di una singola classe di impianti endometriosici scuri

Architettura del Modello

1. Architettura Generale

Il sistema comprende tre fasi principali:

  • Creazione del Dataset: Estrazione di un dataset di lesioni a singola classe dal dataset GLENDA
  • Addestramento del Modello: Apprendimento per trasferimento utilizzando Mask R-CNN
  • Analisi Video: Applicazione del modello e visualizzazione dei risultati

2. Costruzione del Dataset

  • Dati di Base: Estrazione dal Gynecologic Laparoscopy Endometriosis Dataset (GLENDA)
  • Scala: Oltre 350 annotazioni di impianti endometriosici basate su regioni, che coprono 160 fotogrammi da oltre 100 casi di pazienti
  • Aumento dei Dati: Utilizzo di tecniche quali rotazione, sfocatura, trasformazione prospettica, desaturazione e tracciamento degli oggetti

3. Progettazione del Modello

  • Rete di Base: Mask R-CNN con ResNet-101 come rete backbone
  • Funzione di Perdita: Funzione di perdita multitask che include:
    • Perdita di classificazione (perdita logaritmica)
    • Perdita di bounding box (perdita Smooth L1)
    • Perdita di segmentazione della maschera (perdita di entropia incrociata binaria)
  • Parametri di Addestramento: 50 epoche, tasso di apprendimento 0,001, ottimizzatore discesa del gradiente stocastico

4. Flusso di Elaborazione Video

Video chirurgico grezzo → Analisi frame-by-frame → Estrazione di bounding box, maschere ed etichette → Generazione di fotogrammi annotati → Creazione di barra di riepilogo rilevamenti → Output video annotato

Punti di Innovazione Tecnica

  1. Adattamento al Dominio Medico: Adattamento riuscito di una rete di rilevamento di oggetti generica a uno scenario medico specifico
  2. Visualizzazione Temporale: Fornitura innovativa di barre indicatrici temporali della confidenza di rilevamento per una rapida localizzazione dei fotogrammi chiave
  3. Capacità di Elaborazione in Tempo Reale: Ottimizzazione della velocità di elaborazione, media 150-250ms per fotogramma
  4. Output Multimodale: Fornitura simultanea di annotazioni visive e dati strutturati in formato JSON

Configurazione Sperimentale

Dataset

  • Nome: Dataset personalizzato a singola classe basato su GLENDA
  • Scala: 350+ annotazioni, 160 fotogrammi, 100+ casi di pazienti
  • Caratteristiche: Focalizzazione su impianti endometriosici scuri
  • Suddivisione: Set di addestramento, validazione e test

Metriche di Valutazione

  • Metrica Principale: Media della Precisione Media (mAP) per segmentazione della maschera
  • Impostazione Soglia: Soglia IoU 0,5 e intervallo 0,5-0,95
  • Confidenza: Soglia di confidenza di rilevamento 0,50

Dettagli di Implementazione

  • Input Immagine: Ridimensionamento a 800 pixel (lato corto) e 1333 pixel (lato lungo)
  • Modello Ottimale: Prestazioni migliori raggiunte dopo 29 epoche
  • Strategia di Aumento: Rotazione e ritaglio mostrano i migliori effetti di aumento

Risultati Sperimentali

Risultati Principali

  • Prestazioni Ottimali:
    • mAP@0.50IoU: 0,642 (soglia IoU 0,5)
    • mAP@0.50:0.95: 0,324 (soglia IoU 0,5-0,95)
  • Efficienza di Addestramento: Circa 2 ore per completare l'addestramento del modello
  • Velocità di Elaborazione: Confronto dei tempi di elaborazione a diverse risoluzioni
RisoluzioneTempo di Elaborazione Medio (ms)
640×360153
1280×720158
1920×1080170
3840×2160207

Analisi delle Prestazioni

  • Stima di Elaborazione: Un video di 1 ora in risoluzione HD (25fps) richiede circa 4 ore e 15 minuti di elaborazione
  • Requisiti Hardware: Intel Core i7-5820K, 32GB RAM, GTX 1080
  • Compatibilità Multipiattaforma: Supporto per Linux, Windows, previsto supporto per MacOS

Analisi dei Casi

L'articolo fornisce quattro esempi di annotazione di impianti endometriosici scuri, dimostrando la capacità del sistema di identificare aree patologiche chiaramente diverse dal tessuto circostante ma simili a macchie di sangue o vasi sanguigni scuri.

Lavori Correlati

1. Segmentazione di Imaging Medico

L'ampia applicazione dell'apprendimento profondo nell'imaging medico fornisce la base tecnica per questa ricerca.

2. Reti di Rilevamento di Oggetti

  • Faster R-CNN: Fornisce la base della rete di proposte di regioni
  • Mask R-CNN: Architettura di rete di segmentazione principale
  • ResNet: Come rete backbone per l'estrazione di caratteristiche

3. Classificazione dell'Endometriosi

  • Classificazione rASRM: Applicabile alla registrazione delle lesioni peritoneali
  • Classificazione Enzian: Copre l'endometriosi profonda

Conclusioni e Discussione

Conclusioni Principali

  1. Dimostrazione riuscita della fattibilità di Mask R-CNN nel compito di segmentazione dell'endometriosi
  2. Sviluppo di una catena di strumenti completa per l'analisi video che supporta l'analisi dell'archivio video postoperatorio
  3. Fornitura di un'interfaccia di visualizzazione che facilita la pianificazione del trattamento e l'educazione clinica

Limitazioni

  1. Tipo Singolo: Focalizzazione solo su impianti endometriosici scuri, senza copertura di altre manifestazioni visive
  2. Scala dei Dati: Il dataset relativamente piccolo potrebbe limitare la capacità di generalizzazione del modello
  3. Natura Dimostrativa: La versione attuale è una prova di concetto, mancante di un'interfaccia utente completa
  4. Velocità di Elaborazione: La capacità di elaborazione in tempo reale necessita di miglioramenti

Direzioni Future

  1. Estensione al rilevamento di lesioni endometriosiche multiclasse
  2. Costruzione di un sistema interattivo di consultazione video postoperatorio
  3. Miglioramento dell'interfaccia utente e dell'esperienza utente
  4. Aumento di dataset di annotazione su larga scala

Valutazione Approfondita

Punti di Forza

1. Innovazione Tecnica

  • Adattamento del Dominio: Adattamento riuscito della tecnologia di visione artificiale generica a uno scenario medico specializzato
  • Strumento Pratico: Fornitura di una soluzione end-to-end completa, dall'addestramento del modello all'analisi video
  • Contributo Open-Source: Fornitura di codice sorgente e modello preaddestrato, promozione della ricerca accademica

2. Completezza Sperimentale

  • Valutazione Multidimensionale: Inclusione di metriche di prestazione, tempi di elaborazione, requisiti hardware e analisi completa
  • Applicazione Pratica: Progettazione basata su dati reali di pazienti e esigenze cliniche
  • Riproducibilità: Dettagli di implementazione dettagliati e codice open-source supportano la riproduzione dei risultati

3. Valore Clinico

  • Significato Educativo: Facilita la formazione medica e il miglioramento delle competenze
  • Assistenza Diagnostica: Riduce il rischio di diagnosi mancate, migliora l'accuratezza diagnostica
  • Miglioramento dell'Efficienza: L'analisi automatizzata risparmia tempo ai medici

Carenze

1. Limitazioni del Metodo

  • Classe Singola: Gestisce solo un tipo di manifestazione visiva, mentre l'applicazione pratica richiede il riconoscimento di molteplici tipi di lesioni
  • Dipendenza dai Dati: Il dataset relativamente piccolo potrebbe influire sulla capacità di generalizzazione del modello tra diversi ospedali e apparecchiature
  • Sensibilità alla Soglia: La soglia di confidenza fissa potrebbe non essere applicabile a tutte le situazioni

2. Valutazione Insufficiente

  • Mancanza di Validazione Clinica: Nessuna ricerca di validazione in ambiente clinico effettivo
  • Linee di Base di Confronto Limitate: Mancanza di confronti dettagliati con altri metodi di segmentazione medica
  • Assenza di Ricerca Utente: Nessuna valutazione dell'effetto e dell'accettazione dell'uso effettivo dello strumento da parte dei medici

3. Dettagli Tecnici

  • Insufficienza in Tempo Reale: La velocità di elaborazione difficilmente soddisfa le esigenze di analisi in tempo reale intraoperatoria
  • Interfaccia Rudimentale: La versione attuale manca di un design dell'interfaccia utente sofisticato

Impatto

1. Contributo Accademico

  • Fornisce una nuova direzione di ricerca nel campo dell'analisi video medica
  • Dimostra il potenziale dell'apprendimento profondo nell'applicazione alla diagnosi di malattie ginecologiche
  • Fornisce dataset e strumenti riutilizzabili

2. Valore Pratico

  • Potenziale per migliorare l'accuratezza diagnostica dell'endometriosi
  • Applicabile all'educazione medica e alla formazione
  • Pone le basi per lo sviluppo di sistemi di assistenza diagnostica medica più sofisticati

3. Riproducibilità

  • Fornitura di dettagli tecnici di implementazione dettagliati
  • Codice open-source e modello preaddestrato
  • Istruzioni di installazione e utilizzo chiare

Scenari Applicabili

  1. Analisi Postoperatoria: Analisi retrospettiva di video chirurgici per garantire l'identificazione completa delle lesioni
  2. Educazione Medica: Formazione dei giovani medici nel riconoscimento delle lesioni endometriosiche
  3. Strumento di Ricerca: Supporto all'annotazione e all'analisi di lesioni in ricerche cliniche su larga scala
  4. Controllo di Qualità: Verifica della completezza chirurgica e dell'accuratezza diagnostica

Bibliografia

  1. Canis, M., et al. "Revised american society for reproductive medicine classification of endometriosis: 1996." Fertility and Sterility, 1997.
  2. He, K., et al. "Mask R-CNN." IEEE Trans. Pattern Anal. Mach. Intell., 2020.
  3. Leibetseder, A., et al. "GLENDA: gynecologic laparoscopy endometriosis dataset." MultiMedia Modeling, 2020.

Sintesi: Questo è un articolo dimostrativo che illustra l'applicazione dell'apprendimento profondo nell'analisi video medica ginecologica. Sebbene la versione attuale presenti alcune limitazioni, fornisce un'esplorazione preziosa nel campo della diagnostica assistita da intelligenza artificiale medica, con buone prospettive di sviluppo e valore pratico. La natura open-source di questo lavoro promuoverà l'ulteriore sviluppo della ricerca correlata.