2025-11-14T03:19:10.909198

Post-surgical Endometriosis Segmentation in Laparoscopic Videos

Leibetseder, Schoeffmann, Keckstein et al.
Endometriosis is a common women's condition exhibiting a manifold visual appearance in various body-internal locations. Having such properties makes its identification very difficult and error-prone, at least for laymen and non-specialized medical practitioners. In an attempt to provide assistance to gynecologic physicians treating endometriosis, this demo paper describes a system that is trained to segment one frequently occurring visual appearance of endometriosis, namely dark endometrial implants. The system is capable of analyzing laparoscopic surgery videos, annotating identified implant regions with multi-colored overlays and displaying a detection summary for improved video browsing.
academic

Сегментация послеоперационного эндометриоза в видеороликах лапароскопии

Основная информация

  • ID статьи: 2510.13899
  • Название: Post-surgical Endometriosis Segmentation in Laparoscopic Videos
  • Авторы: Andreas Leibetseder, Klaus Schoeffmann (Университет Клагенфурта), Jörg Keckstein (Университет Ульма), Simon Keckstein (Университет Людвига-Максимилиана Мюнхена)
  • Классификация: cs.CV cs.LG cs.MM
  • Дата публикации: 14 октября 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.13899

Аннотация

Эндометриоз является распространённым гинекологическим заболеванием, проявляющимся разнообразными визуальными признаками в различных локализациях. Эта особенность делает его идентификацию чрезвычайно сложной и подверженной ошибкам, особенно для неопытных врачей. Для оказания помощи гинекологам в лечении эндометриоза в данной демонстрационной статье описывается система, обученная сегментировать распространённые визуальные проявления эндометриоза, а именно тёмные эндометриоидные имплантаты. Система способна анализировать видеоролики лапароскопии, аннотировать выявленные области имплантатов многоцветными наложениями и отображать сводку обнаружений для улучшения опыта просмотра видео.

Исследовательский контекст и мотивация

1. Исследовательская проблема

Исследование направлено на решение проблемы автоматического выявления и сегментации очагов эндометриоза при лапароскопической хирургии. Эндометриоз — это заболевание, при котором ткань, подобная эндометрию, аномально разрастается вне матки, поражая женщин репродуктивного возраста.

2. Значимость проблемы

  • Сложность диагностики: Эндометриоз проявляет разнообразные визуальные признаки в различных локализациях, что затрудняет его выявление
  • Качество медицинской помощи: Полное выявление и документирование всех очагов имеет решающее значение для улучшения симптомов и качества жизни пациентов
  • Образовательные потребности: Неопытные врачи под давлением времени рискуют допустить неполную диагностику
  • Системы классификации: Существуют две основные системы классификации (rASRM и Enzian), требующие точной визуальной оценки

3. Ограничения существующих методов

  • Зависимость от субъективной визуальной оценки хирурга
  • Ограниченное выявление в обширных областях таза и брюшины
  • Повышенная сложность идентификации имплантатов различных цветов и внешнего вида
  • Риск ошибочной диагностики из-за недостаточной подготовки и нехватки времени

4. Исследовательская мотивация

Использование успешного применения глубокого обучения в медицинской визуализации для разработки системы, способной автоматически выявлять и сегментировать тёмные эндометриоидные имплантаты, поддерживающей интраоперационный или послеоперационный анализ и улучшающей образовательную подготовку.

Основные вклады

  1. Адаптация модели: Адаптация Mask R-CNN для задачи бинарной сегментации эндометриоидных имплантатов
  2. Система визуализации: Обеспечение локальной и временной визуализации эндометриоидных имплантатов в видеороликах лапароскопии
  3. Инструмент с открытым исходным кодом: Предоставление исходного кода инструмента и предварительно обученной модели для академического использования
  4. Практическая демонстрация: Демонстрация осуществимости применения традиционного машинного обучения для обнаружения объектов в реальных медицинских случаях

Подробное описание методологии

Определение задачи

Входные данные: Видеоролики лапароскопической хирургии Выходные данные: Аннотированные тёмные эндометриоидные имплантаты с масками сегментации и оценками уверенности Ограничения: Сосредоточение на выявлении эндометриоидных имплантатов одного класса тёмного цвета

Архитектура модели

1. Общая архитектура

Система включает три основных этапа:

  • Создание набора данных: Извлечение набора данных поражений одного класса из набора данных GLENDA
  • Обучение модели: Трансферное обучение с использованием Mask R-CNN
  • Анализ видео: Применение модели и визуализация результатов

2. Построение набора данных

  • Базовые данные: Извлечение из Gynecologic Laparoscopy Endometriosis Dataset (GLENDA)
  • Масштаб: Более 350 аннотаций эндометриоидных имплантатов на основе регионов, охватывающих 160 кадров изображений из более чем 100 клинических случаев
  • Увеличение данных: Применение методов ротации, размытия, перспективного преобразования, десатурации и отслеживания объектов

3. Проектирование модели

  • Базовая сеть: Mask R-CNN с ResNet-101 в качестве магистральной сети
  • Функция потерь: Многозадачная функция потерь, включающая:
    • Потери классификации (логарифмические потери)
    • Потери ограничивающего прямоугольника (гладкие потери L1)
    • Потери маски сегментации (бинарные потери кроссэнтропии)
  • Параметры обучения: 50 эпох, скорость обучения 0,001, оптимизатор стохастического градиентного спуска

4. Процесс обработки видео

Исходное хирургическое видео → Анализ кадр за кадром → Извлечение ограничивающих прямоугольников, масок и меток → Создание аннотированных кадров → Создание полосы сводки обнаружений → Вывод аннотированного видео

Технические инновации

  1. Адаптация для медицины: Успешная адаптация универсальной сети обнаружения объектов к специфическому медицинскому сценарию
  2. Временная визуализация: Инновационное предоставление временной полосы индикатора уверенности обнаружения для быстрого определения ключевых кадров
  3. Возможность обработки в реальном времени: Оптимизация скорости обработки, в среднем 150-250 мс на кадр
  4. Многомодальный вывод: Одновременное предоставление визуальных аннотаций и структурированных данных в формате JSON

Экспериментальная установка

Набор данных

  • Название: Пользовательский набор данных одного класса на основе GLENDA
  • Масштаб: 350+ аннотаций, 160 кадров, 100+ клинических случаев
  • Характеристики: Сосредоточение на тёмных эндометриоидных имплантатах
  • Разделение: Обучающий, валидационный и тестовый наборы

Метрики оценки

  • Основная метрика: Средняя точность (mAP) для сегментации маски
  • Установка порога: Пороги IoU 0,5 и диапазон 0,5-0,95
  • Уверенность: Порог уверенности обнаружения 0,50

Детали реализации

  • Входное изображение: Изменение размера до 800 пикселей (короткая сторона) и 1333 пикселей (длинная сторона)
  • Лучшая модель: Достижение оптимальной производительности после 29 эпох
  • Стратегия увеличения: Ротация и обрезка показали наилучший эффект увеличения

Результаты экспериментов

Основные результаты

  • Оптимальная производительность:
    • mAP@0.50IoU: 0,642 (порог IoU 0,5)
    • mAP@0.50:0.95: 0,324 (порог IoU 0,5-0,95)
  • Эффективность обучения: Примерно 2 часа на завершение обучения модели
  • Скорость обработки: Сравнение времени обработки при различных разрешениях
РазрешениеСреднее время обработки (мс)
640×360153
1280×720158
1920×1080170
3840×2160207

Анализ производительности

  • Оценка обработки: Видео продолжительностью 1 час в разрешении HD (25 кадров/сек) требует примерно 4 часов 15 минут обработки
  • Требования к оборудованию: Intel Core i7-5820K, 32 ГБ ОЗУ, GTX 1080
  • Кроссплатформенная совместимость: Поддержка Linux, Windows, предполагаемая поддержка MacOS

Анализ случаев

Статья предоставляет четыре примера аннотирования тёмных эндометриоидных имплантатов, демонстрирующих способность системы выявлять патологические области, явно отличающиеся от окружающей ткани, но похожие на кровяные пятна или тёмные кровеносные сосуды.

Связанные работы

1. Сегментация медицинских изображений

Широкое применение глубокого обучения в медицинской визуализации обеспечило технологическую основу для данного исследования.

2. Сети обнаружения объектов

  • Faster R-CNN: Обеспечение основы сети предложения регионов
  • Mask R-CNN: Архитектура основной сети сегментации
  • ResNet: Использование в качестве магистральной сети извлечения признаков

3. Классификация эндометриоза

  • Классификация rASRM: Применимо для документирования поражений брюшины
  • Классификация Enzian: Охватывает глубокий эндометриоз

Выводы и обсуждение

Основные выводы

  1. Успешная демонстрация осуществимости Mask R-CNN для задачи сегментации эндометриоза
  2. Разработка полной цепочки инструментов анализа видео, поддерживающей анализ послеоперационных видеоархивов
  3. Предоставление визуального интерфейса, способствующего планированию лечения и клиническому образованию

Ограничения

  1. Единственный тип: Сосредоточение только на тёмных эндометриоидных имплантатах без охвата других визуальных проявлений
  2. Масштаб данных: Относительно небольшой набор данных может ограничить способность модели к обобщению
  3. Демонстрационный характер: Текущая версия является доказательством концепции, лишённым полноценного пользовательского интерфейса
  4. Скорость обработки: Возможность обработки в реальном времени требует улучшения

Будущие направления

  1. Расширение на многоклассовое выявление очагов эндометриоза
  2. Построение интерактивной системы просмотра послеоперационных видео
  3. Улучшение пользовательского интерфейса и пользовательского опыта
  4. Увеличение масштаба аннотированного набора данных

Углубленная оценка

Преимущества

1. Техническая инновативность

  • Адаптация к области: Успешная адаптация универсальной технологии компьютерного зрения к специализированному медицинскому сценарию
  • Практический инструмент: Предоставление полного сквозного решения от обучения модели до анализа видео
  • Вклад в открытый исходный код: Предоставление исходного кода и предварительно обученной модели для поддержки академических исследований

2. Достаточность экспериментов

  • Многомерная оценка: Включение комплексного анализа метрик производительности, времени обработки, требований к оборудованию
  • Практическое применение: Проектирование на основе реальных данных пациентов и клинических потребностей
  • Воспроизводимость: Детальные детали реализации и открытый исходный код поддерживают воспроизведение результатов

3. Клиническая ценность

  • Образовательное значение: Содействие подготовке врачей и повышению квалификации
  • Диагностическая поддержка: Снижение риска пропуска диагноза и повышение точности диагностики
  • Повышение эффективности: Автоматизированный анализ экономит время врача

Недостатки

1. Ограничения методологии

  • Единственный класс: Обработка только одного визуального проявления, в то время как практическое применение требует выявления нескольких типов поражений
  • Зависимость от данных: Относительно небольшой набор данных может влиять на способность модели к обобщению между различными больницами и оборудованием
  • Чувствительность к порогу: Фиксированный порог уверенности может быть неприменим во всех ситуациях

2. Недостаточность оценки

  • Отсутствие клинической валидации: Отсутствие исследований валидации в реальной клинической среде
  • Ограниченные базовые сравнения: Отсутствие детального сравнения с другими методами медицинской сегментации
  • Отсутствие исследования пользователей: Отсутствие оценки эффективности и приемлемости использования инструмента реальными врачами

3. Технические детали

  • Недостаточная обработка в реальном времени: Скорость обработки затрудняет удовлетворение требований интраоперационного анализа в реальном времени
  • Примитивный интерфейс: Текущая версия лишена полноценного проектирования пользовательского интерфейса

Влияние

1. Академический вклад

  • Предоставление нового направления исследований для области анализа медицинских видео
  • Демонстрация потенциала глубокого обучения в диагностике гинекологических заболеваний
  • Предоставление повторно используемого набора данных и инструментов

2. Практическая ценность

  • Потенциал улучшения точности диагностики эндометриоза
  • Применение в медицинском образовании и подготовке
  • Создание основы для разработки более совершенных систем медицинской вспомогательной диагностики

3. Воспроизводимость

  • Предоставление детальных технических деталей реализации
  • Открытый исходный код и предварительно обученная модель
  • Ясные инструкции по установке и использованию

Применимые сценарии

  1. Послеоперационный анализ: Ретроспективный анализ хирургических видео для обеспечения полного выявления поражений
  2. Медицинское образование: Подготовка молодых врачей к выявлению очагов эндометриоза
  3. Исследовательский инструмент: Поддержка крупномасштабных клинических исследований в аннотировании и анализе поражений
  4. Контроль качества: Проверка полноты хирургического вмешательства и точности диагностики

Библиография

  1. Canis, M., et al. "Revised american society for reproductive medicine classification of endometriosis: 1996." Fertility and Sterility, 1997.
  2. He, K., et al. "Mask R-CNN." IEEE Trans. Pattern Anal. Mach. Intell., 2020.
  3. Leibetseder, A., et al. "GLENDA: gynecologic laparoscopy endometriosis dataset." MultiMedia Modeling, 2020.

Резюме: Это демонстрационная статья, показывающая применение глубокого обучения в анализе гинекологических медицинских видео. Хотя текущая версия имеет некоторые ограничения, она предоставляет ценное исследование в области медицинского ИИ и вспомогательной диагностики с хорошими перспективами развития и практической ценностью. Открытый характер этой работы будет способствовать дальнейшему развитию соответствующих исследований.