2025-11-14T03:19:10.909198

Post-surgical Endometriosis Segmentation in Laparoscopic Videos

Leibetseder, Schoeffmann, Keckstein et al.

Endometriosis is a common women's condition exhibiting a manifold visual appearance in various body-internal locations. Having such properties makes its identification very difficult and error-prone, at least for laymen and non-specialized medical practitioners. In an attempt to provide assistance to gynecologic physicians treating endometriosis, this demo paper describes a system that is trained to segment one frequently occurring visual appearance of endometriosis, namely dark endometrial implants. The system is capable of analyzing laparoscopic surgery videos, annotating identified implant regions with multi-colored overlays and displaying a detection summary for improved video browsing.

academic

腹腔鏡手術ビデオにおける術後子宮内膜症のセグメンテーション

基本情報

論文ID: 2510.13899
タイトル: Post-surgical Endometriosis Segmentation in Laparoscopic Videos
著者: Andreas Leibetseder、Klaus Schoeffmann（クラーゲンフルト大学）、Jörg Keckstein（ウルム大学）、Simon Keckstein（ルートヴィヒ・マクシミリアン・ミュンヘン大学）
分類: cs.CV cs.LG cs.MM
発表日: 2025年10月14日（arXivプレプリント）
論文リンク: https://arxiv.org/abs/2510.13899

要旨

子宮内膜症は一般的な女性疾患であり、体内の異なる位置において多様な視覚的外観を示す。この特性により、特に非専門医にとって、その認識は極めて困難かつ誤りやすい。婦人科医による子宮内膜症の治療を支援するため、本デモンストレーション論文は、子宮内膜症の一般的な視覚的表現、すなわち暗色子宮内膜病巣のセグメンテーションのために訓練されたシステムについて述べている。本システムは腹腔鏡手術ビデオを分析し、多色オーバーレイで認識された病巣領域に注釈を付け、ビデオ閲覧体験を改善するための検出サマリーを表示することができる。

研究背景と動機

1. 研究課題

本研究は、腹腔鏡手術における子宮内膜症病変の自動認識およびセグメンテーション問題の解決を目指している。子宮内膜症は、子宮様組織が子宮外で異常に増殖する疾患であり、生殖年齢の女性に影響を与える。

2. 問題の重要性

診断困難性: 子宮内膜症は異なる位置で多様な視覚的外観を呈し、認識難度を増加させる
医療品質: すべての病変の完全な認識と記録は、患者の症状改善と生活の質向上に不可欠である
教育的必要性: 経験不足の医師は時間的プレッシャー下で不完全な診断のリスクに直面する可能性がある
分類システム: 2つの主要な分類システム（rASRMおよびEnzian）が存在し、正確な視覚的評価が必要である

3. 既存方法の限界

外科医の主観的視覚評価に依存
骨盤および腹膜の広大な領域における検出の制限
異なる色および外観の内膜病変が認識難度を増加させる
訓練不足および時間的プレッシャーによる誤診リスク

4. 研究動機

医学画像における深層学習の成功した応用を活用し、暗色子宮内膜病巣の自動認識およびセグメンテーションが可能なシステムを開発し、術中または術後分析を支援し、教育訓練効果を改善する。

中核的貢献

モデル適応: Mask R-CNNを子宮内膜病巣の二値セグメンテーションタスクに適応させた
可視化システム: 腹腔鏡手術ビデオにおける子宮内膜病巣の局所的および時系列的可視化を提供
オープンソースツール: 学術利用のためのツールソースコードおよび事前訓練済みモデルを提供
実用的デモンストレーション: 従来の機械学習目標検出を実際の医療用途に適用する実現可能性を実証

方法論の詳細

タスク定義

入力: 腹腔鏡手術ビデオ出力: セグメンテーションマスクおよび信頼度を伴う暗色子宮内膜病巣の注釈制約: 単一クラスの暗色内膜病巣認識に焦点を当てる

モデルアーキテクチャ

1. 全体的アーキテクチャ

システムは3つの主要なステップで構成される：

データセット作成: GLENDAデータセットから単一クラスの病変データセットを抽出
モデル訓練: Mask R-CNNを用いた転移学習
ビデオ分析: モデル適用および結果の可視化

2. データセット構築

基礎データ: 婦人科腹腔鏡子宮内膜症データセット（GLENDA）から抽出
規模: 350以上の領域ベースの子宮内膜病巣注釈、160フレーム画像、100以上の患者症例を含む
データ拡張: 回転、ぼかし、透視変換、彩度低下、および目標追跡などの技術を採用

3. モデル設計

基盤ネットワーク: ResNet-101をバックボーンとするMask R-CNN
損失関数: 以下を含む多タスク損失関数：
- 分類損失（対数損失）
- バウンディングボックス損失（平滑L1損失）
- マスクセグメンテーション損失（二値交差エントロピー損失）
訓練パラメータ: 50エポック、学習率0.001、確率的勾配降下法最適化器

4. ビデオ処理フロー

原始手術ビデオ → フレーム単位の分析 → バウンディングボックス、マスク、ラベルの抽出 
→ 注釈付きフレームの生成 → 検出サマリーバーの作成 → 注釈付きビデオの出力

技術的革新点

医療領域への適応: 汎用目標検出ネットワークを特定の医療シナリオに成功裏に適応させた
時系列可視化: 検出信頼度の時系列インジケータバーを革新的に提供し、キーフレームの迅速な特定を可能にする
リアルタイム処理能力: 処理速度を最適化し、フレームあたり平均150～250msを達成
マルチモーダル出力: 視覚的注釈とJSON形式の構造化データの両方を同時に提供

実験設定

データセット

名称: GLENDAベースのカスタム単一クラスデータセット
規模: 350以上の注釈、160フレーム、100以上の患者症例
特性: 暗色子宮内膜病巣に焦点を当てる
分割: 訓練セット、検証セット、テストセット

評価指標

主要指標: マスクセグメンテーション用の平均精度平均値（mAP）
閾値設定: IoU閾値0.5および0.5～0.95範囲
信頼度: 検出信頼度閾値0.50

実装の詳細

画像入力: 短辺800ピクセル、長辺1333ピクセルにリサイズ
最適モデル: 29エポック後に最高性能に達した
拡張戦略: 回転およびクロップ拡張が最良の効果を示した

実験結果

主要な結果

最高性能:
- mAP@0.50IoU: 0.642（IoU閾値0.5）
- mAP@0.50:0.95: 0.324（IoU閾値0.5～0.95）
訓練効率: モデル訓練に約2時間を要した
処理速度: 異なる解像度での処理時間の比較

解像度	平均処理時間(ms)
640×360	153
1280×720	158
1920×1080	170
3840×2160	207

パフォーマンス分析

処理推定: HD解像度（25fps）の1時間ビデオには約4時間15分の処理が必要
ハードウェア要件: Intel Core i7-5820K、32GB RAM、GTX 1080
クロスプラットフォーム互換性: Linux、Windows対応、MacOS対応予定

ケーススタディ

論文は暗色子宮内膜病巣の4つの注釈付き例を提供し、システムが周囲組織と明らかに異なるが血斑または暗い血管に類似する病理領域を認識できることを実証している。

結論と考察

主要な結論

子宮内膜症セグメンテーションタスクにおけるMask R-CNNの実現可能性を成功裏に実証した
術後ビデオアーカイブ分析をサポートする完全なビデオ分析ツールチェーンを開発した
治療計画および臨床教育を支援する可視化インターフェースを提供した

限界

単一タイプ: 暗色子宮内膜病巣のみに対応し、他の視覚的表現をカバーしていない
データ規模: 比較的小規模なデータセットはモデルの汎化能力を制限する可能性がある
デモンストレーション性質: 現在のバージョンは概念実証であり、完全なユーザーインターフェースが不足している
処理速度: リアルタイム処理能力は改善の余地がある

今後の方向性

複数クラスの子宮内膜症病変検出への拡張
インタラクティブな術後ビデオ閲覧システムの構築
ユーザーインターフェースおよびユーザーエクスペリエンスの改善
より大規模な注釈付きデータセットの増加

深層的評価

利点

1. 技術的革新性

領域適応: 汎用コンピュータビジョン技術を専門的医療シナリオに成功裏に適応させた
実用的ツール: モデル訓練からビデオ分析まで、完全なエンドツーエンドソリューションを提供
オープンソース貢献: ソースコードおよび事前訓練済みモデルを提供し、学術研究を促進

2. 実験の充分性

多次元評価: パフォーマンス指標、処理時間、ハードウェア要件など包括的な分析を含む
実際の応用: 実患者データおよび臨床ニーズに基づいて設計
再現性: 詳細な実装詳細とオープンソースコードが結果の再現をサポート

3. 臨床的価値

教育的意義: 医師の訓練およびスキル向上を支援
診断補助: 見落とし診断のリスクを低減し、診断精度を向上させる
効率向上: 自動化分析により医師の時間を節約

不足

1. 方法の限界

単一クラス: 1つの視覚的表現のみを処理し、実際の応用では複数の病変タイプの認識が必要
データ依存: 比較的小規模なデータセットは、異なる病院および機器間でのモデルの汎化能力に影響を与える可能性がある
閾値感度: 固定の信頼度閾値はすべての状況に適用できない可能性がある

2. 評価の不足

臨床検証の欠如: 実際の臨床環境での検証研究が実施されていない
比較基線の限定: 他の医学セグメンテーション方法との詳細な比較が不足している
ユーザー研究の欠落: 実際の医師がこのツールを使用する効果および受容度が評価されていない

3. 技術的詳細

リアルタイム性の不足: 処理速度は術中リアルタイム分析の要求を満たすことが困難
インターフェースの簡素性: 現在のバージョンは洗練されたユーザーインターフェース設計が不足している

影響力

1. 学術的貢献

医学ビデオ分析分野に新しい研究方向を提供
婦人科疾患診断における深層学習の応用可能性を実証
再利用可能なデータセットおよびツールを提供

2. 実用的価値

子宮内膜症の診断精度改善の可能性を有する
医学教育および訓練に利用可能
より完全な医療補助診断システムの開発の基礎を構築

3. 再現性

詳細な技術実装詳細を提供
オープンソースコードおよび事前訓練済みモデル
明確なインストールおよび使用説明

適用シナリオ

術後分析: 手術ビデオの回顧的分析、病変の完全認識の確保
医学教育: 若い医師による子宮内膜症病巣認識の訓練
研究ツール: 大規模臨床研究における病変注釈および分析をサポート
品質管理: 手術の完全性および診断精度の検証

参考文献

Canis, M., et al. "Revised american society for reproductive medicine classification of endometriosis: 1996." Fertility and Sterility, 1997.
He, K., et al. "Mask R-CNN." IEEE Trans. Pattern Anal. Mach. Intell., 2020.
Leibetseder, A., et al. "GLENDA: gynecologic laparoscopy endometriosis dataset." MultiMedia Modeling, 2020.

要約: 本論文は、婦人科医学ビデオ分析への深層学習の応用を実証するデモンストレーション論文である。現在のバージョンにはいくつかの限界が存在するが、医学AI補助診断分野に価値のある探索を提供し、良好な発展見通しと実用的価値を有している。本研究のオープンソース性質は、関連研究のさらなる発展を促進するであろう。