Endometriosis is a common women's condition exhibiting a manifold visual appearance in various body-internal locations. Having such properties makes its identification very difficult and error-prone, at least for laymen and non-specialized medical practitioners. In an attempt to provide assistance to gynecologic physicians treating endometriosis, this demo paper describes a system that is trained to segment one frequently occurring visual appearance of endometriosis, namely dark endometrial implants. The system is capable of analyzing laparoscopic surgery videos, annotating identified implant regions with multi-colored overlays and displaying a detection summary for improved video browsing.
論文ID : 2510.13899タイトル : Post-surgical Endometriosis Segmentation in Laparoscopic Videos著者 : Andreas Leibetseder、Klaus Schoeffmann(クラーゲンフルト大学)、Jörg Keckstein(ウルム大学)、Simon Keckstein(ルートヴィヒ・マクシミリアン・ミュンヘン大学)分類 : cs.CV cs.LG cs.MM発表日 : 2025年10月14日(arXivプレプリント)論文リンク : https://arxiv.org/abs/2510.13899 子宮内膜症は一般的な女性疾患であり、体内の異なる位置において多様な視覚的外観を示す。この特性により、特に非専門医にとって、その認識は極めて困難かつ誤りやすい。婦人科医による子宮内膜症の治療を支援するため、本デモンストレーション論文は、子宮内膜症の一般的な視覚的表現、すなわち暗色子宮内膜病巣のセグメンテーションのために訓練されたシステムについて述べている。本システムは腹腔鏡手術ビデオを分析し、多色オーバーレイで認識された病巣領域に注釈を付け、ビデオ閲覧体験を改善するための検出サマリーを表示することができる。
本研究は、腹腔鏡手術における子宮内膜症病変の自動認識およびセグメンテーション問題の解決を目指している。子宮内膜症は、子宮様組織が子宮外で異常に増殖する疾患であり、生殖年齢の女性に影響を与える。
診断困難性 : 子宮内膜症は異なる位置で多様な視覚的外観を呈し、認識難度を増加させる医療品質 : すべての病変の完全な認識と記録は、患者の症状改善と生活の質向上に不可欠である教育的必要性 : 経験不足の医師は時間的プレッシャー下で不完全な診断のリスクに直面する可能性がある分類システム : 2つの主要な分類システム(rASRMおよびEnzian)が存在し、正確な視覚的評価が必要である外科医の主観的視覚評価に依存 骨盤および腹膜の広大な領域における検出の制限 異なる色および外観の内膜病変が認識難度を増加させる 訓練不足および時間的プレッシャーによる誤診リスク 医学画像における深層学習の成功した応用を活用し、暗色子宮内膜病巣の自動認識およびセグメンテーションが可能なシステムを開発し、術中または術後分析を支援し、教育訓練効果を改善する。
モデル適応 : Mask R-CNNを子宮内膜病巣の二値セグメンテーションタスクに適応させた可視化システム : 腹腔鏡手術ビデオにおける子宮内膜病巣の局所的および時系列的可視化を提供オープンソースツール : 学術利用のためのツールソースコードおよび事前訓練済みモデルを提供実用的デモンストレーション : 従来の機械学習目標検出を実際の医療用途に適用する実現可能性を実証入力 : 腹腔鏡手術ビデオ
出力 : セグメンテーションマスクおよび信頼度を伴う暗色子宮内膜病巣の注釈
制約 : 単一クラスの暗色内膜病巣認識に焦点を当てる
システムは3つの主要なステップで構成される:
データセット作成 : GLENDAデータセットから単一クラスの病変データセットを抽出モデル訓練 : Mask R-CNNを用いた転移学習ビデオ分析 : モデル適用および結果の可視化基礎データ : 婦人科腹腔鏡子宮内膜症データセット(GLENDA)から抽出規模 : 350以上の領域ベースの子宮内膜病巣注釈、160フレーム画像、100以上の患者症例を含むデータ拡張 : 回転、ぼかし、透視変換、彩度低下、および目標追跡などの技術を採用基盤ネットワーク : ResNet-101をバックボーンとするMask R-CNN損失関数 : 以下を含む多タスク損失関数:
分類損失(対数損失) バウンディングボックス損失(平滑L1損失) マスクセグメンテーション損失(二値交差エントロピー損失) 訓練パラメータ : 50エポック、学習率0.001、確率的勾配降下法最適化器原始手術ビデオ → フレーム単位の分析 → バウンディングボックス、マスク、ラベルの抽出
→ 注釈付きフレームの生成 → 検出サマリーバーの作成 → 注釈付きビデオの出力
医療領域への適応 : 汎用目標検出ネットワークを特定の医療シナリオに成功裏に適応させた時系列可視化 : 検出信頼度の時系列インジケータバーを革新的に提供し、キーフレームの迅速な特定を可能にするリアルタイム処理能力 : 処理速度を最適化し、フレームあたり平均150~250msを達成マルチモーダル出力 : 視覚的注釈とJSON形式の構造化データの両方を同時に提供名称 : GLENDAベースのカスタム単一クラスデータセット規模 : 350以上の注釈、160フレーム、100以上の患者症例特性 : 暗色子宮内膜病巣に焦点を当てる分割 : 訓練セット、検証セット、テストセット主要指標 : マスクセグメンテーション用の平均精度平均値(mAP)閾値設定 : IoU閾値0.5および0.5~0.95範囲信頼度 : 検出信頼度閾値0.50画像入力 : 短辺800ピクセル、長辺1333ピクセルにリサイズ最適モデル : 29エポック後に最高性能に達した拡張戦略 : 回転およびクロップ拡張が最良の効果を示した最高性能 :
mAP@0.50IoU : 0.642(IoU閾値0.5)mAP@0.50:0.95: 0.324(IoU閾値0.5~0.95) 訓練効率 : モデル訓練に約2時間を要した処理速度 : 異なる解像度での処理時間の比較解像度 平均処理時間(ms) 640×360 153 1280×720 158 1920×1080 170 3840×2160 207
処理推定 : HD解像度(25fps)の1時間ビデオには約4時間15分の処理が必要ハードウェア要件 : Intel Core i7-5820K、32GB RAM、GTX 1080クロスプラットフォーム互換性 : Linux、Windows対応、MacOS対応予定論文は暗色子宮内膜病巣の4つの注釈付き例を提供し、システムが周囲組織と明らかに異なるが血斑または暗い血管に類似する病理領域を認識できることを実証している。
深層学習の医学画像への広範な応用は、本研究に技術的基礎を提供している。
Faster R-CNN : 領域提案ネットワークの基礎を提供Mask R-CNN : コアセグメンテーションネットワークアーキテクチャResNet : バックボーン特徴抽出ネットワークとして機能rASRM分類 : 腹膜内病変記録に適用可能Enzian分類 : 深部子宮内膜症をカバー子宮内膜症セグメンテーションタスクにおけるMask R-CNNの実現可能性を成功裏に実証した 術後ビデオアーカイブ分析をサポートする完全なビデオ分析ツールチェーンを開発した 治療計画および臨床教育を支援する可視化インターフェースを提供した 単一タイプ : 暗色子宮内膜病巣のみに対応し、他の視覚的表現をカバーしていないデータ規模 : 比較的小規模なデータセットはモデルの汎化能力を制限する可能性があるデモンストレーション性質 : 現在のバージョンは概念実証であり、完全なユーザーインターフェースが不足している処理速度 : リアルタイム処理能力は改善の余地がある複数クラスの子宮内膜症病変検出への拡張 インタラクティブな術後ビデオ閲覧システムの構築 ユーザーインターフェースおよびユーザーエクスペリエンスの改善 より大規模な注釈付きデータセットの増加 領域適応 : 汎用コンピュータビジョン技術を専門的医療シナリオに成功裏に適応させた実用的ツール : モデル訓練からビデオ分析まで、完全なエンドツーエンドソリューションを提供オープンソース貢献 : ソースコードおよび事前訓練済みモデルを提供し、学術研究を促進多次元評価 : パフォーマンス指標、処理時間、ハードウェア要件など包括的な分析を含む実際の応用 : 実患者データおよび臨床ニーズに基づいて設計再現性 : 詳細な実装詳細とオープンソースコードが結果の再現をサポート教育的意義 : 医師の訓練およびスキル向上を支援診断補助 : 見落とし診断のリスクを低減し、診断精度を向上させる効率向上 : 自動化分析により医師の時間を節約単一クラス : 1つの視覚的表現のみを処理し、実際の応用では複数の病変タイプの認識が必要データ依存 : 比較的小規模なデータセットは、異なる病院および機器間でのモデルの汎化能力に影響を与える可能性がある閾値感度 : 固定の信頼度閾値はすべての状況に適用できない可能性がある臨床検証の欠如 : 実際の臨床環境での検証研究が実施されていない比較基線の限定 : 他の医学セグメンテーション方法との詳細な比較が不足しているユーザー研究の欠落 : 実際の医師がこのツールを使用する効果および受容度が評価されていないリアルタイム性の不足 : 処理速度は術中リアルタイム分析の要求を満たすことが困難インターフェースの簡素性 : 現在のバージョンは洗練されたユーザーインターフェース設計が不足している医学ビデオ分析分野に新しい研究方向を提供 婦人科疾患診断における深層学習の応用可能性を実証 再利用可能なデータセットおよびツールを提供 子宮内膜症の診断精度改善の可能性を有する 医学教育および訓練に利用可能 より完全な医療補助診断システムの開発の基礎を構築 詳細な技術実装詳細を提供 オープンソースコードおよび事前訓練済みモデル 明確なインストールおよび使用説明 術後分析 : 手術ビデオの回顧的分析、病変の完全認識の確保医学教育 : 若い医師による子宮内膜症病巣認識の訓練研究ツール : 大規模臨床研究における病変注釈および分析をサポート品質管理 : 手術の完全性および診断精度の検証Canis, M., et al. "Revised american society for reproductive medicine classification of endometriosis: 1996." Fertility and Sterility , 1997. He, K., et al. "Mask R-CNN." IEEE Trans. Pattern Anal. Mach. Intell. , 2020. Leibetseder, A., et al. "GLENDA: gynecologic laparoscopy endometriosis dataset." MultiMedia Modeling , 2020. 要約 : 本論文は、婦人科医学ビデオ分析への深層学習の応用を実証するデモンストレーション論文である。現在のバージョンにはいくつかの限界が存在するが、医学AI補助診断分野に価値のある探索を提供し、良好な発展見通しと実用的価値を有している。本研究のオープンソース性質は、関連研究のさらなる発展を促進するであろう。