2025-11-14T03:19:10.909198

Post-surgical Endometriosis Segmentation in Laparoscopic Videos

Leibetseder, Schoeffmann, Keckstein et al.
Endometriosis is a common women's condition exhibiting a manifold visual appearance in various body-internal locations. Having such properties makes its identification very difficult and error-prone, at least for laymen and non-specialized medical practitioners. In an attempt to provide assistance to gynecologic physicians treating endometriosis, this demo paper describes a system that is trained to segment one frequently occurring visual appearance of endometriosis, namely dark endometrial implants. The system is capable of analyzing laparoscopic surgery videos, annotating identified implant regions with multi-colored overlays and displaying a detection summary for improved video browsing.
academic

लैप्रोस्कोपिक वीडियो में सर्जरी के बाद एंडोमेट्रियोसिस विभाजन

मूल जानकारी

  • पेपर ID: 2510.13899
  • शीर्षक: Post-surgical Endometriosis Segmentation in Laparoscopic Videos
  • लेखक: Andreas Leibetseder, Klaus Schoeffmann (क्लेगेनफर्ट विश्वविद्यालय), Jörg Keckstein (उल्म विश्वविद्यालय), Simon Keckstein (लुडविग-मैक्सिमिलियन्स-विश्वविद्यालय म्यूनिख)
  • वर्गीकरण: cs.CV cs.LG cs.MM
  • प्रकाशन तिथि: 14 अक्टूबर 2025 (arXiv प्रीप्रिंट)
  • पेपर लिंक: https://arxiv.org/abs/2510.13899

सारांश

एंडोमेट्रियोसिस एक सामान्य महिला रोग है जो शरीर के विभिन्न स्थानों पर विविध दृश्य उपस्थिति प्रदर्शित करता है। यह विशेषता इसकी पहचान को अत्यंत कठिन और त्रुटि-प्रवण बनाती है, विशेषकर गैर-विशेषज्ञ चिकित्सकों के लिए। स्त्री रोग विशेषज्ञों को एंडोमेट्रियोसिस के उपचार में सहायता करने के लिए, यह प्रदर्शन पेपर एंडोमेट्रियोसिस की सामान्य दृश्य अभिव्यक्तियों, अर्थात् गहरे रंग के एंडोमेट्रियल प्रत्यारोपण के विभाजन के लिए प्रशिक्षित एक प्रणाली का वर्णन करता है। यह प्रणाली लैप्रोस्कोपिक सर्जरी वीडियो का विश्लेषण कर सकती है, पहचाने गए प्रत्यारोपण क्षेत्रों को बहु-रंग ओवरले के साथ टिप्पणी कर सकती है, और वीडियो ब्राउजिंग अनुभव में सुधार के लिए पहचान सारांश प्रदर्शित कर सकती है।

अनुसंधान पृष्ठभूमि और प्रेरणा

1. अनुसंधान समस्या

यह अनुसंधान लैप्रोस्कोपिक सर्जरी में एंडोमेट्रियोसिस घावों की स्वचालित पहचान और विभाजन की समस्या को हल करने का लक्ष्य रखता है। एंडोमेट्रियोसिस गर्भाशय के बाहर गर्भाशय जैसे ऊतकों की असामान्य वृद्धि है, जो प्रजनन आयु की महिलाओं को प्रभावित करता है।

2. समस्या की महत्ता

  • निदान की कठिनाई: एंडोमेट्रियोसिस विभिन्न स्थानों पर विविध दृश्य उपस्थिति प्रदर्शित करता है, जिससे पहचान की कठिनाई बढ़ जाती है
  • चिकित्सा गुणवत्ता: सभी घावों की पूर्ण पहचान और रिकॉर्डिंग रोगी के लक्षणों और जीवन की गुणवत्ता में सुधार के लिए महत्वपूर्ण है
  • शिक्षा की आवश्यकता: अनुभवहीन चिकित्सकों को समय के दबाव में अधूरे निदान का जोखिम हो सकता है
  • वर्गीकरण प्रणाली: दो मुख्य वर्गीकरण प्रणालियाँ (rASRM और Enzian) मौजूद हैं, जिन्हें सटीक दृश्य मूल्यांकन की आवश्यकता है

3. मौजूदा विधियों की सीमाएं

  • सर्जन के व्यक्तिपरक दृश्य मूल्यांकन पर निर्भरता
  • श्रोणि और पेरिटोनियल के बड़े क्षेत्रों में पहचान सीमित
  • विभिन्न रंगों और उपस्थिति के एंडोमेट्रियल घावों से पहचान में कठिनाई
  • अपर्याप्त प्रशिक्षण और समय के दबाव से गलत निदान का जोखिम

4. अनुसंधान प्रेरणा

चिकित्सा इमेजिंग में गहन शिक्षा के सफल अनुप्रयोग का लाभ उठाते हुए, एक ऐसी प्रणाली विकसित करना जो स्वचालित रूप से गहरे रंग के एंडोमेट्रियल प्रत्यारोपण की पहचान और विभाजन कर सके, जो सर्जरी के दौरान या बाद के विश्लेषण का समर्थन करे, शिक्षा प्रशिक्षण प्रभाव में सुधार करे।

मुख्य योगदान

  1. मॉडल अनुकूलन: Mask R-CNN को एंडोमेट्रियल प्रत्यारोपण के द्विआधारी विभाजन कार्य के लिए अनुकूलित किया
  2. दृश्य प्रणाली: लैप्रोस्कोपिक सर्जरी वीडियो में एंडोमेट्रियल प्रत्यारोपण का स्थानीय और अस्थायी दृश्य प्रदान करता है
  3. ओपन सोर्स उपकरण: शैक्षणिक उपयोग के लिए उपकरण स्रोत कोड और पूर्व-प्रशिक्षित मॉडल प्रदान करता है
  4. व्यावहारिक प्रदर्शन: वास्तविक चिकित्सा उपयोग के लिए पारंपरिक मशीन लर्निंग लक्ष्य पहचान के अनुप्रयोग की व्यवहार्यता प्रदर्शित करता है

विधि विवरण

कार्य परिभाषा

इनपुट: लैप्रोस्कोपिक सर्जरी वीडियो आउटपुट: विभाजन मास्क और आत्मविश्वास के साथ गहरे रंग के एंडोमेट्रियल प्रत्यारोपण टिप्पणी बाधाएं: एकल वर्ग के गहरे रंग के एंडोमेट्रियल प्रत्यारोपण पहचान पर ध्यान केंद्रित करता है

मॉडल आर्किटेक्चर

1. समग्र आर्किटेक्चर

प्रणाली में तीन मुख्य चरण हैं:

  • डेटासेट निर्माण: GLENDA डेटासेट से एकल-वर्ग घाव डेटासेट निकालना
  • मॉडल प्रशिक्षण: स्थानांतरण शिक्षा के लिए Mask R-CNN का उपयोग
  • वीडियो विश्लेषण: मॉडल अनुप्रयोग और परिणाम दृश्य

2. डेटासेट निर्माण

  • आधार डेटा: Gynecologic Laparoscopy Endometriosis Dataset (GLENDA) से निकाला गया
  • पैमाना: 350 से अधिक क्षेत्र-आधारित एंडोमेट्रियल प्रत्यारोपण टिप्पणियाँ, 160 फ्रेम छवियों को कवर करते हुए, 100 से अधिक रोगी मामलों से
  • डेटा वृद्धि: रोटेशन, धुंधलापन, परिप्रेक्ष्य परिवर्तन, विसंतृप्ति और लक्ष्य ट्रैकिंग तकनीकें

3. मॉडल डिजाइन

  • आधार नेटवर्क: Mask R-CNN with ResNet-101 बैकबोन नेटवर्क के रूप में
  • हानि फलन: बहु-कार्य हानि फलन, जिसमें शामिल हैं:
    • वर्गीकरण हानि (लॉग हानि)
    • सीमा बॉक्स हानि (चिकनी L1 हानि)
    • मास्क विभाजन हानि (द्विआधारी क्रॉस-एंट्रॉपी हानि)
  • प्रशिक्षण पैरामीटर: 50 epoch, 0.001 की सीखने की दर, स्टोकेस्टिक ग्रेडिएंट डिसेंट अनुकूलक

4. वीडियो प्रसंस्करण प्रवाह

मूल सर्जरी वीडियो → फ्रेम-दर-फ्रेम विश्लेषण → सीमा बॉक्स, मास्क और लेबल निकालना → टिप्पणीकृत फ्रेम उत्पन्न करना → पहचान सारांश बार बनाना → टिप्पणीकृत वीडियो आउटपुट

तकनीकी नवाचार बिंदु

  1. चिकित्सा क्षेत्र अनुकूलन: सामान्य लक्ष्य पहचान नेटवर्क को विशिष्ट चिकित्सा परिदृश्य में सफलतापूर्वक अनुकूलित करना
  2. अस्थायी दृश्य: पहचान आत्मविश्वास के अस्थायी संकेतक बार को नवीन तरीके से प्रदान करना, मुख्य फ्रेम के तेजी से स्थान के लिए
  3. वास्तविक समय प्रसंस्करण क्षमता: प्रसंस्करण गति को अनुकूलित करना, औसतन 150-250ms प्रति फ्रेम
  4. बहु-मोडल आउटपुट: दृश्य टिप्पणी और JSON प्रारूप में संरचित डेटा दोनों प्रदान करना

प्रायोगिक सेटअप

डेटासेट

  • नाम: GLENDA पर आधारित कस्टम एकल-वर्ग डेटासेट
  • पैमाना: 350+ टिप्पणियाँ, 160 फ्रेम, 100+ रोगी मामले
  • विशेषताएं: गहरे रंग के एंडोमेट्रियल प्रत्यारोपण पर ध्यान केंद्रित
  • विभाजन: प्रशिक्षण सेट, सत्यापन सेट और परीक्षण सेट

मूल्यांकन मेट्रिक्स

  • मुख्य मेट्रिक्स: मास्क विभाजन के लिए औसत सटीकता माध्य (mAP)
  • थ्रेसहोल्ड सेटिंग: IoU थ्रेसहोल्ड 0.5 और 0.5-0.95 श्रेणी
  • आत्मविश्वास: पहचान आत्मविश्वास थ्रेसहोल्ड 0.50

कार्यान्वयन विवरण

  • छवि इनपुट: 800 पिक्सेल (छोटी भुजा) और 1333 पिक्सेल (लंबी भुजा) में आकार समायोजन
  • सर्वोत्तम मॉडल: 29 epoch के बाद सर्वोत्तम प्रदर्शन प्राप्त
  • वृद्धि रणनीति: रोटेशन और क्रॉपिंग वृद्धि सबसे प्रभावी है

प्रायोगिक परिणाम

मुख्य परिणाम

  • सर्वोत्तम प्रदर्शन:
    • mAP@0.50IoU: 0.642 (IoU थ्रेसहोल्ड 0.5)
    • mAP@0.50:0.95: 0.324 (IoU थ्रेसहोल्ड 0.5-0.95)
  • प्रशिक्षण दक्षता: मॉडल प्रशिक्षण में लगभग 2 घंटे
  • प्रसंस्करण गति: विभिन्न रिज़ॉल्यूशन पर प्रसंस्करण समय तुलना
रिज़ॉल्यूशनऔसत प्रसंस्करण समय (ms)
640×360153
1280×720158
1920×1080170
3840×2160207

प्रदर्शन विश्लेषण

  • प्रसंस्करण अनुमान: HD रिज़ॉल्यूशन (25fps) के 1 घंटे के वीडियो को लगभग 4 घंटे 15 मिनट की प्रसंस्करण आवश्यकता है
  • हार्डवेयर आवश्यकताएं: Intel Core i7-5820K, 32GB RAM, GTX 1080
  • क्रॉस-प्लेटफॉर्म संगतता: Linux, Windows का समर्थन करता है, MacOS का समर्थन अपेक्षित है

केस विश्लेषण

पेपर गहरे रंग के एंडोमेट्रियल प्रत्यारोपण के चार टिप्पणीकृत उदाहरण प्रदान करता है, जो दर्शाता है कि प्रणाली आसपास के ऊतकों से स्पष्ट रूप से भिन्न लेकिन रक्त धब्बों या गहरी रक्त वाहिकाओं के समान रोग संबंधी क्षेत्रों की पहचान कर सकती है।

संबंधित कार्य

1. चिकित्सा इमेजिंग विभाजन

चिकित्सा इमेजिंग में गहन शिक्षा का व्यापक अनुप्रयोग इस अनुसंधान के लिए तकनीकी आधार प्रदान करता है।

2. लक्ष्य पहचान नेटवर्क

  • Faster R-CNN: क्षेत्र प्रस्ताव नेटवर्क आधार प्रदान करता है
  • Mask R-CNN: मुख्य विभाजन नेटवर्क आर्किटेक्चर
  • ResNet: बैकबोन विशेषता निष्कर्षण नेटवर्क के रूप में

3. एंडोमेट्रियोसिस वर्गीकरण

  • rASRM वर्गीकरण: पेरिटोनियल घावों के रिकॉर्डिंग के लिए उपयुक्त
  • Enzian वर्गीकरण: गहरी एंडोमेट्रियोसिस को कवर करता है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. एंडोमेट्रियोसिस विभाजन कार्य में Mask R-CNN की व्यवहार्यता को सफलतापूर्वक प्रदर्शित किया
  2. पूर्ण वीडियो विश्लेषण उपकरण श्रृंखला विकसित की, जो सर्जरी के बाद वीडियो संग्रह विश्लेषण का समर्थन करती है
  3. दृश्य इंटरफेस प्रदान किया, जो उपचार योजना और नैदानिक शिक्षा में सहायता करता है

सीमाएं

  1. एकल प्रकार: केवल गहरे रंग के एंडोमेट्रियल प्रत्यारोपण पर ध्यान केंद्रित, अन्य दृश्य अभिव्यक्तियों को कवर नहीं करता
  2. डेटा पैमाना: अपेक्षाकृत छोटा डेटासेट मॉडल सामान्यीकरण क्षमता को सीमित कर सकता है
  3. प्रदर्शन प्रकृति: वर्तमान संस्करण अवधारणा का प्रमाण है, पूर्ण उपयोगकर्ता इंटरफेस की कमी है
  4. प्रसंस्करण गति: वास्तविक समय प्रसंस्करण क्षमता में सुधार की आवश्यकता है

भविष्य की दिशाएं

  1. बहु-वर्ग एंडोमेट्रियोसिस घाव पहचान तक विस्तार
  2. इंटरैक्टिव सर्जरी के बाद वीडियो ब्राउजिंग प्रणाली का निर्माण
  3. उपयोगकर्ता इंटरफेस और उपयोगकर्ता अनुभव में सुधार
  4. बड़े पैमाने पर टिप्पणीकृत डेटासेट में वृद्धि

गहन मूल्यांकन

लाभ

1. तकनीकी नवाचार

  • क्षेत्र अनुकूलन: सामान्य कंप्यूटर दृष्टि तकनीक को पेशेवर चिकित्सा परिदृश्य में सफलतापूर्वक अनुकूलित करना
  • व्यावहारिक उपकरण: मॉडल प्रशिक्षण से वीडियो विश्लेषण तक पूर्ण अंत-से-अंत समाधान प्रदान करता है
  • ओपन सोर्स योगदान: स्रोत कोड और पूर्व-प्रशिक्षित मॉडल प्रदान करता है, शैक्षणिक अनुसंधान को बढ़ावा देता है

2. प्रायोगिक पूर्णता

  • बहु-आयामी मूल्यांकन: प्रदर्शन मेट्रिक्स, प्रसंस्करण समय, हार्डवेयर आवश्यकताओं आदि का व्यापक विश्लेषण शामिल है
  • व्यावहारिक अनुप्रयोग: वास्तविक रोगी डेटा और नैदानिक आवश्यकताओं पर आधारित डिजाइन
  • पुनरुत्पादनशीलता: विस्तृत कार्यान्वयन विवरण और ओपन सोर्स कोड परिणामों की पुनरुत्पादनशीलता का समर्थन करता है

3. नैदानिक मूल्य

  • शिक्षा महत्व: चिकित्सक प्रशिक्षण और कौशल वृद्धि में सहायता करता है
  • निदान सहायता: गलत निदान का जोखिम कम करता है, निदान सटीकता में सुधार करता है
  • दक्षता वृद्धि: स्वचालित विश्लेषण चिकित्सक के समय को बचाता है

कमियां

1. विधि सीमाएं

  • एकल वर्ग: केवल एक दृश्य अभिव्यक्ति को संभालता है, वास्तविक अनुप्रयोग में कई प्रकार के घावों की पहचान की आवश्यकता है
  • डेटा निर्भरता: अपेक्षाकृत छोटा डेटासेट विभिन्न अस्पतालों, उपकरणों के बीच मॉडल सामान्यीकरण को प्रभावित कर सकता है
  • थ्रेसहोल्ड संवेदनशीलता: निश्चित आत्मविश्वास थ्रेसहोल्ड सभी परिस्थितियों के लिए उपयुक्त नहीं हो सकता है

2. मूल्यांकन अपर्याप्तता

  • नैदानिक सत्यापन की कमी: वास्तविक नैदानिक पर्यावरण में सत्यापन अध्ययन नहीं किया गया है
  • तुलनात्मक आधार सीमित: अन्य चिकित्सा विभाजन विधियों के साथ विस्तृत तुलना की कमी
  • उपयोगकर्ता अनुसंधान की कमी: वास्तविक चिकित्सकों द्वारा इस उपकरण के उपयोग के प्रभाव और स्वीकृति का मूल्यांकन नहीं किया गया है

3. तकनीकी विवरण

  • वास्तविक समय की कमी: प्रसंस्करण गति सर्जरी के दौरान वास्तविक समय विश्लेषण की आवश्यकता को पूरा करना कठिन है
  • इंटरफेस सरल: वर्तमान संस्करण में पूर्ण उपयोगकर्ता इंटरफेस डिजाइन की कमी है

प्रभाव

1. शैक्षणिक योगदान

  • चिकित्सा वीडियो विश्लेषण क्षेत्र के लिए नई अनुसंधान दिशा प्रदान करता है
  • स्त्री रोग संबंधी रोग निदान में गहन शिक्षा के अनुप्रयोग की संभावना प्रदर्शित करता है
  • पुनः उपयोग योग्य डेटासेट और उपकरण प्रदान करता है

2. व्यावहारिक मूल्य

  • एंडोमेट्रियोसिस के निदान सटीकता में सुधार की संभावना है
  • चिकित्सा शिक्षा और प्रशिक्षण में उपयोग किया जा सकता है
  • अधिक पूर्ण चिकित्सा सहायता निदान प्रणाली विकसित करने के लिए आधार प्रदान करता है

3. पुनरुत्पादनशीलता

  • विस्तृत तकनीकी कार्यान्वयन विवरण प्रदान करता है
  • ओपन सोर्स कोड और पूर्व-प्रशिक्षित मॉडल
  • स्पष्ट स्थापना और उपयोग निर्देश

लागू परिदृश्य

  1. सर्जरी के बाद विश्लेषण: सर्जरी वीडियो का पूर्वव्यापी विश्लेषण, यह सुनिश्चित करने के लिए कि घाव पूरी तरह से पहचाने गए हैं
  2. चिकित्सा शिक्षा: युवा चिकित्सकों को एंडोमेट्रियोसिस घावों की पहचान करने के लिए प्रशिक्षण
  3. अनुसंधान उपकरण: बड़े पैमाने पर नैदानिक अनुसंधान में घाव टिप्पणी और विश्लेषण का समर्थन करता है
  4. गुणवत्ता नियंत्रण: सर्जरी की पूर्णता और निदान सटीकता की पुष्टि करता है

संदर्भ

  1. Canis, M., et al. "Revised american society for reproductive medicine classification of endometriosis: 1996." Fertility and Sterility, 1997.
  2. He, K., et al. "Mask R-CNN." IEEE Trans. Pattern Anal. Mach. Intell., 2020.
  3. Leibetseder, A., et al. "GLENDA: gynecologic laparoscopy endometriosis dataset." MultiMedia Modeling, 2020.

सारांश: यह एक पेपर है जो स्त्री रोग संबंधी चिकित्सा वीडियो विश्लेषण में गहन शिक्षा के अनुप्रयोग को प्रदर्शित करता है। हालांकि वर्तमान संस्करण में कुछ सीमाएं हैं, लेकिन यह चिकित्सा AI सहायता निदान क्षेत्र के लिए मूल्यवान अन्वेषण प्रदान करता है, जिसमें अच्छी विकास संभावनाएं और व्यावहारिक मूल्य है। इस कार्य की ओपन सोर्स प्रकृति संबंधित अनुसंधान के आगे विकास को बढ़ावा देगी।