2025-11-14T03:19:10.909198

Post-surgical Endometriosis Segmentation in Laparoscopic Videos

Leibetseder, Schoeffmann, Keckstein et al.

Endometriosis is a common women's condition exhibiting a manifold visual appearance in various body-internal locations. Having such properties makes its identification very difficult and error-prone, at least for laymen and non-specialized medical practitioners. In an attempt to provide assistance to gynecologic physicians treating endometriosis, this demo paper describes a system that is trained to segment one frequently occurring visual appearance of endometriosis, namely dark endometrial implants. The system is capable of analyzing laparoscopic surgery videos, annotating identified implant regions with multi-colored overlays and displaying a detection summary for improved video browsing.

academic

تقسيم بطانة الرحم المهاجرة بعد الجراحة في مقاطع فيديو المنظار البطني

المعلومات الأساسية

معرّف الورقة: 2510.13899
العنوان: Post-surgical Endometriosis Segmentation in Laparoscopic Videos
المؤلفون: Andreas Leibetseder, Klaus Schoeffmann (جامعة كلاغنفورت)، Jörg Keckstein (جامعة أولم)، Simon Keckstein (جامعة لودفيغ ماكسيميليان ميونخ)
التصنيف: cs.CV cs.LG cs.MM
تاريخ النشر: 14 أكتوبر 2025 (نسخة أولية من arXiv)
رابط الورقة: https://arxiv.org/abs/2510.13899

الملخص

بطانة الرحم المهاجرة هي مرض شائع عند النساء يظهر بمظاهر بصرية متنوعة في مواقع مختلفة من الجسم. تجعل هذه الخاصية تحديدها صعباً جداً وعرضة للأخطاء، خاصة بالنسبة للأطباء غير المتخصصين. لمساعدة أطباء أمراض النساء في علاج بطانة الرحم المهاجرة، تصف هذه الورقة البحثية التوضيحية نظاماً تم تدريبه لتقسيم المظاهر البصرية الشائعة لبطانة الرحم المهاجرة، وهي الغرسات المظلمة. يمكن للنظام تحليل مقاطع فيديو المنظار البطني وتعليق المناطق المكتشفة بطبقات غطاء متعددة الألوان وعرض ملخص الكشف لتحسين تجربة عرض الفيديو.

خلفية البحث والدافع

1. مشكلة البحث

يهدف هذا البحث إلى حل مشكلة التعرف التلقائي وتقسيم آفات بطانة الرحم المهاجرة في جراحة المنظار البطني. بطانة الرحم المهاجرة هي حالة يحدث فيها نمو غير طبيعي لنسيج يشبه بطانة الرحم خارج الرحم، مما يؤثر على النساء في سن الإنجاب.

2. أهمية المشكلة

صعوبة التشخيص: تظهر بطانة الرحم المهاجرة بمظاهر بصرية متنوعة في مواقع مختلفة، مما يزيد من صعوبة التعرف عليها
جودة الرعاية الطبية: التعرف الكامل وتسجيل جميع الآفات أمر حاسم لتحسين أعراض المريض وجودة الحياة
احتياجات التعليم: قد يواجه الأطباء غير ذوي الخبرة خطر التشخيص غير الكامل تحت ضغط الوقت
أنظمة التصنيف: توجد نظامان تصنيف رئيسيان (rASRM و Enzian) يتطلبان تقييماً بصرياً دقيقاً

3. قيود الطرق الموجودة

الاعتماد على التقييم البصري الذاتي للجراح
محدودية الكشف في المناطق الواسعة من الحوض والصفاق
صعوبة التعرف على آفات بطانة الرحم ذات الألوان والمظاهر المختلفة
خطر التشخيص الخاطئ بسبب عدم كفاية التدريب وضغط الوقت

4. دافع البحث

الاستفادة من التطبيقات الناجحة للتعلم العميق في التصوير الطبي لتطوير نظام يمكنه التعرف التلقائي وتقسيم الغرسات المظلمة لبطانة الرحم المهاجرة، لدعم التحليل أثناء الجراحة أو بعدها، وتحسين فعالية التدريب التعليمي.

المساهمات الأساسية

تكييف النموذج: تكييف Mask R-CNN لمهمة التقسيم الثنائي لغرسات بطانة الرحم المهاجرة
نظام التصور: توفير تصور محلي وزمني لغرسات بطانة الرحم المهاجرة في مقاطع فيديو المنظار البطني
أداة مفتوحة المصدر: توفير كود المصدر والنماذج المدربة مسبقاً للاستخدام الأكاديمي
عرض عملي: إظهار جدوى تطبيق أساليب التعلم الآلي التقليدية للكشف عن الأجسام على حالات استخدام طبية فعلية

شرح الطريقة

تعريف المهمة

الإدخال: مقاطع فيديو جراحة المنظار البطني الإخراج: غرسات بطانة الرحم المهاجرة المظلمة مع أقنعة التقسيم ودرجات الثقة القيود: التركيز على التعرف على فئة واحدة من الغرسات المظلمة

معمارية النموذج

1. المعمارية الكلية

يتضمن النظام ثلاث خطوات رئيسية:

إنشاء مجموعة البيانات: استخلاص مجموعة بيانات آفات من فئة واحدة من مجموعة بيانات GLENDA
تدريب النموذج: استخدام Mask R-CNN للتعلم بالنقل
تحليل الفيديو: تطبيق النموذج وتصور النتائج

2. بناء مجموعة البيانات

البيانات الأساسية: مستخرجة من مجموعة بيانات أمراض النساء بالمنظار البطني بطانة الرحم المهاجرة (GLENDA)
الحجم: أكثر من 350 غرسة بطانة رحم مهاجرة مستندة إلى المناطق، تغطي 160 إطار صورة، من أكثر من 100 حالة مريض
تعزيز البيانات: استخدام تقنيات الدوران والتمويه والتحويل المنظوري وإزالة التشبع وتتبع الأهداف

3. تصميم النموذج

الشبكة الأساسية: Mask R-CNN مع ResNet-101 كشبكة العمود الفقري
دالة الخسارة: دالة خسارة متعددة المهام، تشمل:
- خسارة التصنيف (خسارة لوغاريتمية)
- خسارة صندوق الحدود (خسارة L1 سلسة)
- خسارة تقسيم القناع (خسارة الإنتروبيا الثنائية)
معاملات التدريب: 50 حقبة، معدل تعلم 0.001، محسّن الانحدار العشوائي

4. مسار معالجة الفيديو

فيديو الجراحة الخام → تحليل إطار تلو الآخر → استخراج صناديق الحدود والأقنعة والتسميات → توليد إطارات معلقة → إنشاء شريط ملخص الكشف → فيديو معلق

نقاط الابتكار التقني

التكييف الطبي: تكييف ناجح لشبكة الكشف عن الأجسام العامة مع سيناريو طبي محدد
التصور الزمني: توفير مؤشر زمني مبتكر لدرجات ثقة الكشف، مما يسهل تحديد الإطارات الرئيسية
القدرة على المعالجة في الوقت الفعلي: معالجة محسّنة للسرعة، بمتوسط 150-250 ميلي ثانية لكل إطار
الإخراج متعدد الأنماط: توفير تعليقات بصرية وبيانات منظمة بصيغة JSON

إعداد التجربة

مجموعة البيانات

الاسم: مجموعة بيانات مخصصة من فئة واحدة بناءً على GLENDA
الحجم: 350+ تعليق، 160 إطار، 100+ حالة مريض
الخصائص: التركيز على غرسات بطانة الرحم المهاجرة المظلمة
التقسيم: مجموعة التدريب والتحقق والاختبار

مقاييس التقييم

المقياس الرئيسي: متوسط الدقة (mAP) لتقسيم القناع
إعدادات الحد: حد IoU 0.5 ونطاق 0.5-0.95
درجة الثقة: حد ثقة الكشف 0.50

تفاصيل التنفيذ

إدخال الصورة: تغيير الحجم إلى 800 بكسل (الجانب القصير) و 1333 بكسل (الجانب الطويل)
أفضل نموذج: تحقيق أفضل أداء بعد 29 حقبة
استراتيجية التعزيز: كان تعزيز الدوران والقص الأكثر فعالية

نتائج التجربة

النتائج الرئيسية

أفضل أداء:
- mAP@0.50IoU: 0.642 (حد IoU 0.5)
- mAP@0.50:0.95: 0.324 (حد IoU 0.5-0.95)
كفاءة التدريب: حوالي ساعتين لإكمال تدريب النموذج
سرعة المعالجة: مقارنة أوقات المعالجة بدقة الدقة المختلفة

الدقة	متوسط وقت المعالجة (ميلي ثانية)
640×360	153
1280×720	158
1920×1080	170
3840×2160	207

تحليل الأداء

تقدير المعالجة: فيديو مدته ساعة واحدة بدقة HD (25fps) يتطلب حوالي 4 ساعات و 15 دقيقة للمعالجة
متطلبات الأجهزة: Intel Core i7-5820K، 32 جيجابايت RAM، GTX 1080
التوافق متعدد المنصات: يدعم Linux و Windows، من المتوقع دعم MacOS

تحليل الحالات

توفر الورقة أربع أمثلة معلقة لغرسات بطانة الرحم المهاجرة المظلمة، مما يوضح قدرة النظام على التعرف على المناطق المرضية التي تختلف بشكل واضح عن الأنسجة المحيطة ولكنها تشبه البقع الدموية أو الأوعية الدموية المظلمة.

الأعمال ذات الصلة

1. تقسيم الصور الطبية

يوفر التطبيق الواسع للتعلم العميق في التصوير الطبي أساساً تقنياً لهذا البحث.

2. شبكات الكشف عن الأجسام

Faster R-CNN: توفير أساس شبكة اقتراح المنطقة
Mask R-CNN: معمارية شبكة التقسيم الأساسية
ResNet: كشبكة استخراج الميزات العمود الفقري

3. تصنيف بطانة الرحم المهاجرة

تصنيف rASRM: ينطبق على تسجيل آفات الصفاق
تصنيف Enzian: يغطي بطانة الرحم المهاجرة العميقة

الخلاصة والمناقشة

الاستنتاجات الرئيسية

إظهار ناجح لجدوى Mask R-CNN في مهمة تقسيم بطانة الرحم المهاجرة
تطوير سلسلة أدوات تحليل فيديو كاملة تدعم تحليل أرشيف الفيديو بعد الجراحة
توفير واجهة تصور تساعد في التخطيط العلاجي والتعليم السريري

القيود

نوع واحد فقط: يركز فقط على غرسات بطانة الرحم المهاجرة المظلمة، ولا يغطي المظاهر البصرية الأخرى
حجم البيانات: قد تحد مجموعة البيانات الصغيرة نسبياً من قدرة النموذج على التعميم
طبيعة توضيحية: النسخة الحالية بمثابة إثبات مفهوم، تفتقر إلى واجهة مستخدم كاملة
سرعة المعالجة: لا تزال القدرة على المعالجة في الوقت الفعلي بحاجة إلى تحسين

الاتجاهات المستقبلية

التوسع إلى الكشف عن آفات بطانة الرحم المهاجرة متعددة الفئات
بناء نظام تصفح فيديو تفاعلي بعد الجراحة
تحسين واجهة المستخدم وتجربة المستخدم
زيادة مجموعة بيانات معلقة بحجم أكبر

التقييم المتعمق

المميزات

1. الابتكار التقني

التكييف الميداني: تكييف ناجح للتكنولوجيا البصرية الحاسوبية العامة مع السيناريو الطبي المتخصص
أداة عملية: توفير حل شامل من طرف إلى طرف، من تدريب النموذج إلى تحليل الفيديو
مساهمة مفتوحة المصدر: توفير كود المصدر والنماذج المدربة مسبقاً، مما يعزز البحث الأكاديمي

2. كفاية التجربة

تقييم متعدد الأبعاد: يتضمن مقاييس الأداء وأوقات المعالجة ومتطلبات الأجهزة وتحليل شامل
التطبيق الفعلي: مصمم بناءً على بيانات المريض الفعلية والاحتياجات السريرية
إمكانية التكرار: تفاصيل التنفيذ المفصلة وكود مفتوح المصدر يدعم تكرار النتائج

3. القيمة السريرية

الأهمية التعليمية: تساعد في تدريب الأطباء وتحسين المهارات
المساعدة التشخيصية: تقليل خطر الإغفال وتحسين دقة التشخيص
تحسين الكفاءة: توفير الوقت للطبيب من خلال التحليل الآلي

أوجه القصور

1. قيود الطريقة

فئة واحدة فقط: معالجة نوع بصري واحد فقط، يتطلب التطبيق الفعلي التعرف على أنواع آفات متعددة
الاعتماد على البيانات: قد تؤثر مجموعة البيانات الصغيرة نسبياً على قدرة النموذج على التعميم عبر المستشفيات والأجهزة المختلفة
حساسية الحد: قد لا ينطبق حد الثقة الثابت على جميع الحالات

2. التقييم غير الكافي

نقص التحقق السريري: لم يتم إجراء دراسات التحقق في بيئة سريرية فعلية
خطوط أساس المقارنة محدودة: نقص المقارنة التفصيلية مع طرق التقسيم الطبية الأخرى
غياب دراسة المستخدم: لم يتم تقييم فعالية واستقبال الأطباء الفعليين لهذه الأداة

3. التفاصيل التقنية

عدم كفاية الوقت الفعلي: يصعب تلبية احتياجات تحليل الوقت الفعلي أثناء الجراحة
واجهة بسيطة: النسخة الحالية تفتقر إلى تصميم واجهة مستخدم متطور

التأثير

1. المساهمة الأكاديمية

توفير اتجاه بحثي جديد لمجال تحليل الفيديو الطبي
إظهار إمكانيات التعلم العميق في تشخيص أمراض النساء
توفير مجموعة بيانات وأدوات قابلة لإعادة الاستخدام

2. القيمة العملية

احتمال تحسين دقة تشخيص بطانة الرحم المهاجرة
يمكن استخدامه في التعليم الطبي والتدريب
وضع الأساس لتطوير أنظمة مساعدة تشخيصية طبية أكثر اكتمالاً

3. إمكانية التكرار

توفير تفاصيل تنفيذ تقنية مفصلة
كود مفتوح المصدر والنماذج المدربة مسبقاً
تعليمات تثبيت واستخدام واضحة

السيناريوهات المطبقة

التحليل بعد الجراحة: تحليل رجعي لمقاطع الفيديو الجراحية، مما يضمن التعرف الكامل على الآفات
التعليم الطبي: تدريب الأطباء الشباب على التعرف على آفات بطانة الرحم المهاجرة
أداة البحث: دعم تعليق وتحليل الآفات في الدراسات السريرية واسعة النطاق
مراقبة الجودة: التحقق من اكتمال الجراحة ودقة التشخيص

المراجع

Canis, M., et al. "Revised american society for reproductive medicine classification of endometriosis: 1996." Fertility and Sterility, 1997.
He, K., et al. "Mask R-CNN." IEEE Trans. Pattern Anal. Mach. Intell., 2020.
Leibetseder, A., et al. "GLENDA: gynecologic laparoscopy endometriosis dataset." MultiMedia Modeling, 2020.

الملخص: هذه ورقة بحثية توضيحية تعرض تطبيق التعلم العميق في تحليل الفيديو الطبي لأمراض النساء. على الرغم من وجود بعض القيود في النسخة الحالية، فإنها توفر استكشافاً قيماً لمجال تشخيص الذكاء الاصطناعي الطبي المساعد، مع آفاق تطوير جيدة وقيمة عملية. ستعزز الطبيعة مفتوحة المصدر لهذا العمل المزيد من التطوير في البحث ذي الصلة.