PET/CT imaging is the gold standard for tumor detection, offering high accuracy in identifying local and metastatic lesions. Radiologists often begin assessment with rotational Multi-Angle Maximum Intensity Projections (MIPs) from PET, confirming findings with volumetric slices. This workflow is time-consuming, especially in metastatic cases. Despite their clinical utility, MIPs are underutilized in automated tumor segmentation, where 3D volumetric data remains the norm. We propose an alternative approach that trains segmentation models directly on MIPs, bypassing the need to segment 3D volumes and then project. This better aligns the model with its target domain and yields substantial gains in computational efficiency and training time. We also introduce a novel occlusion correction method that restores MIP annotations occluded by high-intensity structures, improving segmentation. Using the autoPET 2022 Grand Challenge dataset, we evaluate our method against standard 3D pipelines in terms of performance and training/computation efficiency for segmentation and classification, and analyze how MIP count affects segmentation. Our MIP-based approach achieves segmentation performance on par with 3D (<=1% Dice difference, 26.7% better Hausdorff Distance), while reducing training time (convergence time) by 55.8-75.8%, energy per epoch by 71.7-76%, and TFLOPs by two orders of magnitude, highlighting its scalability for clinical use. For classification, using 16 MIPs only as input, we surpass 3D performance while reducing training time by over 10x and energy consumption per epoch by 93.35%. Our analysis of the impact of MIP count on segmentation identified 48 views as optimal, offering the best trade-off between performance and efficiency.
academic- معرّف الورقة: 2510.09326
- العنوان: تقسيم الأورام القائم على MIP: منهج مستوحى من الأشعة
- المؤلفون: Romario Zarik, Nahum Kiryati, Michael Green, Liran Domachevsky, Arnaldo Mayer
- التصنيف: eess.IV (الهندسة الكهربائية وعلوم الأنظمة - معالجة الصور والفيديو)
- تاريخ النشر: 10 أكتوبر 2025
- رابط الورقة: https://arxiv.org/abs/2510.09326v1
تقترح هذه الورقة طريقة لتقسيم الأورام بناءً على إسقاطات الكثافة القصوى متعددة الزوايا (Multi-Angle Maximum Intensity Projections, MIPs)، حيث يتم تدريب نموذج التقسيم مباشرة على MIPs بدلاً من الطريقة التقليدية المتمثلة في تقسيم الحجم ثلاثي الأبعاد ثم الإسقاط. استخدمت الدراسة مجموعة بيانات autoPET 2022، وحققت أداءً مماثلاً للطرق ثلاثية الأبعاد (فرق Dice ≤1%، تحسن مسافة Hausdorff بنسبة 26.7%)، مع تحسين كبير في الكفاءة الحسابية: تقليل وقت التدريب بنسبة 55.8-75.8%، تقليل استهلاك الطاقة لكل دورة بنسبة 71.7-76%، وتقليل الحمل الحسابي بمقدار رتبتين. بالنسبة لمهام التصنيف، فإن استخدام 16 MIP فقط يتفوق على أداء الطريقة ثلاثية الأبعاد، مع تقليل وقت التدريب بأكثر من 10 مرات.
تصوير PET/CT هو المعيار الذهبي لكشف الأورام. في الممارسة السريرية، يقوم أطباء الأشعة عادة بفحص إسقاطات الكثافة القصوى المدارة متعددة الزوايا (MIPs) أولاً لتقييم الحالة، ثم يؤكدون النتائج من خلال فحص الشرائح الحجمية. هذا سير العمل يستغرق وقتاً طويلاً بشكل خاص في الحالات المنتشرة.
- عدم التطابق بين الممارسة السريرية والخوارزميات: على الرغم من الاستخدام الواسع لـ MIPs في العيادة، فإن تقسيم الأورام الآلي يعتمد بشكل أساسي على بيانات الحجم ثلاثي الأبعاد
- متطلبات الكفاءة الحسابية: طرق التقسيم ثلاثية الأبعاد التقليدية تتمتع بتعقيد حسابي عالي وأوقات تدريب طويلة، مما يعيق النشر السريري
- القيود على الموارد: يصعب معالجة بيانات ثلاثية الأبعاد واسعة النطاق على الأجهزة القياسية
- توافق المجال: التدريب المباشر على MIPs يتوافق بشكل أفضل مع طريقة تفكير أطباء الأشعة التشخيصية
- سير العمل التقليدي للتقسيم ثلاثي الأبعاد ثم الإسقاط إلى MIPs يتطلب تكاليف حسابية كبيرة
- تطبيقات MIP الموجودة تقتصر بشكل أساسي على الكشف والتصنيف، مع تطبيقات تقسيم محدودة
- نقص الحلول الفعالة للتعامل مع مشكلة الحجب في MIP
- عدم الاستفادة الكاملة من مزايا الكفاءة الحسابية لـ MIP
- طريقة التقسيم المباشر على MIP: اقتراح طريقة لتدريب نموذج التقسيم مباشرة على MIPs، مما يتجنب سير العمل المعقد للتقسيم ثلاثي الأبعاد ثم الإسقاط
- تقنية تصحيح الحجب: إدخال طريقة جديدة لتصحيح حجب التعليقات في MIP، لحل مشكلة حجب الهياكل عالية الكثافة
- تحسين الكفاءة بشكل كبير: تحقيق تقليل كبير في وقت التدريب واستهلاك الطاقة والحمل الحسابي مع الحفاظ على أداء مماثلة
- تحليل عدد MIP الأمثل: تحليل منهجي لتأثير عدد MIP على أداء التقسيم، وتحديد 48 زاوية كإعداد أمثل
الإدخال: بيانات مسح PET ثلاثية الأبعاد
الإخراج: نتيجة تقسيم الورم
الهدف: إجراء التقسيم الدلالي مباشرة على MIPs متعددة الزوايا، مع تجنب معالجة الحجم ثلاثي الأبعاد
يتم توليد صور MIP باستخدام الصيغة التالية:
Fk(i,j)=maxdfk(i,j,d)
حيث:
- Fk(i,j): قيمة صورة MIP رقم k عند البكسل (i,j)
- fk(i,j,d): بيانات ثلاثية الأبعاد بعد الدوران بزاوية kΔΘ حول المحور العمودي
- خطوة الزاوية: ΔΘ(N)=N180°، حيث N هو عدد MIPs
لمعالجة مشكلة حجب الأعضاء عالية الكثافة (مثل الدماغ والقلب والكليتين) للتعليقات على الأورام، تم تصميم عملية معالجة من ثلاث خطوات:
- كشف الحجب: التحقق من أن 75% على الأقل من بكسلات كل ورم معلم تأتي فعلاً من بيانات PET الحجمية للورم
- تقسيم التعليقات: بالنسبة للعلامات التي تحتوي على أقل من 75% من بكسلات الورم، يتم الاحتفاظ فقط بالبكسلات المؤكدة من الورم
- تصفية التباين المنخفض: إزالة بقايا الأورام ذات التباين المنخفض جداً والتي لا يمكن اكتشافها بالعين المجردة
- نموذج التقسيم: Attention U-Net، الذي أظهر أفضل أداء بين معماريات CNN المختلفة
- الخط الأساسي ثلاثي الأبعاد: معمارية Swin-UNETR، بناءً على الحل الذي احتل المركز الخامس في تحدي autoPET 2022
- نموذج التصنيف: مشفر CNN + تجميع الانتباه + رأس متصل بالكامل
- تصميم توافق المجال: التدريب المباشر على عروض MIP التي يستخدمها أطباء الأشعة بشكل شائع، مما يحسن الصلة السريرية
- تحسين الكفاءة الحسابية: 16 MIP يمثل فقط حوالي 4% من المعلومات الحجمية، مما يقلل بشكل كبير متطلبات الذاكرة والحساب
- حل مشكلة الحجب: أول حل منهجي لمشكلة الحجب في تعليقات MIP
- تحسين من النهاية إلى النهاية: تجنب عملية التقسيم ثلاثي الأبعاد ثم الإسقاط على مرحلتين
- مصدر البيانات: مجموعة بيانات autoPET 2022 مفتوحة المصدر
- الحجم: 1,014 مسح PET/CT من 900 مريض
- أنواع الأمراض: سرطان الرئة، الليمفوما، الورم الميلانيني، الشواهد الصحية
- توزيع البيانات: صحي (513)، ليمفوما (145)، ورم ميلانيني (188)، سرطان رئة (168)
- مجموعة اختبار مستقلة: 15%
- التحقق المتقاطع 5 أضعاف: 85%
- الحفاظ على توزيع متسق لكل فئة
مهام التقسيم:
- درجة Dice: مقياس التداخل
- IoU: نسبة التقاطع والاتحاد
- مسافة Hausdorff: دقة الحدود
مهام التصنيف:
- الدقة والدقة والاستدعاء ودرجة F1
مؤشرات الكفاءة:
- وقت التقارب (CT): الوقت المستغرق للوصول إلى أداء التحقق من الصحة الذروة
- وقت التدريب لكل دورة (TPE) واستهلاك الطاقة (EPE)
- التعقيد الحسابي (TFLOPs)
- إسقاط Swin-UNETR ثلاثي الأبعاد على MIP
- نموذج تصنيف ثلاثي الأبعاد بنفس معمارية CNN
| الطريقة | درجة Dice | IoU | مسافة Hausdorff |
|---|
| الإسقاط ثلاثي الأبعاد | 0.597±0.05 | 0.471±0.04 | 139.614±8.42 |
| OR-MIPs | 0.578±0.01 | 0.452±0.01 | 102.813±9.61 |
| OC-MIPs | 0.591±0.01 | 0.466±0.01 | 102.26±9.53 |
| المؤشر | الطريقة ثلاثية الأبعاد | OC-MIPs | مضاعف التحسن |
|---|
| وقت التدريب (ساعة) | 54.64±19.22 | 13.18±4.1 | 4.1× |
| استهلاك الطاقة لكل دورة (Wh) | 142.2±79.1 | 34.194±4.7 | 4.2× |
| TFLOPs | 317.42±144.05 | 0.97±0.29 | 327× |
| المؤشر | بيانات ثلاثية الأبعاد | 16 MIPs | التحسن |
|---|
| الدقة (%) | 72.8±3.2 | 80.5±1.7 | +7.7% |
| درجة F1 (%) | 82.3±1.2 | 86.4±0.8 | +4.1% |
| وقت التدريب | 44.7±1.5 ساعة | 4.2±0.2 ساعة | 10.6× |
من خلال التحليل المنهجي لتأثير 16 و32 و48 و64 و80 MIP:
- الإعداد الأمثل: 48 MIP توفر أعلى درجة Dice وأكثرها استقراراً
- الأهمية الإحصائية: يظهر التدريب على 16 و32 MIP فروقات ذات دلالة إحصائية
- توازن الكفاءة: 48 MIP تحقق أفضل توازن بين الأداء والكفاءة الحسابية
- تكافؤ الأداء: يظهر اختبار Wilcoxon للرتب الموقعة عدم وجود فرق ذي دلالة إحصائية بين طريقة MIP والطريقة ثلاثية الأبعاد (p=0.22)
- دقة الحدود: تظهر طريقة MIP أداءً أفضل في مسافة Hausdorff، مع تحسن بنسبة 26.7%
- تأثير تصحيح الحجب: تم استبعاد 0.57% فقط من الأورام بالكامل، مما يحافظ على اكتمال التعليقات
- قابلية التوسع: تقليل الحمل الحسابي بمقدار رتبتين، مما يحسن بشكل كبير جدوى التطبيق السريري
- مهام الكشف: استخدم Kawakami وآخرون YOLOv2 للكشف عن الامتصاص الفسيولوجي على MIPs متعددة الاتجاهات
- تطبيقات التصنيف: استخدم Takahashi وآخرون نموذج Xception لتحسين تصنيف سرطان الثدي
- استخراج الميزات: استخرج Toosi وآخرون الميزات من 72 MIP للتنبؤ بالبقاء
- تحسين التقسيم ثلاثي الأبعاد: أثبت Constantino وآخرون أن MIP يمكن أن يحسن تقسيم PET/CT ثلاثي الأبعاد
- إعادة البناء الحجمي: أعاد Toosi وآخرون بناء التقسيم الحجمي من MIP ثنائي الأبعاد
- طرق 2.75D: دمج Wang وآخرون عروض متعددة ثنائية الأبعاد لتثري التعلم ثلاثي الأبعاد
- أول طريقة تقسيم MIP مباشر منهجي
- تقنية ابتكارية لحل مشكلة حجب MIP
- تقييم شامل للكفاءة والأداء
- تصميم يتوافق مع سير العمل السريري
- تكافؤ الأداء: يحقق التقسيم المباشر على MIP أداءً مماثلاً للطرق ثلاثية الأبعاد مع تحسين كبير في الكفاءة الحسابية
- الإعداد الأمثل: 48 زاوية MIP هي أفضل نقطة توازن بين الأداء والكفاءة
- الملاءمة السريرية: الانخفاض الكبير في متطلبات الحساب يجعل الطريقة أكثر ملاءمة للبيئات السريرية ذات الموارد المحدودة
- عمومية الطريقة: تظهر الطريقة مزايا على مهام التقسيم والتصنيف
- مجموعة بيانات واحدة: تم التحقق من الطريقة فقط على مجموعة بيانات autoPET 2022، مما يتطلب التحقق على نطاق أوسع
- متخصص في PET: الطريقة الحالية موجهة بشكل أساسي لبيانات PET، مع استكشاف محدود لتكامل CT
- فقدان المعلومات ثلاثية الأبعاد: عملية الإسقاط تفقد حتماً بعض المعلومات المكانية ثلاثية الأبعاد
- معالجة الحجب: على الرغم من التحسن، قد تؤثر حالات الحجب المعقدة على الأداء
- التكامل متعدد الأنماط: دمج معلومات CT في MIP لتحقيق تحليل PET/CT مشترك
- إعادة البناء ثلاثي الأبعاد: استكشاف طرق لإعادة بناء التعليقات ثلاثية الأبعاد من نتائج تقسيم MIP
- التحقق الموسع: التحقق من فعالية الطريقة على مجموعات بيانات أكثر وأنواع أمراض مختلفة
- التطبيقات في الوقت الفعلي: تطوير نظام تقسيم MIP في الوقت الفعلي لدعم اتخاذ القرارات السريرية
- ابتكار قوي: أول طريقة منهجية لتقسيم MIP المباشر، متوافقة بشكل عالي مع الممارسة السريرية
- قيمة عملية عالية: التحسن الكبير في الكفاءة يجعل الطريقة ذات إمكانية تطبيق سريري قوية
- حل تقني شامل: من تصحيح الحجب إلى تحليل المعاملات المثلى، الحل التقني كامل
- تقييم شامل: تم إجراء تقييم شامل على مهام التقسيم والتصنيف
- قابلية إعادة الإنتاج الجيدة: الأكواد والأدوات متاحة للجمهور
- نقص التحليل النظري: نقص التحليل النظري العميق لسبب تحقيق طريقة MIP أداءً مماثلاً
- قيود مجموعة البيانات: قد تحد مجموعة البيانات الواحدة من عمومية الاستنتاجات
- غياب التحقق السريري: لم يتم إجراء دراسات التحقق في بيئة سريرية فعلية
- طرق المقارنة محدودة: المقارنة الأساسية مع الطرق الأساسية ثلاثية الأبعاد، مع نقص المقارنة مع أحدث طرق SOTA
- المساهمة الأكاديمية: توفير نموذج جديد عالي الكفاءة لتقسيم الصور الطبية
- القيمة السريرية: من المتوقع أن تحسن بشكل كبير كفاءة التحليل الآلي لمسح PET
- نشر التكنولوجيا: يمكن توسيع الطريقة إلى مهام تحليل الإسقاط الأخرى في الصور الطبية
- تحسين الموارد: توفير حل قابل للتطبيق للبيئات ذات الموارد المحدودة
- الفحص السريري: التحليل الأولي السريع في الفحص الشامل للأورام
- البيئات ذات الموارد المحدودة: المؤسسات الطبية ذات الموارد الحسابية المحدودة
- التطبيقات في الوقت الفعلي: أنظمة دعم القرار السريري التي تتطلب استجابة سريعة
- الطب المحمول: تحليل الصور الطبية على الأجهزة المحمولة
تستشهد هذه الورقة بـ 34 مرجعاً ذا صلة، تشمل بشكل أساسي:
- أطر معالجة الصور الطبية (MONAI, PyTorch)
- أساسيات تقنية تصوير PET/CT
- طرق التقسيم والتصنيف بالتعلم العميق
- تطبيقات MIP في الصور الطبية
- مقاييس التقييم ومجموعات البيانات ذات الصلة
التقييم الشامل: هذه ورقة عالية الجودة في معالجة الصور الطبية، تقترح طريقة تقسيم MIP مباشر مبتكرة وعملية. تؤكد الورقة على الصرامة الأكاديمية والتطبيق السريري في نفس الوقت، وتوفر حلاً جديداً عالي الكفاءة لتطبيقات الذكاء الاصطناعي في الصور الطبية. على الرغم من وجود بعض القيود، فإن تحسن الكفاءة الكبير والأداء الجيدة يجعلها ذات قيمة أكاديمية وتطبيقية مهمة.