Reconstruction-based methods, particularly those leveraging autoencoders, have been widely adopted for anomaly detection task in brain MRI. Unlike most existing works try to improve the task accuracy through architectural or algorithmic innovations, we tackle this task from image quality assessment (IQA) perspective, an under-explored direction in the field. Due to the limitations of conventional metrics such as l1 in capturing the nuanced differences in reconstructed images for medical anomaly detection, we propose fusion quality, a novel metric that wisely integrates the structure-level sensitivity of Structural Similarity Index Measure (SSIM) with the pixel-level precision of l1. The metric offers a more comprehensive assessment of reconstruction quality, considering intensity (subtractive property of l1 and divisive property of SSIM), contrast, and structural similarity. Furthermore, the proposed metric makes subtle regional variations more impactful in the final assessment. Thus, considering the inherent divisive properties of SSIM, we design an average intensity ratio (AIR)-based data transformation that amplifies the divisive discrepancies between normal and abnormal regions, thereby enhancing anomaly detection. By fusing the aforementioned two components, we devise the IQA approach. Experimental results on two distinct brain MRI datasets show that our IQA approach significantly enhances medical anomaly detection performance when integrated with state-of-the-art baselines.
- معرّف الورقة: 2408.08228
- العنوان: Rethinking Medical Anomaly Detection in Brain MRI: An Image Quality Assessment Perspective
- المؤلفون: Zixuan Pan, Jun Xia, Zheyu Yan, Guoyue Xu, Yifan Qin, Xueyang Li, Yawen Wu, Zhenge Jia, Jianxu Chen, Yiyu Shi
- التصنيف: eess.IV cs.CV
- تاريخ النشر: أغسطس 2024 (نسخة أولية من arXiv)
- رابط الورقة: https://arxiv.org/abs/2408.08228
تعيد هذه الورقة النظر في مهمة كشف الشذوذ في تصوير الدماغ بالرنين المغناطيسي من منظور تقييم جودة الصورة (IQA). ردًا على القيود المتعلقة بخسارة ℓ1 التقليدية في التقاط الفروقات الدقيقة في الصور المعاد بناؤها، تقترح الورقة مقياس جودة الدمج (fusion quality)، الذي يجمع بذكاء بين الحساسية على مستوى البنية في مؤشر التشابه الهيكلي (SSIM) والدقة على مستوى البكسل في ℓ1. يوفر هذا المقياس تقييمًا أكثر شمولاً لجودة إعادة البناء عبر ثلاثة أبعاد: الشدة والتباين والتشابه الهيكلي. علاوة على ذلك، مع الأخذ في الاعتبار الخصائص القسمية المتأصلة في SSIM، تم تصميم تحويل بيانات قائم على متوسط نسبة الشدة (AIR) لتضخيم الفروقات بين المناطق الطبيعية والشاذة. تُظهر النتائج التجريبية أن طريقة IQA هذه تحسّن بشكل كبير أداء كشف الشذوذ الطبي.
كشف الشذوذ في تصوير الدماغ بالرنين المغناطيسي (مثل تحديد الأورام) هو مهمة مهمة في تحليل الصور الطبية. تتطلب طرق التعلم الخاضع للإشراف التقليدية كمية كبيرة من البيانات المُسمّاة، بينما يعتبر الحصول على تسميات دقيقة للصور الطبية (مثل أقنعة تقسيم الأورام) أمرًا صعبًا ومكلفًا.
- ندرة البيانات المُسمّاة: تتطلب تسمية الصور الطبية معرفة متخصصة وتكون مكلفة وتستغرق وقتًا طويلاً
- قيود الطرق الموجودة: تركز طرق كشف الشذوذ القائمة على إعادة البناء بشكل أساسي على الابتكارات المعمارية والخوارزمية، متجاهلة أهمية مقاييس تقييم جودة إعادة البناء
- عدم كفاية مقاييس التقييم: تفترض خسارة ℓ1 التقليدية استقلالية البكسل، متجاهلة العلاقات المكانية، مما يجعل من الصعب التقاط الشذوذ الدقيق
كما هو موضح في الشكل 1، حتى عند استخدام نفس نتيجة إعادة البناء، يمكن لحساب خريطة الشذوذ باستخدام SSIM أن يحدد منطقة الورم بشكل أفضل من استخدام خسارة ℓ1، مما ألهم ضرورة إعادة التفكير في كشف الشذوذ من منظور IQA.
- اقتراح منظور IQA للمرة الأولى: إدراج تقييم جودة الصورة في كشف الشذوذ الطبي، واقتراح خسارة جودة الدمج (fusion quality loss)
- مقياس تقييم جديد: الجمع بين مزايا SSIM وخسارة ℓ1 لتوفير تقييم أكثر شمولاً لجودة إعادة البناء
- استراتيجية تحسين البيانات: تصميم تحويل قائم على AIR لتضخيم الفروقات بين المناطق الطبيعية والشاذة
- تحسن كبير في الأداء: تحسن DICE بنسبة 15.86% على BraTS21 T2 وبنسبة 21.41% على MSLUB T2
- قابلية تعميم جيدة: يمكن تطبيق الطريقة على طرائق مختلفة وأنماط أساسية مختلفة
بالنظر إلى مجموعة بيانات عادية Xn={xin∈Xn}i=1N، قم بتدريب نموذج إعادة البناء fθ(⋅):
minθN1∑i=1NLtrain(xin,x^in),x^in=fθ(xin′)
أثناء الاختبار، يتم تعريف خريطة درجة الشذوذ على النحو التالي:
Λj=Ltest(xja,x^ja),x^ja=fθ∗(xja′)
يقيّم SSIM ثلاثة أبعاد: الإضاءة والتباين والبنية:
l(x,y)=μx2+μy2+C12μxμy+C1,c(x,y)=σx2+σy2+C22σxσy+C2s(x,y)=σxσy+C3σxy+C3
SSIM(x,y)=l(x,y)⋅c(x,y)⋅s(x,y)
خسارة SSIM المحلية:
LSSIM(x,x^)=21−K1∑k=1KSSIM(xk,x^k)
الجمع بين مزايا خسارة SSIM وخسارة ℓ1:
LFQ=αLSSIM+(1−α)Lℓ1,α∈[0,1]
حيث α = 0.84، تم اختيار هذه المعاملة بناءً على توصيات الأبحاث السابقة 21.
AIR(X)=(μXa+μXn)−∣μXa−μXn∣(μXa+μXn)+∣μXa−μXn∣
حيث μXa و μXn هما متوسط شدة البكسل في المناطق الشاذة والعادية على التوالي.
بناءً على التحليل الإحصائي لأربع طرائق في مجموعة بيانات BraTS:
- 0<μXn<μXa<1 ينطبق على جميع الطرائق
- في T1 و FLAIR و T1-CE: μXn>0.5
- في T2: μXa<0.5
دالة التحويل المصممة:
p(x)=x⋅I(μXn≤0.5)+(1−x)⋅I(0.5<μXn)
يضمن هذا التحويل أن AIR(Xˉ)≥AIR(X).
- تقييم جودة متعدد الأبعاد: دمج المعلومات على مستوى البكسل (ℓ1) والمستوى الهيكلي (SSIM)
- آلية الأوزان التكيفية: تجعل الخصائص القسمية في SSIM العلاقات الهيكلية أكثر أهمية
- المعالجة المسبقة المدفوعة بالبيانات: تصميم استراتيجية التحويل بناءً على الخصائص الإحصائية لمجموعة البيانات
- التحسين من طرف إلى طرف: استخدام خسارة جودة الدمج الموحدة في مراحل التدريب والاستدلال
- BraTS21: 1251 مسح دماغي لورم بـ أربع طرائق (T1 و T1-CE و T2 و FLAIR)
- MSLUB: 30 مريضًا بالتصلب المتعدد مع مسوحات T1 و T2 و FLAIR
- IXI: 560 مسح دماغي صحي مع أزواج مسوحات T1-T2
- الإعداد عبر مجموعات البيانات: التدريب على بيانات IXI الصحية، الاختبار على BraTS21 و MSLUB
- الإعداد داخل مجموعة البيانات: التحقق المتقاطع بخمس طيات على FLAIR و T1-CE من BraTS21
- المعالجة المسبقة: إعادة العينات وتقشير الجمجمة والمحاذاة
- معامل DICE: قياس دقة التقسيم
- AUPRC: المساحة تحت منحنى الدقة والاستدعاء
9 طرق أساسية: Thresh و AE و VAE و SVAE و DAE و f-AnoGAN و DDPM و mDDPM و pDDPM
- المُحسِّن: Adam، معدل التعلم 1e-4، حجم الدفعة 32
- عدد الحقب: 1600
- مستويات الضوضاء: 500 لـ BraTS21 (T2)، 750 للآخرين
- المعالجة اللاحقة: تصفية وسيطة (حجم النواة 5) + تآكل قناع الدماغ (3 تكرارات)
نتائج طريقة T2 في الإعداد عبر مجموعات البيانات:
| الطريقة | BraTS21 (T2) | | MSLUB (T2) | |
|---|
| DICE % | AUPRC % | DICE % | AUPRC % |
| pDDPM | 49.41±0.66 | 54.76±0.83 | 10.65±1.05 | 10.37±0.51 |
| pDDPM-IQA | 59.45±0.37 | 62.99±0.37 | 12.93±0.67 | 11.51±0.50 |
| التحسن النسبي | +20.32% | +15.03% | +21.41% | +10.99% |
على طرائق متعددة مثل BraTS T1 و MSLUB T1 و BraTS FLAIR و T1-CE، حققت pDDPM-IQA تحسنًا كبيرًا (p < 0.05).
- LFQ فقط: تحسن كبير مقارنة بخط الأساس
- LFQ + AIR: تحسن إضافي في الأداء
- التآزر الأمثل بين المكونين
تطبيق طريقة IQA على خط أساس DDPM (DDPM-IQA) يحقق تحسنًا متسقًا في جميع مجموعات البيانات والطرائق المختبرة.
يُظهر تحليل حساسية معامل α أن الطريقة تحافظ على أداء قوية حتى مع استخدام α = 0.84 دون الأمثل.
يُظهر الشكل 3 النتائج النوعية، حيث تحدد خريطة الشذوذ التي تولدها pDDPM-IQA منطقة الورم بدقة أكبر من الطرق الأخرى، مع حدود أوضح وعدد أقل من الإيجابيات الخاطئة.
- طرق المشفر التلقائي: تعاني AE و VAE من مشكلة ضبابية إعادة البناء
- استراتيجيات التحسين: VAE المُكمّم بالمتجهات والمشفر التلقائي المعاكس والمشفر التلقائي المزيل للضوضاء
- طرق GAN: AnoGAN و f-AnoGAN، لكن تعاني من مشاكل الاستقرار
- نماذج الانتشار: anoDDPM و pDDPM و mDDPM والتطورات الحديثة الأخرى
- استخدام SSIM بدلاً من خسارة ℓ2 في كشف العيوب الصناعية
- خسارة SSIM في الفضاء الكامن
- طرق SSIM المدمجة
أول دمج لـ SSIM وخسارة ℓ1 في كشف الشذوذ الطبي للعملية الكاملة من التدريب إلى الاستدلال.
- فعالية منظور IQA: يمكن لمنظور تقييم جودة الصورة تحسين أداء كشف الشذوذ بشكل كبير
- تفوق الاستراتيجية المدمجة: خسارة جودة الدمج التي تجمع بين SSIM و ℓ1 تتفوق على المقاييس الفردية
- أهمية تحويل البيانات: يعمل تحويل AIR على تضخيم الفروقات بين المناطق الطبيعية والشاذة بفعالية
- قابلية التطبيق الواسعة: الطريقة فعالة عبر طرائق وخطوط أساسية متعددة
- تثبيت المعاملات: لم يتم تحسين α = 0.84 لإعدادات مختلفة
- خصوصية التحويل: تم تصميم تحويل AIR بناءً على إحصائيات مجموعة بيانات محددة
- نقص تحليل التعقيد الحسابي: لم يتم الإبلاغ عن تكاليف الوقت الحسابي الإضافية
- نقص التحليل النظري: عدم وجود تحليل نظري لتقارب خسارة جودة الدمج
- استكشاف مقاييس جديدة: البحث عن مقاييس شذوذ أفضل من خسارة جودة الدمج الحالية
- أوزان تكيفية: تصميم آليات لتعديل α ديناميكيًا
- التحليل النظري: توفير ضمانات نظرية لخسارة الدمج
- التطبيقات الموسعة: تعميم الطريقة على مهام التصوير الطبي الأخرى
- منظور مبتكر: أول دراسة منهجية لكشف الشذوذ الطبي من منظور IQA
- طريقة بسيطة وفعالة: تصميم خسارة جودة الدمج معقول والتنفيذ بسيط
- تجارب شاملة: التحقق الكامل عبر مجموعات بيانات متعددة وطرائق متعددة وخطوط أساسية متعددة
- تحسن أداء كبير: التحسن النسبي يتجاوز 15-20% بقيمة عملية
- قابلية تعميم جيدة: يمكن تطبيقها على معماريات وطرائق مختلفة
- أساس نظري ضعيف: نقص التحليل النظري العميق لسبب فعالية مزيج SSIM + ℓ1
- اختيار المعاملات ذاتي: اختيار α = 0.84 يفتقر إلى التحقق الكافي
- نقص تحليل التكلفة الحسابية: لم يتم الإبلاغ عن تكاليف الوقت الإضافية
- قيود تحويل AIR: استراتيجية التحويل تعتمد بشدة على الخصائص الإحصائية لمجموعة بيانات محددة
- مقارنة غير كاملة: نقص المقارنة مع مقاييس IQA الأخرى (مثل LPIPS)
- القيمة الأكاديمية: فتح اتجاه بحثي جديد في كشف الشذوذ الطبي
- القيمة العملية: التحسن الكبير في الأداء له إمكانية تطبيق سريري
- عمومية الطريقة: يمكن تعميمها على مهام التصوير الطبي الأخرى
- قابلية الاستنساخ: توفير تنفيذ الكود يسهل الاستنساخ والتوسع
- كشف الشذوذ الطبي: كشف أورام الدماغ والتصلب المتعدد والأمراض الأخرى
- التعلم غير الخاضع للإشراف: مهام التصوير الطبي حيث تكون البيانات المُسمّاة نادرة
- تقييم جودة الصورة: تقييم جودة إعادة بناء الصور الطبية
- تحسين الطرق: تحسين أداء الطرق القائمة على إعادة البناء الموجودة
تستشهد الورقة بـ 42 مرجعًا ذا صلة، تغطي مجالات متعددة بما في ذلك التعلم العميق وتحليل الصور الطبية وكشف الشذوذ وتقييم جودة الصورة، مما يوفر أساسًا نظريًا قويًا للبحث.
التقييم الإجمالي: هذا عمل مبتكر وذو قيمة عملية في مجال كشف الشذوذ الطبي. من خلال إدراج منظور IQA والجمع الذكي بين خسارة SSIM و ℓ1، حقق تحسنًا كبيرًا في الأداء عبر مجموعات بيانات متعددة. على الرغم من وجود بعض القصور في التحليل النظري واختيار المعاملات، فإن نهجه الرائد والنتائج التجريبية الممتازة تجعله مساهمة مهمة في هذا المجال.