Generalized Task-Driven Medical Image Quality Enhancement with Gradient Promotion
Zhang, Cheng
Thanks to the recent achievements in task-driven image quality enhancement (IQE) models like ESTR, the image enhancement model and the visual recognition model can mutually enhance each other's quantitation while producing high-quality processed images that are perceivable by our human vision systems. However, existing task-driven IQE models tend to overlook an underlying fact -- different levels of vision tasks have varying and sometimes conflicting requirements of image features. To address this problem, this paper proposes a generalized gradient promotion (GradProm) training strategy for task-driven IQE of medical images. Specifically, we partition a task-driven IQE system into two sub-models, i.e., a mainstream model for image enhancement and an auxiliary model for visual recognition. During training, GradProm updates only parameters of the image enhancement model using gradients of the visual recognition model and the image enhancement model, but only when gradients of these two sub-models are aligned in the same direction, which is measured by their cosine similarity. In case gradients of these two sub-models are not in the same direction, GradProm only uses the gradient of the image enhancement model to update its parameters. Theoretically, we have proved that the optimization direction of the image enhancement model will not be biased by the auxiliary visual recognition model under the implementation of GradProm. Empirically, extensive experimental results on four public yet challenging medical image datasets demonstrated the superior performance of GradProm over existing state-of-the-art methods.
academic
تحسين جودة الصور الطبية المدفوع بالمهام مع تعزيز التدرج
تقدم هذه الورقة استراتيجية تدريب تعزيز التدرج المعمم (GradProm) لمعالجة مشكلة تحسين جودة الصور الطبية المدفوع بالمهام. على الرغم من أن نماذج تحسين جودة الصور المدفوعة بالمهام الحالية (مثل ESTR) يمكنها تحقيق التعزيز المتبادل بين نموذج تحسين الصور ونموذج التعرف البصري، إلا أنها تتجاهل حقيقة مهمة: المهام البصرية المختلفة لها متطلبات مختلفة وأحياناً متضاربة من ميزات الصور. لحل هذه المشكلة، تقسم الورقة نظام IQE المدفوع بالمهام إلى نموذجين فرعيين: نموذج تحسين الصور الرئيسي ونموذج التعرف البصري المساعد. يستخدم GradProm تدرجات كلا النموذجين لتحديث معاملات نموذج تحسين الصور فقط عندما تكون اتجاهات التدرج متسقة، وإلا يستخدم فقط تدرج نموذج تحسين الصور نفسه. تثبت الورقة نظرياً أن هذه الطريقة تضمن عدم انحياز اتجاه التحسين لنموذج تحسين الصور من قبل نموذج التعرف البصري المساعد، وتتحقق النتائج التجريبية من تفوقها على أربع مجموعات بيانات طبية متاحة للجمهور.
يلعب تحليل الصور الطبية دوراً متزايد الأهمية في الأنظمة الطبية الحديثة، حيث يساعد الأطباء على تصور الهياكل التشريحية الداخلية وتقييم تطور المرض. تعتبر جودة الصور حاسمة لتحليل الصور الطبية، حيث تؤدي الصور ذات الجودة الأعلى عادة إلى أداء تعرف أكثر دقة.
مشاكل الطرق الموجهة للإدراك: تركز طرق معالجة الصور الطبية الموجهة للإدراك التقليدية على تحقيق جودة عالية قريبة من الإدراك البصري البشري، لكن جودة الصور المحسنة المرئية هذه لا تعادل المعلومات المفيدة التي يحصل عليها نموذج التعرف البصري اللاحق.
عيوب الطرق المدفوعة بالمهام: على الرغم من أن طرق IQE المدفوعة بالمهام الحالية يمكنها تدريب نموذج تحسين الصور ونموذج التعرف البصري معاً، إلا أنها تتجاهل حقيقة مهمة - المهام المختلفة لرؤية الحاسوب لها متطلبات مختلفة وأحياناً متضاربة من ميزات الصور.
كما هو موضح في الشكل 2، تحت نفس الصورة المدخلة، تركز مهمة إزالة الضوضاء على جميع مناطق الصورة، وتركز مهمة التقسيم الدلالي على مناطق الأجسام الأمامية، بينما تركز مهمة التشخيص على المناطق المحلية المميزة للأجسام الأمامية. يؤدي عدم الاتساق هذا في متطلبات الميزات إلى صراع محتمل بين نموذج تحسين الصور الأمامي ونموذج التعرف البصري اللاحق، مما يؤثر على الأداء.
اقتراح نموذج جديد لـ IQE الطبي المدفوع بالمهام: يقسم النظام بوضوح إلى نموذجين فرعيين - نموذج تحسين الصور الرئيسي ونموذج التعرف البصري المساعد
تصميم استراتيجية تدريب GradProm: استراتيجية تدريب عامة بسيطة وفعالة يمكنها تدريب النموذجين الفرعيين ديناميكياً وتحقيق تحسن مستمر في الأداء، دون الحاجة إلى بيانات إضافية أو تغييرات في معمارية الشبكة
توفير إثبات نظري: يثبت أن GradProm يمكنه التقارب إلى الحد الأدنى المحلي دون أن ينحاز من قبل نموذج التعرف البصري المساعد
التحقق التجريبي الشامل: إجراء تجارب واسعة على أربع مجموعات بيانات طبية متاحة للجمهور، مما يثبت أن GradProm حقق أداء متقدمة في مهام IQE
يعتبر IQE الطبي المدفوع بالمهام في الأساس مهمة تحسين صور، حيث يكون الإدخال صورة منخفضة الجودة X، والصورة عالية الجودة المقابلة Y بمثابة تسميات. تهدف عملية التدريب إلى جعل X بعد ترميزها بواسطة نموذج تحسين الصور IP ونموذج التعرف البصري VR قريبة قدر الإمكان من Y.
مقارنة الأداء عند مستويات ضوضاء مختلفة (الجدول 1 والجدول 2):
σ=0.1 الضوضاء
PSNR↑
SSIM↑
المعاملات المجمدة
32.152
0.906
GradProm
33.383
0.915
يتفوق GradProm على طرق المقارنة الأساسية عند جميع مستويات الضوضاء، على سبيل المثال عند σ=0.1 يحقق تحسناً بمقدار 1.231 PSNR و 0.009 SSIM مقارنة بطريقة المعاملات المجمدة.
لم يؤد استخدام التشخيص والتقسيم معاً كمهام مساعدة إلى تحسن في الأداء، بل حدث انخفاض، مما يؤكد فرضية عدم اتساق متطلبات الميزات بين مهام الرؤية المختلفة.
في التجارب عبر المجالات (التدريب على ISIC 2018 والاختبار على Lizard)، يحقق GradProm تحسناً في الأداء مقابل ESTR بمقدار 13.273/0.325 و 13.825/0.458 PSNR/SSIM في الإعدادات غير الموجهة والموجهة على التوالي.
التعلم متعدد المهام: الاستفادة من المعرفة المفيدة من المهام ذات الصلة لتحسين الأداء الكلي لجميع المهام المعنية
التعلم المساعد: عندما تكون المهام المتعددة ذات أهمية غير متساوية، يتم تقسيم المهام إلى مهام رئيسية ومهام مساعدة
تعتبر هذه الورقة نظام تحسين جودة الصور الطبية المدفوع بالمهام كنموذج تعلم مساعد، حيث تكون معالجة الصور هي المهمة الرئيسية وتعرف الصور هو المهمة المساعدة.
تستشهد الورقة بأعمال ذات صلة غنية، تشمل بشكل أساسي:
ESTR 1 - عمل تمثيلي في تحسين جودة الصور المدفوع بالمهام
ResNet 6 - معمارية التعلم العميق الكلاسيكية
UNet 39 - الطريقة الكلاسيكية لتقسيم الصور الطبية
أوراق ذات صلة بمجموعات البيانات الطبية المختلفة 40-43
التقييم الشامل: هذه ورقة عالية الجودة في مجال رؤية الحاسوب، تقترح حلاً مبتكراً لمشكلة رئيسية في تحسين جودة الصور الطبية المدفوع بالمهام. الطريقة بسيطة وفعالة، والأساس النظري قوي، والتحقق التجريبي شامل، وتتمتع بقيمة أكاديمية وعملية مهمة.