Generalized Task-Driven Medical Image Quality Enhancement with Gradient Promotion
Zhang, Cheng
Thanks to the recent achievements in task-driven image quality enhancement (IQE) models like ESTR, the image enhancement model and the visual recognition model can mutually enhance each other's quantitation while producing high-quality processed images that are perceivable by our human vision systems. However, existing task-driven IQE models tend to overlook an underlying fact -- different levels of vision tasks have varying and sometimes conflicting requirements of image features. To address this problem, this paper proposes a generalized gradient promotion (GradProm) training strategy for task-driven IQE of medical images. Specifically, we partition a task-driven IQE system into two sub-models, i.e., a mainstream model for image enhancement and an auxiliary model for visual recognition. During training, GradProm updates only parameters of the image enhancement model using gradients of the visual recognition model and the image enhancement model, but only when gradients of these two sub-models are aligned in the same direction, which is measured by their cosine similarity. In case gradients of these two sub-models are not in the same direction, GradProm only uses the gradient of the image enhancement model to update its parameters. Theoretically, we have proved that the optimization direction of the image enhancement model will not be biased by the auxiliary visual recognition model under the implementation of GradProm. Empirically, extensive experimental results on four public yet challenging medical image datasets demonstrated the superior performance of GradProm over existing state-of-the-art methods.
academic
सामान्यीकृत कार्य-संचालित चिकित्सा छवि गुणवत्ता वृद्धि ग्रेडिएंट प्रचार के साथ
यह पेपर कार्य-संचालित चिकित्सा छवि गुणवत्ता वृद्धि की समस्या के लिए एक सामान्यीकृत ग्रेडिएंट प्रचार (GradProm) प्रशिक्षण रणनीति प्रस्तावित करता है। यद्यपि मौजूदा कार्य-संचालित छवि गुणवत्ता वृद्धि मॉडल (जैसे ESTR) छवि वृद्धि मॉडल और दृश्य पहचान मॉडल के बीच पारस्परिक प्रचार को प्राप्त कर सकते हैं, वे एक महत्वपूर्ण तथ्य को नजरअंदाज करते हैं: विभिन्न स्तरों के दृश्य कार्यों के लिए छवि विशेषताओं की अलग-अलग और कभी-कभी परस्पर विरोधी आवश्यकताएं होती हैं। इस समस्या को हल करने के लिए, यह पेपर कार्य-संचालित IQE प्रणाली को दो उप-मॉडल में विभाजित करता है: मुख्य छवि वृद्धि मॉडल और सहायक दृश्य पहचान मॉडल। GradProm केवल तभी दोनों मॉडल के ग्रेडिएंट का उपयोग करके छवि वृद्धि मॉडल पैरामीटर को अपडेट करता है जब दोनों उप-मॉडल के ग्रेडिएंट दिशा सुसंगत हों, अन्यथा केवल छवि वृद्धि मॉडल के स्वयं के ग्रेडिएंट का उपयोग करता है। सैद्धांतिक रूप से यह सिद्ध किया गया है कि यह विधि छवि वृद्धि मॉडल के अनुकूलन दिशा को सहायक दृश्य पहचान मॉडल द्वारा पूर्वाग्रहित होने से बचाती है, और प्रायोगिक परिणाम चार सार्वजनिक चिकित्सा छवि डेटासेट पर इसकी श्रेष्ठता को सत्यापित करते हैं।
चिकित्सा छवि विश्लेषण आधुनिक चिकित्सा प्रणालियों में तेजी से महत्वपूर्ण भूमिका निभा रहा है, जो डॉक्टरों को आंतरिक शारीरिक संरचना की कल्पना करने और रोग की प्रगति का आकलन करने में मदद करता है। छवि गुणवत्ता चिकित्सा छवि विश्लेषण के लिए महत्वपूर्ण है, उच्च गुणवत्ता की छवियां आमतौर पर अधिक सटीक पहचान प्रदर्शन प्रदान करती हैं।
धारणा-उन्मुख विधियों की समस्या: पारंपरिक धारणा-उन्मुख चिकित्सा छवि प्रसंस्करण विधियां मुख्य रूप से मानव दृश्य धारणा के करीब उच्च गुणवत्ता वाली प्रस्तुति का पीछा करती हैं, लेकिन इस तरह की वृद्धि की गई दृश्य धारणा छवि गुणवत्ता डाउनस्ट्रीम दृश्य पहचान मॉडल द्वारा प्राप्त लाभकारी जानकारी के समान नहीं है।
कार्य-संचालित विधियों की खामियां: मौजूदा कार्य-संचालित IQE विधियां हालांकि छवि वृद्धि मॉडल और दृश्य पहचान मॉडल को संयुक्त रूप से प्रशिक्षित कर सकती हैं, लेकिन एक महत्वपूर्ण तथ्य को नजरअंदाज करती हैं - विभिन्न स्तरों के कंप्यूटर दृश्य कार्यों के लिए छवि विशेषताओं की अलग-अलग और कभी-कभी परस्पर विरोधी आवश्यकताएं होती हैं।
जैसा कि चित्र 2 में दिखाया गया है, एक ही इनपुट छवि के तहत, शोर हटाने का कार्य छवि के सभी क्षेत्रों पर ध्यान केंद्रित करता है, सिमेंटिक विभाजन कार्य अग्रभूमि वस्तु क्षेत्रों पर ध्यान केंद्रित करता है, जबकि निदान कार्य अग्रभूमि वस्तु के विभेदकारी स्थानीय क्षेत्रों पर ध्यान केंद्रित करता है। विशेषता आवश्यकताओं की यह असंगति अपस्ट्रीम छवि वृद्धि मॉडल और डाउनस्ट्रीम दृश्य पहचान मॉडल के बीच संभावित संघर्ष का कारण बनती है, जिससे प्रदर्शन प्रभावित होता है।
कार्य-संचालित चिकित्सा IQE के लिए एक नया प्रतिमान प्रस्तावित किया: प्रणाली को स्पष्ट रूप से मुख्य छवि वृद्धि मॉडल और सहायक दृश्य पहचान मॉडल दो उप-मॉडल में विभाजित किया
GradProm प्रशिक्षण रणनीति डिजाइन की: एक सरल लेकिन प्रभावी सामान्यीकृत प्रशिक्षण रणनीति जो दोनों उप-मॉडल को गतिशील रूप से प्रशिक्षित कर सकती है और निरंतर प्रदर्शन सुधार प्राप्त कर सकती है, अतिरिक्त डेटा या नेटवर्क आर्किटेक्चर परिवर्तन की आवश्यकता के बिना
सैद्धांतिक प्रमाण प्रदान किया: यह सिद्ध किया कि GradProm स्थानीय इष्टतम समाधान में परिवर्तित हो सकता है और सहायक दृश्य पहचान मॉडल द्वारा पूर्वाग्रहित नहीं होता है
व्यापक प्रायोगिक सत्यापन: चार सार्वजनिक चिकित्सा छवि डेटासेट पर व्यापक प्रयोग किए गए, जो IQE कार्य पर GradProm की अत्याधुनिक प्रदर्शन को सिद्ध करते हैं
कार्य-संचालित चिकित्सा IQE मूलतः एक छवि वृद्धि कार्य है, जहां इनपुट कम गुणवत्ता वाली छवि X है, और संबंधित उच्च गुणवत्ता वाली छवि Y लेबल के रूप में कार्य करती है। प्रशिक्षण प्रक्रिया का उद्देश्य यह सुनिश्चित करना है कि X छवि वृद्धि मॉडल IP और दृश्य पहचान मॉडल VR द्वारा एन्कोड किए जाने के बाद Y के जितना संभव हो सके करीब हो।
प्रमाण के मुख्य बिंदु: यह सिद्ध करके कि अपडेट दिशा मुख्य मॉडल ग्रेडिएंट के साथ आंतरिक उत्पाद गैर-नकारात्मक है, अनुकूलन दिशा की सही्ता सुनिश्चित करता है और सहायक मॉडल द्वारा पूर्वाग्रह को रोकता है।
विभिन्न शोर स्तरों पर प्रदर्शन तुलना (तालिका 1 और 2):
शोर σ=0.1
PSNR↑
SSIM↑
Frozen-params
32.152
0.906
GradProm
33.383
0.915
GradProm विभिन्न शोर स्तरों पर आधारभूत विधियों से बेहतर प्रदर्शन करता है, उदाहरण के लिए σ=0.1 पर Frozen-params विधि की तुलना में 1.231 PSNR और 0.009 SSIM में सुधार।
निदान और विभाजन दोनों को सहायक कार्य के रूप में एक साथ उपयोग करने से प्रदर्शन में सुधार नहीं हुआ, बल्कि गिरावट आई, जो विभिन्न दृश्य कार्यों की विशेषता आवश्यकताओं की असंगति की परिकल्पना की पुष्टि करता है।
ISIC 2018 पर प्रशिक्षण, Lizard पर परीक्षण के क्रॉस-डोमेन प्रयोग में, GradProm ESTR की तुलना में अपर्यवेक्षित और पर्यवेक्षित सेटिंग में क्रमशः 13.273/0.325 और 13.825/0.458 PSNR/SSIM प्रदर्शन प्राप्त करता है।
बहु-कार्य शिक्षण: संबंधित कार्यों के उपयोगी ज्ञान का उपयोग करके सभी शामिल कार्यों के समग्र प्रदर्शन में सुधार
सहायक शिक्षण: जब कई कार्य समान रूप से महत्वपूर्ण नहीं होते हैं, तो कार्यों को मुख्य कार्य और सहायक कार्य में विभाजित करना
यह पेपर कार्य-संचालित चिकित्सा छवि गुणवत्ता वृद्धि प्रणाली को सहायक शिक्षण प्रतिमान के रूप में मानता है, जहां छवि प्रसंस्करण मुख्य कार्य है और छवि पहचान सहायक कार्य है।
पेपर ने समृद्ध संबंधित कार्यों का उद्धृत किया है, मुख्य रूप से शामिल हैं:
ESTR 1 - कार्य-संचालित छवि गुणवत्ता वृद्धि का प्रतिनिधि कार्य
ResNet 6 - शास्त्रीय गहन शिक्षण आर्किटेक्चर
UNet 39 - चिकित्सा छवि विभाजन की शास्त्रीय विधि
कई चिकित्सा छवि डेटासेट के संबंधित पेपर 40-43
समग्र मूल्यांकन: यह कंप्यूटर विजन क्षेत्र का एक उच्च गुणवत्ता वाला पेपर है, जो कार्य-संचालित चिकित्सा छवि गुणवत्ता वृद्धि में मुख्य समस्या के लिए एक नवीन समाधान प्रस्तावित करता है। विधि सरल और प्रभावी है, सैद्धांतिक आधार मजबूत है, प्रायोगिक सत्यापन पर्याप्त है, महत्वपूर्ण शैक्षणिक मूल्य और व्यावहारिक मूल्य है।