Multi Head Attention Enhanced Inception v3 for Cardiomegaly Detection
Karthik, V
The healthcare industry has been revolutionized significantly by novel imaging technologies, not just in the diagnosis of cardiovascular diseases but also by the visualization of structural abnormalities like cardiomegaly. This article explains an integrated approach to the use of deep learning tools and attention mechanisms for automatic detection of cardiomegaly using X-ray images. The initiation of the project is grounded on a strong Data Collection phase and gathering the data of annotated X-ray images of various types. Then, while the Preprocessing module fine-tunes image quality, it is feasible to utilize the best out of the data quality in the proposed system. In our proposed system, the process is a CNN configuration leveraging the inception V3 model as one of the key blocks. Besides, we also employ a multilayer attention mechanism to enhance the strength. The most important feature of the method is the multi-head attention mechanism that can learn features automatically. By exact selective focusing on only some regions of input, the model can thus identify cardiomegaly in a sensitive manner. Attention rating is calculated, duplicated, and applied to enhance representation of main data, and therefore there is a successful diagnosis. The Evaluation stage will be extremely strict and it will thoroughly evaluate the model based on such measures as accuracy and precision. This will validate that the model can identify cardiomegaly and will also show the clinical significance of this method. The model has accuracy of 95.6, precision of 95.2, recall of 96.2, sensitivity of 95.7, specificity of 96.1 and an Area Under Curve(AUC) of 96.0 and their respective graphs are plotted for visualisation.
academic
كشف تضخم القلب باستخدام آلية الانتباه متعددة الرؤوس المحسّنة لـ Inception v3
تقترح هذه الورقة طريقة آلية لكشف تضخم القلب (cardiomegaly) تجمع بين التعلم العميق وآليات الانتباه. تعتمد الطريقة على نموذج Inception V3، وتدمج آلية الانتباه متعددة الرؤوس، مما يسمح بالتركيز الانتقائي على المناطق الحرجة في صور الأشعة السينية، وبالتالي تحقيق كشف عالي الحساسية لتضخم القلب. حقق النموذج أداءً ممتازاً على مجموعة بيانات ChestX-Ray14: دقة 95.6%، دقة 95.2%، استدعاء 96.2%، حساسية 95.7%، خصوصية 96.1%، و AUC بنسبة 96.0%، متفوقاً بشكل كبير على الطرق الموجودة.
تضخم القلب هو حالة مرضية تتميز بتوسع غير طبيعي لحجرات القلب، وعادة ما يكون ناجماً عن ارتفاع ضغط الدم المزمن، أو أمراض الشرايين التاجية، أو تشوهات الصمامات، أو اعتلال عضلة القلب، أو عيوب القلب الخلقية. قد تؤدي هذه الحالة إلى قصور القلب أو عدم انتظام ضربات القلب أو الموت المفاجئ، مما يجعل التشخيص المبكر حاسماً.
تهدف هذه الورقة إلى تطوير نظام كشف آلي لتضخم القلب دقيق وفعال وقابل للاستخدام سريرياً من خلال الجمع بين قدرة Inception V3 على استخراج الميزات متعددة الأحجام وقدرة آلية الانتباه متعددة الرؤوس على التركيز الانتقائي.
تصميم معماري مبتكر: اقتراح نموذج Inception V3 محسّن بآلية انتباه قنوات متعددة الرؤوس (CMMCA-V3)، يجمع بفعالية بين آليات الانتباه و CNN العميقة
خط أنابيب معالجة شامل: تصميم خط أنابيب معالجة مسبقة كامل يتضمن تحويل التدرج الرمادي، معادلة الرسم البياني، تصفية الشحذ، كشف الحواف، والعمليات المورفولوجية
أداء كشف ممتاز: تحقيق دقة 95.6% على مجموعة بيانات ChestX-Ray14، متفوقاً بشكل كبير على الطرق الموجودة (مثل 92.0% من Iqbal et al.، و 92.5% من Bar et al.)
تصميم مجموعة بيانات متوازنة: استخدام مجموعة بيانات متوازنة من 2500 عينة موجبة و 2500 عينة سالبة، مما يضمن التدريب العادل للنموذج
التحقق التجريبي الشامل: توفير تقييم شامل يتضمن مصفوفة الالتباس وعدة مؤشرات أداء (دقة، دقة، استدعاء، حساسية، خصوصية، AUC)
الإدخال: صور الأشعة السينية للصدر (صور بتدرج رمادي) الإخراج: نتيجة تصنيف ثنائي (وجود/عدم وجود تضخم القلب) مع درجة احتمالية القيود: الحاجة إلى حساسية عالية (تقليل النتائج الإيجابية الكاذبة) وخصوصية عالية (تقليل النتائج السلبية الكاذبة) لتلبية متطلبات التطبيق السريري
منحنى الدقة: تقارب سريع لدقة التدريب والتحقق، مع استقرار دقة التحقق حول 95.6%، مع فرق صغير بين منحنيات التدريب والتحقق، مما يشير إلى درجة منخفضة من الإفراط في التدريب
منحنى درجة F1: استقرار درجة F1 للتحقق فوق 90%، مما يشير إلى توازن جيد بين الدقة والاستدعاء
منحنى الاستدعاء: استدعاء التحقق يتجاوز 90%، مما يشير إلى أن النموذج يحدد بفعالية حالات تضخم القلب، مع عدد قليل من السلبيات الكاذبة
منحنى الخصوصية: خصوصية التحقق عالية ومستقرة، مما يشير إلى أن النموذج يمكنه التمييز بفعالية بين صور الأشعة السينية الطبيعية، مما يقلل الإيجابيات الكاذبة
منحنى الحساسية: حساسية التحقق حوالي 90% أو أعلى، مما يضمن الكشف عن الحالات الحقيقية
منحنى AUC: يحتفظ كل من AUC للتدريب والتحقق بقيم عالية، مما يشير إلى قدرة تمييز جيدة للنموذج
هذه ورقة بحثية عالية الجودة من نوع التطبيق، تجمع بنجاح بين آلية الانتباه متعددة الرؤوس و Inception V3 لتطبيقها على كشف تضخم القلب، وحققت أداءً متفوقاً بشكل كبير على الطرق الموجودة (دقة 95.6%). تكمن المزايا الرئيسية للورقة في تصميم الطريقة المعقول والنتائج التجريبية الممتازة والكتابة الواضحة والشاملة، خاصة خط الأنابيب الشامل للمعالجة المسبقة والتطبيق الفعال لآلية الانتباه.
ومع ذلك، تعاني الورقة أيضاً من أوجه قصور واضحة: نقص التحقق الخارجي وتجارب الاستئصال والتحليل المحدود للقابلية للتفسير. تحد هذه القيود من مصداقية التطبيق السريري وقابلية تعميم الطريقة.
مؤشر التوصية: 4/5 الجمهور المستهدف: باحثو تحليل الصور الطبية وباحثو رؤية الحاسوب وأطباء الأشعة السريريين توصيات العمل المستقبلي: إجراء التحقق متعدد المراكز وتوفير تصور خرائط الانتباه وإجراء دراسات سريرية مستقبلية ونشر الأكواس والنماذج