2025-11-16T23:55:12.682018

TreeNet: Layered Decision Ensembles

Khan
Within the domain of medical image analysis, three distinct methodologies have demonstrated commendable accuracy: Neural Networks, Decision Trees, and Ensemble-Based Learning Algorithms, particularly in the specialized context of genstro institutional track abnormalities detection. These approaches exhibit efficacy in disease detection scenarios where a substantial volume of data is available. However, the prevalent challenge in medical image analysis pertains to limited data availability and data confidence. This paper introduces TreeNet, a novel layered decision ensemble learning methodology tailored for medical image analysis. Constructed by integrating pivotal features from neural networks, ensemble learning, and tree-based decision models, TreeNet emerges as a potent and adaptable model capable of delivering superior performance across diverse and intricate machine learning tasks. Furthermore, its interpretability and insightful decision-making process enhance its applicability in complex medical scenarios. Evaluation of the proposed approach encompasses key metrics including Accuracy, Precision, Recall, and training and evaluation time. The methodology resulted in an F1-score of up to 0.85 when using the complete training data, with an F1-score of 0.77 when utilizing 50\% of the training data. This shows a reduction of F1-score of 0.08 while in the reduction of 50\% of the training data and training time. The evaluation of the methodology resulted in the 32 Frame per Second which is usable for the realtime applications. This comprehensive assessment underscores the efficiency and usability of TreeNet in the demanding landscape of medical image analysis specially in the realtime analysis.
academic

TreeNet: स्तरीय निर्णय समूह

बुनियादी जानकारी

  • पेपर ID: 2510.09654
  • शीर्षक: TreeNet: स्तरीय निर्णय समूह
  • लेखक: Zeshan Khan (FAST कंप्यूटिंग स्कूल, राष्ट्रीय कंप्यूटर और उदीयमान विज्ञान विश्वविद्यालय, इस्लामाबाद, पाकिस्तान)
  • वर्गीकरण: cs.CV (कंप्यूटर दृष्टि)
  • प्रकाशन तिथि: 14 अक्टूबर, 2025
  • पेपर लिंक: https://arxiv.org/abs/2510.09654

सारांश

चिकित्सा छवि विश्लेषण के क्षेत्र में, तंत्रिका नेटवर्क, निर्णय वृक्ष और समूह शिक्षा-आधारित एल्गोरिदम गैस्ट्रोइंटेस्टाइनल असामान्यताओं के पहचान में अच्छी सटीकता प्रदर्शित करते हैं। हालांकि, चिकित्सा छवि विश्लेषण का मुख्य चुनौती सीमित डेटा उपलब्धता और अपर्याप्त डेटा विश्वास है। यह पेपर TreeNet प्रस्तावित करता है, जो चिकित्सा छवि विश्लेषण के लिए विशेष रूप से तैयार किया गया एक स्तरीय निर्णय समूह शिक्षण विधि है। तंत्रिका नेटवर्क, समूह शिक्षा और वृक्ष-आधारित निर्णय मॉडल की मुख्य विशेषताओं को एकीकृत करके, TreeNet एक शक्तिशाली और अनुकूलनीय मॉडल बन जाता है। यह विधि पूर्ण प्रशिक्षण डेटा पर 0.85 का F1-स्कोर, 50% प्रशिक्षण डेटा पर 0.77 का F1-स्कोर और 32 फ्रेम प्रति सेकंड की अनुमान गति प्राप्त करती है, जो वास्तविक समय अनुप्रयोगों के लिए उपयुक्त है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

  1. मुख्य समस्या: चिकित्सा छवि विश्लेषण में डेटा की कमी और विश्वास की कमी की समस्या
  2. अनुप्रयोग परिदृश्य: गैस्ट्रोइंटेस्टाइनल असामान्यता पहचान जैसे चिकित्सा इमेजिंग निदान कार्य
  3. मौजूदा विधियों की सीमाएं:
    • तंत्रिका नेटवर्क को बड़ी मात्रा में डेटा और लंबे प्रशिक्षण समय की आवश्यकता होती है
    • निर्णय वृक्ष अधिक फिटिंग के लिए प्रवण हैं और सीमित अभिव्यक्ति क्षमता रखते हैं
    • समूह विधियों में उच्च कम्प्यूटेशनल जटिलता होती है

अनुसंधान प्रेरणा

चिकित्सा छवि विश्लेषण को सीमित डेटा की स्थिति में उच्च सटीकता और तेजी से अनुमान प्राप्त करने की आवश्यकता है, मौजूदा एकल विधियां सटीकता, व्याख्यात्मकता और दक्षता की आवश्यकताओं को एक साथ पूरा करना कठिन है।

मुख्य योगदान

  1. TreeNet आर्किटेक्चर प्रस्तावित करना: तंत्रिका नेटवर्क की स्तरीय प्रसंस्करण, निर्णय वृक्ष की व्याख्यात्मकता और समूह शिक्षा की मजबूती को नवीनतापूर्वक एकीकृत करना
  2. कुशल प्रशिक्षण को लागू करना: आगे प्रसार तंत्र का उपयोग करके, ढाल वंश की जटिलता से बचना, प्रशिक्षण समय में भारी कमी
  3. डेटा दक्षता अनुकूलन: डेटा मात्रा 50% कम होने पर भी, F1-स्कोर केवल 0.08 कम होता है
  4. वास्तविक समय अनुमान क्षमता: 450 FPS की अनुमान गति प्राप्त करना, पारंपरिक गहरे नेटवर्क से 40 गुना से अधिक तेजी
  5. ओपन सोर्स Python पैकेज: DtreeNetwork पैकेज जारी करना, अनुसंधान और अनुप्रयोग को सुविधाजनक बनाना

विधि विस्तार

कार्य परिभाषा

इनपुट: चिकित्सा छवियां (CT, MRI, X-ray, अल्ट्रासाउंड आदि) आउटपुट: बहु-वर्गीय वर्गीकरण परिणाम (सामान्य ऊतक, रोग संबंधी निष्कर्ष, शारीरिक स्थलचिह्न आदि) बाधाएं: सीमित एनोटेशन डेटा, वास्तविक समय अनुमान आवश्यकता, व्याख्यात्मकता आवश्यकता

मॉडल आर्किटेक्चर

TreeNet स्तरीय निर्णय समूह आर्किटेक्चर को अपनाता है, जिसमें विशेष रूप से शामिल हैं:

  1. विशेषता निष्कर्षण परत:
    • बनावट विशेषता वर्णनकारी का उपयोग (हिस्टोग्राम, GLCM, GLRLM)
    • जटिल कनवल्शन ऑपरेशन से बचना, कम्प्यूटेशनल जटिलता को कम करना
  2. स्तरीय निर्णय संरचना:
    परत 1: Random Forest → विशेषता रूपांतरण
    परत 2: Random Forest → विशेषता परिशोधन  
    परत n: Random Forest → अंतिम निर्णय
    
  3. समूह तंत्र:
    • प्रत्येक परत में कई Random Forest शामिल हैं
    • मतदान/औसत तंत्र के माध्यम से पूर्वानुमान परिणामों को एकत्रित करना
    • परतों के बीच आगे प्रसार, कोई पिछड़ी ढाल गणना नहीं

तकनीकी नवाचार बिंदु

  1. आगे प्रसार आर्किटेक्चर: ढाल वंश की आवश्यकता को समाप्त करना, प्रशिक्षण समय में उल्लेखनीय कमी
  2. स्तरीय विशेषता रूपांतरण: तंत्रिका नेटवर्क की तरह पदानुक्रमित प्रसंस्करण, लेकिन निर्णय वृक्ष का उपयोग करके लागू किया गया
  3. बहु-परत समूह: प्रत्येक परत पर समूह शिक्षा को अपनाना, मॉडल की मजबूती में सुधार
  4. विशेषता प्राथमिकता संगठन: महत्वपूर्ण विशेषताओं को स्वचालित रूप से पहचानना और प्राथमिकता देना

प्रायोगिक सेटअप

डेटासेट

  1. Kvasir V1: 4000 गैस्ट्रोइंटेस्टाइनल छवियां, 8 वर्ग, प्रति वर्ग 500 छवियां
  2. Kvasir V2: 14033 छवियां, 16 वर्ग, प्रशिक्षण सेट 5293, परीक्षण सेट 8740
  3. Hyper Kvasir: 110,800 छवियां, 23 वर्ग, गंभीर वर्ग असंतुलन
  4. DowPK: 844 बिना लेबल वाली गैस्ट्रोइंटेस्टाइनल छवियां

मूल्यांकन मेट्रिक्स

  • सटीकता (Accuracy)
  • परिशुद्धता (Precision)
  • पुनरावृत्ति (Recall)
  • F1-स्कोर
  • Matthews सहसंबंध गुणांक (MCC)
  • प्रशिक्षण समय
  • अनुमान समय (FPS)

तुलनात्मक विधियां

  • DenseNet169
  • ResNet152
  • Thambawita et al. की विधि

कार्यान्वयन विवरण

  • प्रशिक्षण डेटा के विभिन्न अनुपातों का उपयोग (5%, 10%, 40%, 50%, 90%, 100%)
  • इनपुट वर्णनकारी के रूप में बनावट विशेषताओं को अपनाना
  • CPU वातावरण में प्रशिक्षण और परीक्षण करना

प्रायोगिक परिणाम

मुख्य परिणाम

डेटासेटTreeNet F1 (100%)TreeNet F1 (10%)DenseNet169 F1 (100%)ResNet152 F1 (100%)
Kvasir V10.740.650.840.72
Kvasir V20.770.610.900.83
Kvasir V30.850.580.440.33

अनुमान गति तुलना

विधिअनुमान गति (FPS)
TreeNet450
DenseNet16910
ResNet15213
Thambawita14

मुख्य निष्कर्ष

  1. डेटा दक्षता: TreeNet छोटे डेटासेट पर उत्कृष्ट प्रदर्शन करता है, विशेष रूप से Kvasir V3 पर गहरे नेटवर्क से स्पष्ट रूप से बेहतर है
  2. गति लाभ: पारंपरिक विधियों की तुलना में 32-40 गुना तेजी से अनुमान
  3. स्थिरता: विभिन्न डेटा मात्रा में परिशुद्धता-पुनरावृत्ति संतुलन को बनाए रखना

विलोपन प्रयोग

पेपर विभिन्न डेटा अनुपातों के तहत प्रदर्शन परिवर्तन दिखाता है:

  • डेटा मात्रा 50% कम होने पर, F1-स्कोर केवल 0.08 कम होता है
  • प्रशिक्षण समय डेटा मात्रा के साथ रैखिक संबंध रखता है
  • परिशुद्धता और पुनरावृत्ति विभिन्न डेटा पैमानों पर स्थिर रहते हैं

संबंधित कार्य

तंत्रिका नेटवर्क विधियां

  • CNN आर्किटेक्चर: चिकित्सा छवि विश्लेषण में उत्कृष्ट प्रदर्शन, लेकिन बड़ी मात्रा में डेटा और कम्प्यूटेशनल संसाधनों की आवश्यकता
  • समय जटिलता: आगे प्रसार O(∑L(nl-1×nl)), पिछड़ी प्रसार समय दोगुना
  • सीमाएं: ढाल वंश समस्याएं, हाइपरपैरामीटर संवेदनशीलता, मॉडल जटिलता अधिक

समूह शिक्षण विधियां

  • Random Forest: जटिल चिकित्सा डेटा को संभालने में सफल
  • लाभ: सामान्यीकरण क्षमता में सुधार, अधिक फिटिंग में कमी
  • विशेषताएं: विविधता-संचालित प्रदर्शन सुधार

निर्णय वृक्ष विधियां

  • व्याख्यात्मकता मजबूत: पारदर्शी निर्णय पथ प्रदान करना
  • विशेषता महत्व: महत्वपूर्ण विशेषताओं को स्वचालित रूप से पहचानना
  • सीमाएं: अधिक फिटिंग के लिए प्रवण, सीमित अभिव्यक्ति क्षमता

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. TreeNet तीनों विधियों के लाभों को सफलतापूर्वक एकीकृत करता है, प्रतिस्पर्धी सटीकता बनाए रखते हुए दक्षता में भारी सुधार करता है
  2. यह विधि विशेष रूप से डेटा की कमी वाले चिकित्सा छवि विश्लेषण परिदृश्य के लिए उपयुक्त है
  3. सटीकता, व्याख्यात्मकता और कम्प्यूटेशनल दक्षता के बीच अच्छा संतुलन प्राप्त किया गया है

सीमाएं

  1. कुछ डेटासेट पर F1-स्कोर अत्याधुनिक गहरी शिक्षण विधियों से थोड़ा कम है
  2. हाथ से डिजाइन की गई बनावट विशेषताओं पर निर्भरता, जो विशेषता अभिव्यक्ति क्षमता को सीमित कर सकती है
  3. जटिल छवि पैटर्न की मॉडलिंग क्षमता गहरे नेटवर्क जितनी अच्छी नहीं हो सकती है

भविष्य की दिशाएं

  1. अधिक चिकित्सा इमेजिंग मोडल तक विस्तार
  2. डेटा दक्षता में सुधार की तकनीकें
  3. नवीनतम मॉडल के साथ बेंचमार्किंग
  4. अर्ध-निरीक्षित और स्थानांतरण शिक्षा का एकीकरण

गहन मूल्यांकन

लाभ

  1. विधि नवाचार: तीन विभिन्न प्रतिमानों के लाभों को चतुराई से एकीकृत करना, एक नई मिश्रित आर्किटेक्चर बनाना
  2. उच्च व्यावहारिक मूल्य: चिकित्सा छवि विश्लेषण में वास्तविक समस्याओं (डेटा की कमी, वास्तविक समय आवश्यकता) को हल करना
  3. पर्याप्त प्रयोग: कई बेंचमार्क डेटासेट पर व्यापक मूल्यांकन
  4. ओपन सोर्स योगदान: पुनरुत्पादन योग्य Python पैकेज प्रदान करना

कमियां

  1. विशेषता इंजीनियरिंग निर्भरता: अभी भी पारंपरिक बनावट विशेषताओं पर निर्भर, गहरी विशेषता शिक्षा के लाभों का पूरी तरह से उपयोग नहीं किया गया
  2. सैद्धांतिक विश्लेषण अपर्याप्त: विधि अभिसरण और सामान्यीकरण क्षमता का सैद्धांतिक विश्लेषण अभाव
  3. तुलनात्मक प्रयोग सीमित: मुख्य रूप से पारंपरिक गहरे नेटवर्क के साथ तुलना, नवीनतम मिश्रित विधियों के साथ तुलना की कमी

प्रभाव

  1. शैक्षणिक मूल्य: चिकित्सा छवि विश्लेषण के लिए नई पद्धति संबंधी सोच प्रदान करना
  2. व्यावहारिक मूल्य: विशेष रूप से संसाधन-सीमित चिकित्सा वातावरण के लिए उपयुक्त
  3. पुनरुत्पादनीयता: ओपन सोर्स कार्यान्वयन प्रदान करना, सत्यापन और विस्तार को सुविधाजनक बनाना

लागू परिदृश्य

  1. डेटा की कमी परिदृश्य: सीमित एनोटेशन डेटा वाले चिकित्सा छवि विश्लेषण कार्य
  2. वास्तविक समय अनुप्रयोग: तेजी से निदान प्रतिक्रिया की आवश्यकता वाले नैदानिक परिदृश्य
  3. किनारे कंप्यूटिंग: कम्प्यूटेशनल संसाधन-सीमित चिकित्सा उपकरण
  4. व्याख्यात्मक AI: चिकित्सा निदान प्रणालियों में निर्णय पारदर्शिता की आवश्यकता

संदर्भ

पेपर 118 संबंधित संदर्भों का हवाला देता है, जो चिकित्सा छवि विश्लेषण, गहरी शिक्षा, समूह शिक्षा और निर्णय वृक्ष सहित कई क्षेत्रों के महत्वपूर्ण कार्यों को कवर करता है, अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करता है।


समग्र मूल्यांकन: यह पेपर एक नवीन मिश्रित आर्किटेक्चर प्रस्तावित करता है, जो चिकित्सा छवि विश्लेषण में मुख्य चुनौतियों को सफलतापूर्वक हल करता है। हालांकि कुछ मेट्रिक्स पर गहरी शिक्षण विधियों से थोड़ा कम है, लेकिन दक्षता, व्याख्यात्मकता और डेटा दक्षता में इसके लाभ इसे महत्वपूर्ण व्यावहारिक मूल्य देते हैं। यह कार्य चिकित्सा AI क्षेत्र के लिए एक मूल्यवान उपकरण प्रदान करता है, विशेष रूप से संसाधन-सीमित नैदानिक वातावरण के लिए उपयुक्त है।