The increasing number of Health Care facilities in Nepal has added up the challenges on managing health care waste (HCW). Improper segregation and disposal of HCW leads to contamination, spreading of infectious diseases and risk for waste handlers. This study benchmarks the state of the art waste classification models: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n and YOLOv5-s using stratified 5-fold cross-validation technique on combined HCW data. YOLOv5-s achieved the highest accuracy (95.06%) but fell short with the YOLOv8-n model in inference speed with few milliseconds. The EfficientNet-B0 showed promising results of 93.22% accuracy but took the highest inference time. Following a repetitive ANOVA test to confirm the statistical significance, the best performing model (YOLOv5-s) was deployed to the web with bin color mapped using Nepal's HCW management standards. Further work is suggested to address data limitation and ensure localized context.
- पेपर ID: 2508.07450
- शीर्षक: Health Care Waste Classification Using Deep Learning Aligned with Nepal's Bin Color Guidelines
- लेखक: Suman Kunwar (DWaste, USA), Prabesh Rai (Lambton College, Canada)
- वर्गीकरण: cs.CV (कंप्यूटर विजन)
- प्रकाशन समय: 15 अक्टूबर 2025 (arXiv)
- पेपर लिंक: https://arxiv.org/abs/2508.07450
नेपाल में स्वास्थ्य सेवा सुविधाओं की संख्या में वृद्धि के साथ, चिकित्सा अपशिष्ट (HCW) प्रबंधन को चुनौतियों का सामना करना पड़ रहा है। अनुचित पृथक्करण और निपटान से प्रदूषण, संक्रामक रोगों का प्रसार और अपशिष्ट प्रबंधन कर्मचारियों के लिए जोखिम होता है। यह अनुसंधान स्तरीकृत 5-गुना क्रॉस-सत्यापन तकनीक का उपयोग करके व्यापक HCW डेटा पर अत्याधुनिक अपशिष्ट वर्गीकरण मॉडल का बेंचमार्क करता है: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n और YOLOv5-s। YOLOv5-s ने सर्वोच्च सटीकता (95.06%) प्राप्त की, लेकिन अनुमान गति में YOLOv8-n मॉडल से कुछ मिलीसेकंड पीछे है। EfficientNet-B0 ने 93.22% के अच्छे परिणाम दिखाए, लेकिन अनुमान समय सबसे लंबा है। दोहराए गए ANOVA परीक्षण द्वारा सांख्यिकीय महत्व की पुष्टि के बाद, सर्वोत्तम प्रदर्शन करने वाले मॉडल (YOLOv5-s) को वेब पर तैनात किया गया और नेपाल के HCW प्रबंधन मानकों के अनुसार बिन रंगों को मैप किया गया।
- समाधान की जाने वाली समस्या: नेपाल के पास 16,611 स्वास्थ्य सेवा सुविधाएं हैं, और चिकित्सा अपशिष्ट प्रबंधन को गंभीर चुनौतियों का सामना करना पड़ रहा है। पारंपरिक मैनुअल वर्गीकरण विधि श्रम-गहन, त्रुटि-प्रवण और अपशिष्ट प्रबंधन कर्मचारियों के लिए खतरनाक है।
- समस्या की महत्ता: अनुचित चिकित्सा अपशिष्ट पृथक्करण और निपटान से होता है:
- पर्यावरणीय प्रदूषण
- संक्रामक रोगों का प्रसार
- अपशिष्ट प्रबंधन कर्मचारियों के लिए स्वास्थ्य जोखिम
- अस्पताल के आसपास के निवासियों के लिए संभावित खतरा
- मौजूदा विधियों की सीमाएं:
- छोटे डेटासेट आकार
- खराब छवि गुणवत्ता
- नियंत्रित वातावरण परीक्षण
- स्केलेबिलिटी और बुनियादी ढांचे की व्यवहार्यता समस्याएं
- मौजूदा अपशिष्ट प्रबंधन प्रणालियों के साथ एकीकरण में कठिनाई
- अनुसंधान प्रेरणा: नेपाल राष्ट्रीय चिकित्सा अपशिष्ट प्रबंधन मानकों और परिचालन प्रक्रियाओं का पालन करता है, अपशिष्ट को सामान्य चिकित्सा अपशिष्ट और खतरनाक चिकित्सा अपशिष्ट में विभाजित करता है, और रंग कोडिंग प्रणाली को अपनाता है। अनुसंधान का उद्देश्य नेपाल के मानकों के अनुरूप AI-संचालित स्वचालित अपशिष्ट वर्गीकरण समाधान विकसित करना है।
- बहु-मॉडल बेंचमार्किंग: चिकित्सा अपशिष्ट वर्गीकरण कार्य पर 5 अत्याधुनिक गहन शिक्षा मॉडल की पहली व्यवस्थित तुलना
- स्थानीयकृत अनुप्रयोग: वर्गीकरण परिणामों को नेपाल के चिकित्सा अपशिष्ट प्रबंधन रंग कोडिंग मानकों के साथ संरेखित करना
- व्यापक डेटासेट: दो डेटासेट को एकीकृत करना, 23 श्रेणियों के चिकित्सा अपशिष्ट को कवर करना
- व्यावहारिक तैनाती: सर्वोत्तम मॉडल को Hugging Face प्लेटफॉर्म पर जनता के उपयोग के लिए तैनात करना
- सांख्यिकीय सत्यापन: दोहराए गए ANOVA परीक्षण का उपयोग करके मॉडल प्रदर्शन के सांख्यिकीय महत्व की पुष्टि करना
इनपुट: चिकित्सा अपशिष्ट की RGB छवियां (1920×1080 रिज़ॉल्यूशन)
आउटपुट: 23 श्रेणियों में अपशिष्ट वर्गीकरण परिणाम, और संबंधित रंग-कोडित बिन में मैपिंग
बाधाएं: नेपाल के राष्ट्रीय चिकित्सा अपशिष्ट प्रबंधन मानकों की रंग कोडिंग प्रणाली का पालन करना चाहिए
अनुसंधान ने 5 विभिन्न प्रकार के गहन शिक्षा मॉडल का परीक्षण किया:
- ResNeXt-50: अवशिष्ट नेटवर्क वेरिएंट, समूह कनवल्शन का उपयोग करता है
- EfficientNet-B0: कुशल CNN आर्किटेक्चर, सटीकता और कम्प्यूटेशनल दक्षता को संतुलित करता है
- MobileNetV3-S: हल्का नेटवर्क, मोबाइल डिवाइस के लिए उपयुक्त
- YOLOv8-n: YOLO लक्ष्य पहचान मॉडल का नवीनतम संस्करण
- YOLOv5-s: YOLO मॉडल वेरिएंट का परिपक्व संस्करण
प्रशिक्षण रणनीति:
- पारंपरिक CNN मॉडल (ResNeXt-50, EfficientNet-B0, MobileNetV3-S): ImageNet पूर्व-प्रशिक्षित वजन का उपयोग, आधार परतों को फ्रीज करना, कस्टम वर्गीकरण हेड जोड़ना
- YOLO मॉडल: शुरुआत से प्रशिक्षण
- स्तरीकृत K-गुना क्रॉस-सत्यापन: 5-गुना स्तरीकृत क्रॉस-सत्यापन का उपयोग, यह सुनिश्चित करता है कि प्रत्येक लेबल सभी गुना में समान अनुपात में रहे
- डेटा संतुलन प्रबंधन:
- अधिक-नमूना श्रेणियों के लिए माध्यिका श्रेणी गणना मान का उपयोग करके छवियों को कम करना
- कम-नमूना श्रेणियों के लिए फ्लिपिंग और चमक विपरीत जैसी डेटा वृद्धि तकनीकों का उपयोग करना
- स्थानीयकृत मैपिंग: वर्गीकरण परिणामों को नेपाल मानक के रंग-कोडित बिन में सीधे मैप करना
संयुक्त डेटासेट में शामिल है:
- Medical Waste Dataset 4.0:
- स्रोत: इटली के टस्कनी क्षेत्र, OAK 4.0 कैमरा डिवाइस का उपयोग करके
- श्रेणियां: धुंध, दस्ताने की जोड़ी, एकल दस्ताना, चिकित्सा टोपी, चिकित्सा चश्मा, जूते कवर आदि
- Pharmaceutical and Biomedical Waste dataset:
- स्रोत: Engineering UBU द्वारा एकत्रित
- श्रेणियां: शरीर के ऊतक, जैविक अपशिष्ट, उपकरण पैकेजिंग, सिरिंज सुई आदि
डेटा पूर्व-प्रसंस्करण:
- पूर्वाग्रह को कम करने के लिए दस्ताने की डुप्लिकेट श्रेणियों को हटाना
- श्रेणी असंतुलन को संभालने के लिए माध्यिका श्रेणी गणना का उपयोग करना
- डेटा वृद्धि तकनीकें लागू करना
- सटीकता (Accuracy)
- परिशुद्धता (Precision)
- रिकॉल (Recall)
- F1 स्कोर (F1-Score)
- अनुमान समय (Inference Time)
ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n, YOLOv5-s पांच मॉडल की आपस में तुलना
- हार्डवेयर: दो NVIDIA Tesla T4 GPU
- प्रशिक्षण एपोक्स: 30 एपोक्स
- क्रॉस-सत्यापन: 5-गुना स्तरीकृत क्रॉस-सत्यापन, 80% प्रशिक्षण, 20% सत्यापन
| मॉडल | सटीकता | परिशुद्धता | रिकॉल | F1 स्कोर | अनुमान समय(ms) |
|---|
| YOLOv5-s | 95.06% | 96.65% | 95.06% | 94.87% | 10.97 |
| YOLOv8-n | 94.68% | 96.44% | 94.68% | 94.57% | 9.29 |
| EfficientNet-B0 | 93.22% | 94.81% | 93.22% | 93.04% | 444.67 |
| MobileNetV3-S | 91.05% | 92.90% | 91.05% | 90.95% | 369.24 |
| ResNeXt-50 | 74.51% | 76.53% | 74.51% | 74.48% | 395.74 |
- YOLOv5-s सर्वोत्तम प्रदर्शन करता है: सटीकता, परिशुद्धता, रिकॉल और F1 स्कोर पर सर्वोच्च अंक प्राप्त करता है
- अनुमान गति लाभ: YOLO मॉडल (v5-s और v8-n) अनुमान समय में अन्य मॉडल से काफी बेहतर हैं
- व्यावहारिकता व्यापार: YOLOv8-n अनुमान गति में YOLOv5-s से थोड़ा बेहतर है, लेकिन सटीकता थोड़ी कम है
दोहराए गए ANOVA परीक्षण परिणाम दिखाते हैं:
- मॉडल प्रदर्शन संकेतकों पर अत्यधिक महत्वपूर्ण प्रभाव डालते हैं
- विभिन्न मूल्यांकन संकेतकों के बीच महत्वपूर्ण अंतर मौजूद हैं
- मॉडल और संकेतकों के बीच अंतःक्रिया अत्यधिक महत्वपूर्ण है
| अनुसंधान | श्रेणियां | सर्वोत्तम मॉडल | सटीकता |
|---|
| Bruno et al. | 7 श्रेणियां | EfficientNet-B0 | 99.45% |
| यह अनुसंधान | 23 श्रेणियां | YOLOv5-s | 95.06% |
हालांकि Bruno आदि 7 श्रेणी कार्य पर 99.45% की सटीकता प्राप्त करते हैं, यह अनुसंधान अधिक चुनौतीपूर्ण 23 श्रेणी कार्य पर 95.06% की सटीकता प्राप्त करता है।
- चिकित्सा अपशिष्ट वर्गीकरण में गहन शिक्षा का अनुप्रयोग: ResNeXt-50 और EfficientNet जैसे मॉडल का अनुप्रयोग
- IoT और AI संयोजन की स्वचालित छंटाई: YOLO मॉडल और IoT डिवाइस का एकीकरण
- वास्तविक समय तैनाती और किनारे कंप्यूटिंग: चिकित्सा वातावरण में व्यावहारिक अनुप्रयोग
- अधिक व्यापक श्रेणी कवरेज: 23 श्रेणियां बनाम पिछले अनुसंधान की 6-8 श्रेणियां
- स्थानीयकृत मानक संरेखण: नेपाल के राष्ट्रीय मानकों के अनुरूप
- व्यावहारिक तैनाती: उपयोगी वेब एप्लिकेशन प्रदान करता है
- YOLOv5-s सर्वोत्तम विकल्प है: सटीकता और व्यापक प्रदर्शन में सर्वोत्तम प्रदर्शन करता है
- YOLO मॉडल वास्तविक समय अनुप्रयोग के लिए उपयुक्त हैं: तेज अनुमान गति, व्यावहारिक तैनाती के लिए उपयुक्त
- गहन शिक्षा चिकित्सा अपशिष्ट वर्गीकरण समस्या को प्रभावी ढंग से हल कर सकती है: नेपाल के चिकित्सा अपशिष्ट प्रबंधन के लिए व्यवहार्य AI समाधान प्रदान करता है
- डेटासेट सीमाएं:
- कुछ श्रेणियों की कमी: कोशिका विषाक्त, रेडियोधर्मी, रोगविज्ञान, रासायनिक और तरल अपशिष्ट
- डेटा सामान्य वस्तुओं (दस्ताने, धुंध) की ओर पक्षपाती है
- गैर-नेपाल वातावरण से एकत्रित डेटा
- व्यावहारिक अनुप्रयोग चुनौतियां:
- वास्तविक वातावरण में अपशिष्ट अस्पष्ट, मिश्रित या अव्यवस्थित पैकेजिंग हो सकता है
- मॉडल जटिल वास्तविक परिदृश्यों में विफल हो सकता है
- डेटा संग्रह विस्तार: अधिक प्रतिनिधि स्थानीय डेटा एकत्रित करना
- लापता श्रेणियों का पूरक: नेपाल मानकों में सभी अपशिष्ट श्रेणियां जोड़ना
- वास्तविक वातावरण परीक्षण: वास्तविक चिकित्सा वातावरण में मॉडल प्रदर्शन को सत्यापित करना
- प्रणाली एकीकरण: मौजूदा अपशिष्ट प्रबंधन प्रणालियों के साथ एकीकृत करना
- उच्च व्यावहारिक मूल्य: नेपाल के चिकित्सा अपशिष्ट प्रबंधन की वास्तविक समस्या को हल करता है
- कठोर पद्धति: स्तरीकृत क्रॉस-सत्यापन और सांख्यिकीय महत्व परीक्षण का उपयोग करता है
- व्यापक मॉडल तुलना: विभिन्न प्रकार के अत्याधुनिक मॉडल को शामिल करता है
- व्यावहारिक तैनाती: उपयोगी वेब एप्लिकेशन प्रदान करता है, अनुसंधान की व्यावहारिकता को बढ़ाता है
- स्थानीयकृत विचार: स्थानीय मानकों के साथ संरेखित, व्यावहारिक अनुप्रयोग मूल्य है
- डेटासेट प्रतिनिधित्व अपर्याप्त: स्थानीयकृत डेटा की कमी, वास्तविक अनुप्रयोग प्रभाव को प्रभावित कर सकता है
- श्रेणी कवरेज अधूरा: नेपाल मानकों में सभी अपशिष्ट श्रेणियों को शामिल नहीं करता है
- वास्तविक वातावरण सत्यापन की कमी: मुख्य रूप से नियंत्रित वातावरण में परीक्षण किया गया
- सीमित तकनीकी नवाचार: मुख्य रूप से मौजूदा मॉडल का अनुप्रयोग और तुलना, पद्धति संबंधी नवाचार की कमी
- क्षेत्र योगदान: विकासशील देशों के चिकित्सा अपशिष्ट प्रबंधन के लिए AI समाधान का उदाहरण प्रदान करता है
- व्यावहारिक मूल्य: नेपाल के चिकित्सा संस्थानों में सीधे लागू किया जा सकता है
- पुनरुत्पादनीयता: डेटासेट और कोड सार्वजनिक हैं, पुनरुत्पादन और विस्तार में सुविधा प्रदान करते हैं
- चिकित्सा संस्थान: अस्पताल, क्लीनिक में अपशिष्ट वर्गीकरण
- अपशिष्ट प्रसंस्करण केंद्र: बड़े पैमाने पर चिकित्सा अपशिष्ट प्रसंस्करण
- नियामक विभाग: अपशिष्ट प्रबंधन अनुपालन जांच
- अन्य विकासशील देश: समान चिकित्सा अपशिष्ट प्रबंधन समस्याएं
पेपर में 16 संबंधित संदर्भ हैं, जो गहन शिक्षा के चिकित्सा अपशिष्ट वर्गीकरण में अनुप्रयोग, IoT अनुप्रयोग, और नेपाल के चिकित्सा अपशिष्ट प्रबंधन की वर्तमान स्थिति आदि पहलुओं के महत्वपूर्ण अनुसंधान को शामिल करते हैं, जो इस अनुसंधान के लिए एक मजबूत सैद्धांतिक आधार और व्यावहारिक संदर्भ प्रदान करते हैं।
समग्र मूल्यांकन: यह एक मजबूत व्यावहारिक मूल्य वाला अनुप्रयोग-उन्मुख अनुसंधान पेपर है। हालांकि तकनीकी नवाचार के मामले में अपेक्षाकृत सीमित है, लेकिन वास्तविक समस्याओं पर इसका ध्यान, कठोर प्रायोगिक डिजाइन और व्यावहारिक तैनाती के प्रयास इसे महत्वपूर्ण सामाजिक मूल्य और अनुप्रयोग संभावनाएं प्रदान करते हैं।