2025-11-22T00:43:16.565097

Health Care Waste Classification Using Deep Learning Aligned with Nepal's Bin Color Guidelines

Kunwar, Rai

The increasing number of Health Care facilities in Nepal has added up the challenges on managing health care waste (HCW). Improper segregation and disposal of HCW leads to contamination, spreading of infectious diseases and risk for waste handlers. This study benchmarks the state of the art waste classification models: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n and YOLOv5-s using stratified 5-fold cross-validation technique on combined HCW data. YOLOv5-s achieved the highest accuracy (95.06%) but fell short with the YOLOv8-n model in inference speed with few milliseconds. The EfficientNet-B0 showed promising results of 93.22% accuracy but took the highest inference time. Following a repetitive ANOVA test to confirm the statistical significance, the best performing model (YOLOv5-s) was deployed to the web with bin color mapped using Nepal's HCW management standards. Further work is suggested to address data limitation and ensure localized context.

academic

تصنيف نفايات الرعاية الصحية باستخدام التعلم العميق متوافق مع إرشادات ألوان الصناديق في نيبال

المعلومات الأساسية

معرّف الورقة: 2508.07450
العنوان: تصنيف نفايات الرعاية الصحية باستخدام التعلم العميق متوافق مع إرشادات ألوان الصناديق في نيبال
المؤلفون: سومان كونوار (DWaste، الولايات المتحدة)، برابيش راي (كلية لامبتون، كندا)
التصنيف: cs.CV (رؤية الحاسوب)
تاريخ النشر: 15 أكتوبر 2025 (arXiv)
رابط الورقة: https://arxiv.org/abs/2508.07450

الملخص

مع زيادة عدد منشآت الرعاية الصحية في نيبال، تواجه إدارة نفايات الرعاية الصحية (HCW) تحديات كبيرة. يؤدي الفصل والتخلص غير السليم إلى التلوث وانتشار الأمراض المعدية والمخاطر على عمال معالجة النفايات. تستخدم هذه الدراسة تقنية التحقق المتقاطع الطبقي بخمس طيات لمقارنة نماذج تصنيف النفايات المتقدمة على بيانات شاملة لنفايات الرعاية الصحية: ResNeXt-50 و EfficientNet-B0 و MobileNetV3-S و YOLOv8-n و YOLOv5-s. حقق YOLOv5-s أعلى دقة (95.06%)، لكنه أبطأ قليلاً من نموذج YOLOv8-n في سرعة الاستدلال. أظهر EfficientNet-B0 نتائج جيدة بنسبة 93.22%، لكن وقت الاستدلال كان الأطول. بعد تأكيد الأهمية الإحصائية من خلال اختبار ANOVA المتكرر، تم نشر نموذج الأداء الأفضل (YOLOv5-s) على الويب وتم ربط ألوان الصناديق وفقاً لمعايير إدارة نفايات الرعاية الصحية في نيبال.

خلفية البحث والدافع

المشكلة المراد حلها: تمتلك نيبال 16,611 منشأة رعاية صحية، وتواجه إدارة نفايات الرعاية الصحية تحديات شديدة. تتطلب طرق الفصل اليدوية التقليدية عملاً مكثفاً وعرضة للأخطاء وتشكل تهديداً لعمال معالجة النفايات.
أهمية المشكلة: يؤدي الفصل والتخلص غير السليم من نفايات الرعاية الصحية إلى:
- التلوث البيئي
- انتشار الأمراض المعدية
- المخاطر الصحية على عمال النفايات
- الأضرار المحتملة على السكان المحيطين بالمستشفيات
قيود الطرق الموجودة:
- حجم مجموعات البيانات صغير
- جودة الصور منخفضة
- الاختبار في بيئات محكومة
- مشاكل قابلية التوسع والجدوى الأساسية
- صعوبة التكامل مع الأنظمة الموجودة لإدارة النفايات
دافع البحث: تتبع نيبال معايير إدارة نفايات الرعاية الصحية الوطنية والإجراءات التشغيلية، وتقسم النفايات إلى نفايات رعاية صحية عامة وخطرة، وتستخدم نظام ترميز بالألوان. يهدف البحث إلى تطوير حل تصنيف نفايات مؤتمت يعتمد على الذكاء الاصطناعي يتوافق مع معايير نيبال.

المساهمات الأساسية

مقارنة نماذج متعددة: أول مقارنة منهجية لخمسة نماذج تعلم عميق متقدمة على مهمة تصنيف نفايات الرعاية الصحية
التطبيق المحلي: محاذاة نتائج التصنيف مع معايير نظام ترميز الألوان لإدارة نفايات الرعاية الصحية في نيبال
مجموعة بيانات شاملة: دمج مجموعتي بيانات تغطي 23 فئة من نفايات الرعاية الصحية
النشر العملي: نشر أفضل نموذج على منصة Hugging Face للاستخدام العام
التحقق الإحصائي: استخدام اختبار ANOVA المتكرر لتأكيد الأهمية الإحصائية لأداء النموذج

شرح الطريقة

تعريف المهمة

الإدخال: صور RGB لنفايات الرعاية الصحية (دقة 1920×1080) الإخراج: نتائج تصنيف النفايات في 23 فئة مع ربطها بصناديق ترميز الألوان المقابلة القيود: يجب أن تتوافق مع نظام ترميز الألوان في معايير إدارة نفايات الرعاية الصحية الوطنية في نيبال

معمارية النموذج

اختبرت الدراسة خمسة أنواع مختلفة من نماذج التعلم العميق:

ResNeXt-50: متغير شبكة البقايا، يستخدم الالتفاف المجموع
EfficientNet-B0: معمارية CNN فعالة، توازن بين الدقة والكفاءة الحسابية
MobileNetV3-S: شبكة خفيفة الوزن، مناسبة للأجهزة المحمولة
YOLOv8-n: أحدث إصدار من نموذج الكشف عن الأجسام YOLO
YOLOv5-s: متغير نموذج YOLO الناضج

استراتيجية التدريب:

نماذج CNN التقليدية (ResNeXt-50 و EfficientNet-B0 و MobileNetV3-S): استخدام أوزان ImageNet المدربة مسبقاً، تجميد الطبقات الأساسية، إضافة رأس تصنيف مخصص
نماذج YOLO: التدريب من الصفر

نقاط الابتكار التقني

التحقق المتقاطع الطبقي K-Fold: استخدام التحقق المتقاطع الطبقي بخمس طيات لضمان الحفاظ على نفس نسبة كل تسمية عبر الطيات
معالجة توازن البيانات:
- استخدام قيمة عدد الفئة الوسيطة لتقليل الصور للفئات المفرطة في الأخذ
- استخدام تقنيات تعزيز البيانات مثل الانقلاب والسطوع والتباين للفئات الناقصة
الربط المحلي: ربط نتائج التصنيف مباشرة بصناديق ترميز الألوان المعيارية في نيبال

إعداد التجربة

مجموعة البيانات

مجموعة البيانات المدمجة تحتوي على:

مجموعة بيانات النفايات الطبية 4.0:
- المصدر: منطقة توسكانيا بإيطاليا، باستخدام جهاز كاميرا OAK 4.0
- الفئات: الشاش، أزواج القفازات، قفاز واحد، القبعات الطبية، النظارات الطبية، أغطية الأحذية وغيرها
مجموعة بيانات النفايات الصيدلانية والطبية الحيوية:
- المصدر: جمعتها هندسة UBU
- الفئات: أنسجة الجسم، النفايات العضوية، تغليف المعدات، إبر المحاقن وغيرها

معالجة البيانات المسبقة:

إزالة فئات القفازات المكررة لتقليل الانحياز
استخدام عدد الفئة الوسيطة للتعامل مع عدم التوازن بين الفئات
تطبيق تقنيات تعزيز البيانات

مقاييس التقييم

الدقة (Accuracy)
الدقة (Precision)
الاستدعاء (Recall)
درجة F1 (F1-Score)
وقت الاستدلال (Inference Time)

الطرق المقارنة

مقارنة متبادلة بين خمسة نماذج: ResNeXt-50 و EfficientNet-B0 و MobileNetV3-S و YOLOv8-n و YOLOv5-s

تفاصيل التنفيذ

الأجهزة: وحدتا معالجة رسومات NVIDIA Tesla T4
عدد الحقب: 30 حقبة
التحقق المتقاطع: التحقق المتقاطع الطبقي بخمس طيات، 80% للتدريب، 20% للتحقق

نتائج التجربة

النتائج الرئيسية

النموذج	الدقة	الدقة	الاستدعاء	درجة F1	وقت الاستدلال (ms)
YOLOv5-s	95.06%	96.65%	95.06%	94.87%	10.97
YOLOv8-n	94.68%	96.44%	94.68%	94.57%	9.29
EfficientNet-B0	93.22%	94.81%	93.22%	93.04%	444.67
MobileNetV3-S	91.05%	92.90%	91.05%	90.95%	369.24
ResNeXt-50	74.51%	76.53%	74.51%	74.48%	395.74

النتائج الرئيسية

أداء YOLOv5-s الأفضل: حقق أعلى الدرجات في الدقة والدقة والاستدعاء ودرجة F1
مزايا سرعة الاستدلال: نماذج YOLO (v5-s و v8-n) تتفوق بشكل كبير على النماذج الأخرى في وقت الاستدلال
المقايضة العملية: YOLOv8-n يتفوق قليلاً على YOLOv5-s في سرعة الاستدلال، لكن الدقة أقل قليلاً

التحقق الإحصائي

أظهرت نتائج اختبار ANOVA المتكرر:

تأثير عالي الأهمية للنموذج على مؤشرات الأداء
وجود فروقات ذات دلالة إحصائية بين مقاييس التقييم المختلفة
التفاعل بين النموذج والمؤشرات له أهمية عالية جداً

المقارنة مع الأعمال ذات الصلة

الدراسة	عدد الفئات	أفضل نموذج	الدقة
Bruno وآخرون	7 فئات	EfficientNet-B0	99.45%
هذه الدراسة	23 فئة	YOLOv5-s	95.06%

على الرغم من أن Bruno وآخرين حققوا دقة 99.45% في مهمة 7 فئات، حققت هذه الدراسة دقة 95.06% في مهمة أكثر تحدياً بـ 23 فئة.

الأعمال ذات الصلة

الاتجاهات البحثية الرئيسية

تطبيق التعلم العميق في تصنيف نفايات الرعاية الصحية: تطبيق نماذج مثل ResNeXt-50 و EfficientNet
دمج إنترنت الأشياء والذكاء الاصطناعي للفرز الآلي: تكامل نماذج YOLO مع أجهزة إنترنت الأشياء
النشر في الوقت الفعلي والحوسبة الطرفية: التطبيقات العملية في البيئات الطبية

مزايا هذه الورقة

تغطية فئات أكثر شمولاً: 23 فئة مقابل 6-8 فئات في الدراسات السابقة
محاذاة المعايير المحلية: التوافق مع المعايير الوطنية في نيبال
النشر العملي: توفير تطبيق ويب قابل للاستخدام

الخلاصة والنقاش

الاستنتاجات الرئيسية

YOLOv5-s هو الخيار الأفضل: يظهر أداء مثلى في الدقة والأداء الشاملة
نماذج YOLO مناسبة للتطبيقات في الوقت الفعلي: سرعة استدلال سريعة، مناسبة للنشر العملي
يمكن للتعلم العميق حل مشكلة تصنيف نفايات الرعاية الصحية بفعالية: توفير حل ذكاء اصطناعي قابل للتطبيق لإدارة نفايات الرعاية الصحية في نيبال

القيود

قيود مجموعة البيانات:
- نقص بعض الفئات: النفايات السامة للخلايا والمشعة والمرضية والكيميائية والسائلة
- انحياز البيانات نحو الأشياء الشائعة (القفازات والشاش)
- البيانات المجمعة من بيئات غير نيبالية
تحديات التطبيق العملي:
- قد تكون النفايات في البيئات الحقيقية مخفية أو مختلطة أو معبأة بشكل فوضوي
- قد يفشل النموذج في السيناريوهات الحقيقية المعقدة

الاتجاهات المستقبلية

توسيع جمع البيانات: جمع المزيد من البيانات المحلية الممثلة
استكمال الفئات الناقصة: إضافة جميع فئات النفايات في معايير نيبال
الاختبار في البيئات الحقيقية: التحقق من أداء النموذج في بيئات طبية حقيقية
تكامل النظام: دمج النموذج مع الأنظمة الموجودة لإدارة النفايات

التقييم المتعمق

المزايا

قيمة عملية عالية: حل مشكلة فعلية في إدارة نفايات الرعاية الصحية في نيبال
منهجية صارمة: استخدام التحقق المتقاطع الطبقي واختبارات الأهمية الإحصائية
مقارنة نماذج شاملة: تغطي أنواعاً مختلفة من النماذج المتقدمة
النشر العملي: توفير تطبيق ويب قابل للاستخدام، مما يعزز القيمة العملية للبحث
الاعتبارات المحلية: المحاذاة مع المعايير المحلية، ذات قيمة تطبيقية فعلية

أوجه القصور

عدم كفاية تمثيل مجموعة البيانات: نقص البيانات المحلية، قد يؤثر على فعالية التطبيق العملي
عدم اكتمال تغطية الفئات: عدم تضمين جميع فئات النفايات في معايير نيبال
نقص التحقق في البيئات الحقيقية: الاختبار بشكل أساسي في بيئات محكومة
ابتكار تقني محدود: في الأساس تطبيق ومقارنة للنماذج الموجودة، يفتقر إلى الابتكار المنهجي

التأثير

المساهمة في المجال: توفير نموذج حل ذكاء اصطناعي لإدارة نفايات الرعاية الصحية في الدول النامية
القيمة العملية: يمكن تطبيقها مباشرة على منشآت الرعاية الصحية في نيبال
إمكانية التكرار: مجموعات البيانات والأكواد مفتوحة، مما يسهل التكرار والتوسع

السيناريوهات المطبقة

منشآت الرعاية الصحية: تصنيف النفايات في المستشفيات والعيادات
مراكز معالجة النفايات: معالجة نفايات الرعاية الصحية على نطاق واسع
الجهات التنظيمية: فحص الامتثال لإدارة النفايات
الدول النامية الأخرى: مشاكل إدارة نفايات الرعاية الصحية المماثلة

المراجع

تستشهد الورقة بـ 16 مرجعاً ذا صلة، تغطي تطبيقات التعلم العميق في تصنيف نفايات الرعاية الصحية وتطبيقات إنترنت الأشياء والحالة الحالية لإدارة نفايات الرعاية الصحية في نيبال وغيرها، مما يوفر أساساً نظرياً وعملياً متيناً لهذا البحث.

التقييم الإجمالي: هذه ورقة بحثية تطبيقية ذات قيمة عملية قوية. على الرغم من أن الابتكار التقني محدود نسبياً، فإن تركيزها على المشاكل الفعلية والتصميم التجريبي الصارم والجهود المبذولة في النشر العملي تمنحها قيمة اجتماعية وآفاق تطبيقية مهمة.