The increasing number of Health Care facilities in Nepal has added up the challenges on managing health care waste (HCW). Improper segregation and disposal of HCW leads to contamination, spreading of infectious diseases and risk for waste handlers. This study benchmarks the state of the art waste classification models: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n and YOLOv5-s using stratified 5-fold cross-validation technique on combined HCW data. YOLOv5-s achieved the highest accuracy (95.06%) but fell short with the YOLOv8-n model in inference speed with few milliseconds. The EfficientNet-B0 showed promising results of 93.22% accuracy but took the highest inference time. Following a repetitive ANOVA test to confirm the statistical significance, the best performing model (YOLOv5-s) was deployed to the web with bin color mapped using Nepal's HCW management standards. Further work is suggested to address data limitation and ensure localized context.
- গবেষণাপত্র আইডি: 2508.07450
- শিরোনাম: Health Care Waste Classification Using Deep Learning Aligned with Nepal's Bin Color Guidelines
- লেখক: Suman Kunwar (DWaste, USA), Prabesh Rai (Lambton College, Canada)
- শ্রেণীবিভাগ: cs.CV (কম্পিউটার ভিশন)
- প্রকাশনার সময়: ২০২৫ সালের ১৫ অক্টোবর (arXiv)
- গবেষণাপত্র লিঙ্ক: https://arxiv.org/abs/2508.07450
নেপালে স্বাস্থ্যসেবা সুবিধার সংখ্যা বৃদ্ধির সাথে সাথে স্বাস্থ্যসেবা বর্জ্য (HCW) ব্যবস্থাপনা চ্যালেঞ্জের সম্মুখীন হচ্ছে। অনুপযুক্ত বিভাজন এবং নিষ্পত্তি দূষণ, সংক্রামক রোগের বিস্তার এবং বর্জ্য প্রক্রিয়াকরণ কর্মীদের ঝুঁকি সৃষ্টি করে। এই গবেষণা স্তরযুক্ত ৫-ফোল্ড ক্রস-ভ্যালিডেশন কৌশল ব্যবহার করে ব্যাপক HCW ডেটায় অত্যাধুনিক বর্জ্য শ্রেণীবিভাগ মডেলগুলি বেঞ্চমার্ক করেছে: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n এবং YOLOv5-s। YOLOv5-s সর্বোচ্চ নির্ভুলতা (95.06%) অর্জন করেছে, কিন্তু অনুমান গতিতে YOLOv8-n মডেলের চেয়ে কয়েক মিলিসেকেন্ড পিছিয়ে রয়েছে। EfficientNet-B0 93.22% এর ভাল ফলাফল দেখিয়েছে, কিন্তু অনুমান সময় সবচেয়ে বেশি। পুনরাবৃত্ত ANOVA পরীক্ষার মাধ্যমে পরিসংখ্যানগত তাৎপর্য নিশ্চিত করার পরে, সর্বোত্তম কর্মক্ষমতা মডেল (YOLOv5-s) ওয়েবে স্থাপন করা হয়েছে এবং নেপালের HCW ব্যবস্থাপনা মান অনুযায়ী বিন রঙ ম্যাপ করা হয়েছে।
- সমাধানের জন্য সমস্যা: নেপালে 16,611টি স্বাস্থ্যসেবা সুবিধা রয়েছে এবং স্বাস্থ্যসেবা বর্জ্য ব্যবস্থাপনা গুরুতর চ্যালেঞ্জের সম্মুখীন। ঐতিহ্যবাহী ম্যানুয়াল শ্রেণীবিভাগ পদ্ধতি শ্রম-নিবিড়, ত্রুটিপ্রবণ এবং বর্জ্য প্রক্রিয়াকরণ কর্মীদের জন্য হুমকিস্বরূপ।
- সমস্যার গুরুত্ব: অনুপযুক্ত স্বাস্থ্যসেবা বর্জ্য বিভাজন এবং নিষ্পত্তি নিম্নলিখিত ফলাফল দেয়:
- পরিবেশগত দূষণ
- সংক্রামক রোগের বিস্তার
- বর্জ্য প্রক্রিয়াকরণ কর্মীদের স্বাস্থ্য ঝুঁকি
- হাসপাতালের চারপাশের বাসিন্দাদের সম্ভাব্য ক্ষতি
- বিদ্যমান পদ্ধতির সীমাবদ্ধতা:
- ডেটাসেটের ছোট আকার
- দুর্বল ছবির গুণমান
- নিয়ন্ত্রিত পরিবেশ পরীক্ষা
- স্কেলেবিলিটি এবং অবকাঠামো সম্ভাব্যতার সমস্যা
- বিদ্যমান বর্জ্য ব্যবস্থাপনা সিস্টেমের সাথে একীকরণের কঠিনতা
- গবেষণা প্রেরণা: নেপাল জাতীয় স্বাস্থ্যসেবা বর্জ্য ব্যবস্থাপনা মান এবং অপারেশনাল পদ্ধতি অনুসরণ করে, বর্জ্যকে সাধারণ স্বাস্থ্যসেবা বর্জ্য এবং বিপজ্জনক স্বাস্থ্যসেবা বর্জ্যে বিভক্ত করে এবং রঙ কোডিং সিস্টেম ব্যবহার করে। গবেষণার লক্ষ্য নেপালের মান মেনে চলে এমন AI-চালিত স্বয়ংক্রিয় বর্জ্য শ্রেণীবিভাগ সমাধান বিকাশ করা।
- বহু-মডেল বেঞ্চমার্কিং: স্বাস্থ্যসেবা বর্জ্য শ্রেণীবিভাগ কাজে ৫টি অত্যাধুনিক গভীর শিক্ষা মডেলের প্রথম সিস্টেমেটিক তুলনা
- স্থানীয়করণ প্রয়োগ: শ্রেণীবিভাগ ফলাফলকে নেপালের স্বাস্থ্যসেবা বর্জ্য ব্যবস্থাপনা রঙ কোডিং মানের সাথে সংযুক্ত করা
- ব্যাপক ডেটাসেট: দুটি ডেটাসেট একীভূত করে 23টি বিভাগের স্বাস্থ্যসেবা বর্জ্য কভার করা
- বাস্তব স্থাপনা: সর্বোত্তম মডেল Hugging Face প্ল্যাটফর্মে জনসাধারণের ব্যবহারের জন্য স্থাপন করা
- পরিসংখ্যানগত যাচাইকরণ: মডেল কর্মক্ষমতার পরিসংখ্যানগত তাৎপর্য নিশ্চিত করতে পুনরাবৃত্ত ANOVA পরীক্ষা ব্যবহার করা
ইনপুট: স্বাস্থ্যসেবা বর্জ্যের RGB ছবি (1920×1080 রেজোলিউশন)
আউটপুট: 23টি বিভাগের বর্জ্য শ্রেণীবিভাগ ফলাফল এবং সংশ্লিষ্ট রঙ কোডিং বিনে ম্যাপিং
সীমাবদ্ধতা: নেপালের জাতীয় স্বাস্থ্যসেবা বর্জ্য ব্যবস্থাপনা মানের রঙ কোডিং সিস্টেম মেনে চলতে হবে
গবেষণা ৫টি ভিন্ন ধরনের গভীর শিক্ষা মডেল পরীক্ষা করেছে:
- ResNeXt-50: অবশিষ্ট নেটওয়ার্ক ভেরিয়েন্ট, গ্রুপ কনভোলিউশন ব্যবহার করে
- EfficientNet-B0: দক্ষ CNN আর্কিটেকচার, নির্ভুলতা এবং গণনামূলক দক্ষতার ভারসাম্য
- MobileNetV3-S: হালকা ওজনের নেটওয়ার্ক, মোবাইল ডিভাইসের জন্য উপযুক্ত
- YOLOv8-n: YOLO লক্ষ্য সনাক্তকরণ মডেলের সর্বশেষ সংস্করণ
- YOLOv5-s: পরিপক্ক YOLO মডেল ভেরিয়েন্ট
প্রশিক্ষণ কৌশল:
- ঐতিহ্যবাহী CNN মডেল (ResNeXt-50, EfficientNet-B0, MobileNetV3-S): ImageNet প্রাক-প্রশিক্ষিত ওজন ব্যবহার করে, ভিত্তি স্তর হিমায়িত করে, কাস্টম শ্রেণীবিভাগ মাথা যোগ করা
- YOLO মডেল: শুরু থেকে প্রশিক্ষণ
- স্তরযুক্ত K-ফোল্ড ক্রস-ভ্যালিডেশন: ৫-ফোল্ড স্তরযুক্ত ক্রস-ভ্যালিডেশন ব্যবহার করে, প্রতিটি লেবেল সমস্ত ফোল্ডে একই অনুপাত বজায় রাখা নিশ্চিত করা
- ডেটা ভারসাম্য প্রক্রিয়াকরণ:
- অতিরিক্ত নমুনা শ্রেণীর জন্য মধ্যম শ্রেণী গণনা মান ব্যবহার করে ছবি হ্রাস করা
- কম নমুনা শ্রেণীর জন্য ফ্লিপিং এবং উজ্জ্বলতা বৈসাদৃশ্য ডেটা বর্ধন কৌশল ব্যবহার করা
- স্থানীয়করণ ম্যাপিং: শ্রেণীবিভাগ ফলাফল সরাসরি নেপাল মানের রঙ কোডিং বিনে ম্যাপ করা
সমন্বিত ডেটাসেট নিম্নলিখিত অন্তর্ভুক্ত করে:
- Medical Waste Dataset 4.0:
- উৎস: ইতালির টাস্কানি অঞ্চল, OAK 4.0 ক্যামেরা ডিভাইস ব্যবহার করে
- বিভাগ: গজ, গ্লাভস জোড়া, একক গ্লাভস, চিকিৎসা টুপি, চিকিৎসা চশমা, জুতার কভার ইত্যাদি
- Pharmaceutical and Biomedical Waste dataset:
- উৎস: Engineering UBU দ্বারা সংগৃহীত
- বিভাগ: শরীরের টিস্যু, জৈব বর্জ্য, সরঞ্জাম প্যাকেজিং, সিরিঞ্জ সুই ইত্যাদি
ডেটা প্রাক-প্রক্রিয়াকরণ:
- পক্ষপাত হ্রাস করতে সদৃশ গ্লাভস বিভাগ অপসারণ করা
- বিভাগ ভারসাম্যহীনতা পরিচালনা করতে মধ্যম বিভাগ গণনা ব্যবহার করা
- ডেটা বর্ধন কৌশল প্রয়োগ করা
- নির্ভুলতা (Accuracy)
- নির্ভুলতা (Precision)
- স্মরণ (Recall)
- F1 স্কোর (F1-Score)
- অনুমান সময় (Inference Time)
ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n, YOLOv5-s পাঁচটি মডেল পারস্পরিক তুলনা
- হার্ডওয়্যার: দুটি NVIDIA Tesla T4 GPU
- প্রশিক্ষণ যুগ: 30টি epoch
- ক্রস-ভ্যালিডেশন: ৫-ফোল্ড স্তরযুক্ত ক্রস-ভ্যালিডেশন, 80% প্রশিক্ষণ, 20% যাচাইকরণ
| মডেল | নির্ভুলতা | নির্ভুলতা | স্মরণ | F1 স্কোর | অনুমান সময় (ms) |
|---|
| YOLOv5-s | 95.06% | 96.65% | 95.06% | 94.87% | 10.97 |
| YOLOv8-n | 94.68% | 96.44% | 94.68% | 94.57% | 9.29 |
| EfficientNet-B0 | 93.22% | 94.81% | 93.22% | 93.04% | 444.67 |
| MobileNetV3-S | 91.05% | 92.90% | 91.05% | 90.95% | 369.24 |
| ResNeXt-50 | 74.51% | 76.53% | 74.51% | 74.48% | 395.74 |
- YOLOv5-s সর্বোত্তম কর্মক্ষমতা: নির্ভুলতা, নির্ভুলতা, স্মরণ এবং F1 স্কোরে সর্বোচ্চ স্কোর অর্জন করেছে
- অনুমান গতির সুবিধা: YOLO মডেল (v5-s এবং v8-n) অনুমান সময়ে অন্যান্য মডেলের চেয়ে উল্লেখযোগ্যভাবে ভাল
- ব্যবহারিক ভারসাম্য: YOLOv8-n অনুমান গতিতে YOLOv5-s এর চেয়ে সামান্য ভাল, কিন্তু নির্ভুলতা সামান্য কম
পুনরাবৃত্ত ANOVA পরীক্ষার ফলাফল দেখায়:
- মডেল কর্মক্ষমতা সূচকে উচ্চ মাত্রার উল্লেখযোগ্য প্রভাব ফেলে
- বিভিন্ন মূল্যায়ন মেট্রিক্সের মধ্যে উল্লেখযোগ্য পার্থক্য বিদ্যমান
- মডেল এবং মেট্রিক্সের মিথস্ক্রিয়া অত্যন্ত উল্লেখযোগ্য
| গবেষণা | বিভাগ সংখ্যা | সর্বোত্তম মডেল | নির্ভুলতা |
|---|
| Bruno et al. | 7টি | EfficientNet-B0 | 99.45% |
| এই গবেষণা | 23টি | YOLOv5-s | 95.06% |
যদিও Bruno এবং অন্যরা 7টি বিভাগের কাজে 99.45% নির্ভুলতা অর্জন করেছেন, এই গবেষণা আরও চ্যালেঞ্জিং 23টি বিভাগের কাজে 95.06% নির্ভুলতা অর্জন করেছে।
- স্বাস্থ্যসেবা বর্জ্য শ্রেণীবিভাগে গভীর শিক্ষার প্রয়োগ: ResNeXt-50 এবং EfficientNet এর মতো মডেলের প্রয়োগ
- IoT এবং AI সমন্বয়ের স্বয়ংক্রিয় বাছাই: YOLO মডেল এবং IoT ডিভাইসের একীকরণ
- রিয়েল-টাইম স্থাপনা এবং এজ কম্পিউটিং: চিকিৎসা পরিবেশে ব্যবহারিক প্রয়োগ
- আরও ব্যাপক বিভাগ কভারেজ: 23টি বিভাগ বনাম পূর্ববর্তী গবেষণার 6-8টি বিভাগ
- স্থানীয়করণ মান সংযোগ: নেপালের জাতীয় মান মেনে চলা
- বাস্তব স্থাপনা: ব্যবহারযোগ্য ওয়েব অ্যাপ্লিকেশন প্রদান করা
- YOLOv5-s সর্বোত্তম পছন্দ: নির্ভুলতা এবং সামগ্রিক কর্মক্ষমতায় সর্বোত্তম পারফরম্যান্স
- YOLO মডেল রিয়েল-টাইম প্রয়োগের জন্য উপযুক্ত: দ্রুত অনুমান গতি, বাস্তব স্থাপনার জন্য উপযুক্ত
- গভীর শিক্ষা স্বাস্থ্যসেবা বর্জ্য শ্রেণীবিভাগ সমস্যা কার্যকরভাবে সমাধান করতে পারে: নেপালের স্বাস্থ্যসেবা বর্জ্য ব্যবস্থাপনার জন্য সম্ভাব্য AI সমাধান প্রদান করেছে
- ডেটাসেট সীমাবদ্ধতা:
- কিছু বিভাগের অভাব: সাইটোটক্সিক, তেজস্ক্রিয়, প্যাথোলজিক্যাল, রাসায়নিক এবং তরল বর্জ্য
- ডেটা সাধারণ বস্তুর দিকে পক্ষপাতী (গ্লাভস, গজ)
- অ-নেপালি পরিবেশে সংগৃহীত ডেটা
- বাস্তব প্রয়োগ চ্যালেঞ্জ:
- বাস্তব পরিবেশে বর্জ্য অবরুদ্ধ, মিশ্রিত বা বিশৃঙ্খল প্যাকেজিং হতে পারে
- মডেল জটিল বাস্তব পরিস্থিতিতে ব্যর্থ হতে পারে
- ডেটা সংগ্রহ সম্প্রসারণ: আরও প্রতিনিধিত্বমূলক স্থানীয় ডেটা সংগ্রহ করা
- অনুপস্থিত বিভাগ সম্পূরক: নেপাল মানে সমস্ত বর্জ্য বিভাগ যোগ করা
- বাস্তব পরিবেশ পরীক্ষা: প্রকৃত চিকিৎসা পরিবেশে মডেল কর্মক্ষমতা যাচাই করা
- সিস্টেম একীকরণ: বিদ্যমান বর্জ্য ব্যবস্থাপনা সিস্টেমের সাথে একীভূত করা
- উচ্চ ব্যবহারিক মূল্য: নেপালের স্বাস্থ্যসেবা বর্জ্য ব্যবস্থাপনার বাস্তব সমস্যা সমাধান করেছে
- কঠোর পদ্ধতিবিদ্যা: স্তরযুক্ত ক্রস-ভ্যালিডেশন এবং পরিসংখ্যানগত তাৎপর্য পরীক্ষা ব্যবহার করা
- ব্যাপক মডেল তুলনা: বিভিন্ন ধরনের অত্যাধুনিক মডেল অন্তর্ভুক্ত করা
- বাস্তব স্থাপনা: ব্যবহারযোগ্য ওয়েব অ্যাপ্লিকেশন প্রদান করে গবেষণার ব্যবহারিকতা বৃদ্ধি করেছে
- স্থানীয়করণ বিবেচনা: স্থানীয় মানের সাথে সংযুক্ত, বাস্তব প্রয়োগ মূল্য রয়েছে
- ডেটাসেট প্রতিনিধিত্ব অপর্যাপ্ত: স্থানীয় ডেটার অভাব, বাস্তব প্রয়োগ প্রভাব ফেলতে পারে
- বিভাগ কভারেজ অসম্পূর্ণ: নেপাল মানে সমস্ত বর্জ্য বিভাগ অন্তর্ভুক্ত নয়
- বাস্তব পরিবেশ যাচাইকরণ অভাব: প্রধানত নিয়ন্ত্রিত পরিবেশে পরীক্ষা করা হয়েছে
- সীমিত প্রযুক্তিগত উদ্ভাবন: প্রধানত বিদ্যমান মডেলের প্রয়োগ এবং তুলনা, পদ্ধতিগত উদ্ভাবনের অভাব
- ক্ষেত্র অবদান: উন্নয়নশীল দেশের স্বাস্থ্যসেবা বর্জ্য ব্যবস্থাপনার জন্য AI সমাধানের উদাহরণ প্রদান করেছে
- ব্যবহারিক মূল্য: নেপালের চিকিৎসা প্রতিষ্ঠানে সরাসরি প্রয়োগ করা যায়
- পুনরুৎপাদনযোগ্যতা: ডেটাসেট এবং কোড প্রকাশ্য, পুনরুৎপাদন এবং সম্প্রসারণ সহজ করে
- চিকিৎসা প্রতিষ্ঠান: হাসপাতাল, ক্লিনিকের বর্জ্য শ্রেণীবিভাগ
- বর্জ্য প্রক্রিয়াকরণ কেন্দ্র: বড় আকারের স্বাস্থ্যসেবা বর্জ্য প্রক্রিয়াকরণ
- নিয়ন্ত্রক সংস্থা: বর্জ্য ব্যবস্থাপনা সম্মতি পরীক্ষা
- অন্যান্য উন্নয়নশীল দেশ: অনুরূপ স্বাস্থ্যসেবা বর্জ্য ব্যবস্থাপনা সমস্যা
গবেষণাপত্র 16টি সম্পর্কিত সংদর্ভ উদ্ধৃত করেছে, যা স্বাস্থ্যসেবা বর্জ্য শ্রেণীবিভাগে গভীর শিক্ষা, IoT প্রয়োগ এবং নেপালের স্বাস্থ্যসেবা বর্জ্য ব্যবস্থাপনার বর্তমান অবস্থা সহ গুরুত্বপূর্ণ গবেষণা অন্তর্ভুক্ত করে, এই গবেষণার জন্য দৃঢ় তাত্ত্বিক ভিত্তি এবং ব্যবহারিক সংদর্ভ প্রদান করে।
সামগ্রিক মূল্যায়ন: এটি একটি শক্তিশালী ব্যবহারিক মূল্য সহ একটি প্রয়োগ-ভিত্তিক গবেষণা গবেষণাপত্র, যদিও প্রযুক্তিগত উদ্ভাবনের দিক থেকে তুলনামূলকভাবে সীমিত, তবে বাস্তব সমস্যার প্রতি মনোযোগ, কঠোর পরীক্ষামূলক ডিজাইন এবং বাস্তব স্থাপনার প্রচেষ্টা এটিকে গুরুত্বপূর্ণ সামাজিক মূল্য এবং প্রয়োগ সম্ভাবনা প্রদান করে।