The increasing number of Health Care facilities in Nepal has added up the challenges on managing health care waste (HCW). Improper segregation and disposal of HCW leads to contamination, spreading of infectious diseases and risk for waste handlers. This study benchmarks the state of the art waste classification models: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n and YOLOv5-s using stratified 5-fold cross-validation technique on combined HCW data. YOLOv5-s achieved the highest accuracy (95.06%) but fell short with the YOLOv8-n model in inference speed with few milliseconds. The EfficientNet-B0 showed promising results of 93.22% accuracy but took the highest inference time. Following a repetitive ANOVA test to confirm the statistical significance, the best performing model (YOLOv5-s) was deployed to the web with bin color mapped using Nepal's HCW management standards. Further work is suggested to address data limitation and ensure localized context.
- 논문 ID: 2508.07450
- 제목: Health Care Waste Classification Using Deep Learning Aligned with Nepal's Bin Color Guidelines
- 저자: Suman Kunwar (DWaste, USA), Prabesh Rai (Lambton College, Canada)
- 분류: cs.CV (컴퓨터 비전)
- 발표 시간: 2025년 10월 15일 (arXiv)
- 논문 링크: https://arxiv.org/abs/2508.07450
네팔의 의료보건 시설 수 증가에 따라 의료폐기물(HCW) 관리가 과제로 대두되고 있습니다. 부적절한 분리 및 처리는 오염, 전염병 확산, 폐기물 처리 종사자의 위험을 초래합니다. 본 연구는 계층화된 5-폴드 교차 검증 기법을 사용하여 포괄적인 HCW 데이터에 대해 최첨단 폐기물 분류 모델을 벤치마킹했습니다: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n, YOLOv5-s. YOLOv5-s는 최고 정확도(95.06%)를 달성했으나 추론 속도에서는 YOLOv8-n 모델에 몇 밀리초 뒤졌습니다. EfficientNet-B0은 93.22%의 양호한 결과를 보였으나 추론 시간이 가장 길었습니다. 반복 ANOVA 검정으로 통계적 유의성을 확인한 후, 최고 성능 모델(YOLOv5-s)을 웹에 배포하고 네팔 HCW 관리 표준에 따라 분류 용기 색상을 매핑했습니다.
- 해결해야 할 문제: 네팔은 16,611개의 의료보건 시설을 보유하고 있으며, 의료폐기물 관리가 심각한 과제입니다. 전통적인 수작업 분류 방식은 노동 집약적이고 오류가 발생하기 쉬우며 폐기물 처리 종사자에게 위협이 됩니다.
- 문제의 중요성: 부적절한 의료폐기물 분리 및 처리로 인한 결과:
- 환경 오염
- 전염병 확산
- 폐기물 처리 종사자의 건강 위험
- 병원 주변 주민에 대한 잠재적 해악
- 기존 방법의 한계:
- 소규모 데이터셋
- 낮은 이미지 품질
- 통제된 환경에서의 테스트
- 확장성 및 기반 시설 실현 가능성 문제
- 기존 폐기물 관리 시스템과의 통합 어려움
- 연구 동기: 네팔은 국가 의료폐기물 관리 표준 및 운영 절차를 따르며, 폐기물을 일반 의료폐기물과 위험 의료폐기물로 분류하고 색상 코딩 시스템을 채택하고 있습니다. 본 연구는 네팔 표준을 준수하는 AI 기반 자동화 폐기물 분류 솔루션 개발을 목표로 합니다.
- 다중 모델 벤치마킹: 의료폐기물 분류 작업에서 5가지 최첨단 심층학습 모델을 체계적으로 비교한 첫 연구
- 지역화 적용: 분류 결과를 네팔 의료폐기물 관리 색상 코딩 표준과 정렬
- 포괄적 데이터셋: 두 개의 데이터셋을 통합하여 23개 카테고리의 의료폐기물 커버
- 실제 배포: 최고 성능 모델을 Hugging Face 플랫폼에 배포하여 공중이 사용 가능하도록 함
- 통계적 검증: 반복 ANOVA 검정을 사용하여 모델 성능의 통계적 유의성 확인
입력: 의료폐기물의 RGB 이미지 (1920×1080 해상도)
출력: 23개 카테고리의 폐기물 분류 결과 및 해당 색상 코딩 분류 용기로의 매핑
제약: 네팔 국가 의료폐기물 관리 표준의 색상 코딩 시스템 준수 필수
연구는 5가지 유형의 심층학습 모델을 테스트했습니다:
- ResNeXt-50: 그룹 컨볼루션을 사용하는 잔차 네트워크 변형
- EfficientNet-B0: 정확도와 계산 효율성의 균형을 맞춘 효율적인 CNN 아키텍처
- MobileNetV3-S: 모바일 기기에 적합한 경량 네트워크
- YOLOv8-n: 최신 버전의 YOLO 객체 탐지 모델
- YOLOv5-s: 성숙한 YOLO 모델 변형
훈련 전략:
- 전통적인 CNN 모델 (ResNeXt-50, EfficientNet-B0, MobileNetV3-S): ImageNet 사전 훈련 가중치 사용, 기본 계층 동결, 사용자 정의 분류 헤드 추가
- YOLO 모델: 처음부터 훈련
- 계층화된 K-폴드 교차 검증: 5-폴드 계층화된 교차 검증 사용으로 각 레이블이 모든 폴드에서 동일한 비율 유지
- 데이터 균형 처리:
- 과도 표본 추출 클래스의 경우 중앙값 클래스 계수 값을 사용하여 이미지 감소
- 저표본 추출 클래스의 경우 뒤집기 및 밝기 대비 등의 데이터 증강 기법 사용
- 지역화 매핑: 분류 결과를 네팔 표준 색상 코딩 분류 용기로 직접 매핑
통합 데이터셋 포함:
- Medical Waste Dataset 4.0:
- 출처: 이탈리아 토스카나 지역, OAK 4.0 카메라 기기 사용
- 카테고리: 거즈, 장갑 쌍, 단일 장갑, 의료용 모자, 의료용 안경, 신발 커버 등
- Pharmaceutical and Biomedical Waste dataset:
- 출처: Engineering UBU 수집
- 카테고리: 신체 조직, 유기 폐기물, 장비 포장, 주사기 바늘 등
데이터 전처리:
- 편향 감소를 위해 중복 장갑 카테고리 제거
- 중앙값 클래스 계수를 사용하여 클래스 불균형 처리
- 데이터 증강 기법 적용
- 정확도 (Accuracy)
- 정밀도 (Precision)
- 재현율 (Recall)
- F1 점수 (F1-Score)
- 추론 시간 (Inference Time)
ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n, YOLOv5-s 5개 모델 상호 비교
- 하드웨어: 2개의 NVIDIA Tesla T4 GPU
- 훈련 에포크: 30 에포크
- 교차 검증: 5-폴드 계층화된 교차 검증, 80% 훈련, 20% 검증
| 모델 | 정확도 | 정밀도 | 재현율 | F1 점수 | 추론 시간(ms) |
|---|
| YOLOv5-s | 95.06% | 96.65% | 95.06% | 94.87% | 10.97 |
| YOLOv8-n | 94.68% | 96.44% | 94.68% | 94.57% | 9.29 |
| EfficientNet-B0 | 93.22% | 94.81% | 93.22% | 93.04% | 444.67 |
| MobileNetV3-S | 91.05% | 92.90% | 91.05% | 90.95% | 369.24 |
| ResNeXt-50 | 74.51% | 76.53% | 74.51% | 74.48% | 395.74 |
- YOLOv5-s 최고 성능: 정확도, 정밀도, 재현율, F1 점수 모두에서 최고 점수 획득
- 추론 속도 우위: YOLO 모델(v5-s 및 v8-n)이 다른 모델 대비 추론 시간에서 현저히 우수
- 실용성 트레이드오프: YOLOv8-n이 추론 속도에서 YOLOv5-s를 약간 앞지르나 정확도는 약간 낮음
반복 ANOVA 검정 결과:
- 모델이 성능 지표에 고도로 유의미한 영향을 미침
- 서로 다른 평가 지표 간 유의미한 차이 존재
- 모델과 지표 간의 상호작용이 고도로 유의미함
| 연구 | 카테고리 수 | 최고 성능 모델 | 정확도 |
|---|
| Bruno et al. | 7개 | EfficientNet-B0 | 99.45% |
| 본 연구 | 23개 | YOLOv5-s | 95.06% |
Bruno 등이 7개 카테고리 작업에서 99.45%의 정확도를 달성했지만, 본 연구는 더 도전적인 23개 카테고리 작업에서 95.06%의 정확도를 구현했습니다.
- 의료폐기물 분류에서의 심층학습 적용: ResNeXt-50 및 EfficientNet 등 모델의 응용
- IoT와 AI 결합의 자동화 분류: YOLO 모델과 IoT 기기의 통합
- 실시간 배포 및 엣지 컴퓨팅: 의료 환경에서의 실제 응용
- 더 포괄적인 카테고리 커버: 23개 카테고리 vs 이전 연구의 6-8개 카테고리
- 지역화 표준 정렬: 네팔 국가 표준 준수
- 실제 배포: 사용 가능한 웹 애플리케이션 제공
- YOLOv5-s가 최선의 선택: 정확도 및 종합 성능에서 최고 성능 발휘
- YOLO 모델이 실시간 응용에 적합: 빠른 추론 속도로 실제 배포에 적합
- 심층학습이 의료폐기물 분류 문제를 효과적으로 해결: 네팔 의료폐기물 관리를 위한 실행 가능한 AI 솔루션 제공
- 데이터셋 제한:
- 특정 카테고리 부재: 세포독성, 방사성, 병리학적, 화학 및 액체 폐기물
- 일반적인 물품(장갑, 거즈)에 편향된 데이터
- 네팔 환경 외에서 수집된 데이터
- 실제 응용 과제:
- 실제 환경에서 폐기물이 가려지거나, 혼합되거나, 무질서하게 포장될 수 있음
- 모델이 복잡한 실제 시나리오에서 실패할 수 있음
- 데이터 수집 확대: 더 많은 대표성 있는 현지 데이터 수집
- 누락된 카테고리 보충: 네팔 표준의 모든 폐기물 카테고리 추가
- 실제 환경 테스트: 실제 의료 환경에서 모델 성능 검증
- 시스템 통합: 기존 폐기물 관리 시스템과의 통합
- 높은 실용 가치: 네팔 의료폐기물 관리의 실제 문제 해결
- 엄격한 방법론: 계층화된 교차 검증 및 통계적 유의성 검정 사용
- 포괄적인 모델 비교: 다양한 유형의 최첨단 모델 포함
- 실제 배포: 사용 가능한 웹 애플리케이션 제공으로 연구의 실용성 강화
- 지역화 고려: 현지 표준과의 정렬로 실제 응용 가치 보유
- 데이터셋 대표성 부족: 현지 데이터 부재로 실제 응용 효과에 영향 가능
- 카테고리 커버리지 불완전: 네팔 표준의 모든 폐기물 카테고리 미포함
- 실제 환경 검증 부족: 주로 통제된 환경에서 테스트
- 기술적 혁신 제한: 주로 기존 모델의 응용 및 비교로 방법론적 혁신 부족
- 분야 기여: 개발도상국 의료폐기물 관리를 위한 AI 솔루션 사례 제시
- 실용 가치: 네팔 의료 기관에 직접 적용 가능
- 재현성: 데이터셋 및 코드 공개로 재현 및 확장 용이
- 의료 기관: 병원, 진료소의 폐기물 분류
- 폐기물 처리 센터: 대규모 의료폐기물 처리
- 규제 기관: 폐기물 관리 규정 준수 검사
- 기타 개발도상국: 유사한 의료폐기물 관리 문제
논문은 심층학습의 의료폐기물 분류 응용, IoT 응용, 네팔 의료폐기물 관리 현황 등 관련 분야의 중요 연구 16편을 인용하여 본 연구에 견고한 이론적 기초와 실무적 참고를 제공합니다.
종합 평가: 이는 상당한 실용 가치를 지닌 응용형 연구 논문입니다. 기술적 혁신 측면에서는 상대적으로 제한적이지만, 실제 문제에 대한 관심, 엄격한 실험 설계, 실제 배포 노력으로 인해 중요한 사회적 가치와 응용 전망을 지니고 있습니다.