2025-11-22T00:43:16.565097

Health Care Waste Classification Using Deep Learning Aligned with Nepal's Bin Color Guidelines

Kunwar, Rai

The increasing number of Health Care facilities in Nepal has added up the challenges on managing health care waste (HCW). Improper segregation and disposal of HCW leads to contamination, spreading of infectious diseases and risk for waste handlers. This study benchmarks the state of the art waste classification models: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n and YOLOv5-s using stratified 5-fold cross-validation technique on combined HCW data. YOLOv5-s achieved the highest accuracy (95.06%) but fell short with the YOLOv8-n model in inference speed with few milliseconds. The EfficientNet-B0 showed promising results of 93.22% accuracy but took the highest inference time. Following a repetitive ANOVA test to confirm the statistical significance, the best performing model (YOLOv5-s) was deployed to the web with bin color mapped using Nepal's HCW management standards. Further work is suggested to address data limitation and ensure localized context.

academic

Clasificación de Residuos de Atención Médica Utilizando Aprendizaje Profundo Alineado con las Directrices de Colores de Contenedores de Nepal

Información Básica

ID del Artículo: 2508.07450
Título: Health Care Waste Classification Using Deep Learning Aligned with Nepal's Bin Color Guidelines
Autores: Suman Kunwar (DWaste, USA), Prabesh Rai (Lambton College, Canada)
Clasificación: cs.CV (Visión por Computadora)
Fecha de Publicación: 15 de octubre de 2025 (arXiv)
Enlace del Artículo: https://arxiv.org/abs/2508.07450

Resumen

Con el aumento del número de instalaciones de atención médica en Nepal, la gestión de residuos de atención médica (HCW) enfrenta desafíos significativos. La separación y disposición inadecuadas conducen a contaminación, propagación de enfermedades infecciosas y riesgos para el personal de gestión de residuos. Este estudio realiza un análisis comparativo de modelos de clasificación de residuos de última generación utilizando validación cruzada estratificada de 5 pliegues en un conjunto de datos integral de HCW: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n e YOLOv5-s. YOLOv5-s logra la precisión más alta (95.06%), aunque es ligeramente inferior en velocidad de inferencia al modelo YOLOv8-n por unos milisegundos. EfficientNet-B0 muestra buenos resultados con 93.22%, pero presenta el tiempo de inferencia más largo. Después de confirmar la significancia estadística mediante pruebas ANOVA repetidas, el modelo de mejor desempeño (YOLOv5-s) se implementa en la web y se mapean los colores de contenedores de acuerdo con los estándares de gestión de HCW de Nepal.

Antecedentes de Investigación y Motivación

Problema a Resolver: Nepal cuenta con 16,611 instalaciones de atención médica, enfrentando desafíos severos en la gestión de residuos médicos. Los métodos tradicionales de clasificación manual son intensivos en mano de obra, propensos a errores y representan una amenaza para el personal de gestión de residuos.
Importancia del Problema: La separación y disposición inadecuadas de residuos médicos resultan en:
- Contaminación ambiental
- Propagación de enfermedades infecciosas
- Riesgos para la salud del personal de gestión de residuos
- Posibles daños a los residentes cercanos a hospitales
Limitaciones de Métodos Existentes:
- Tamaños de conjuntos de datos pequeños
- Calidad de imagen deficiente
- Pruebas en entornos controlados
- Problemas de escalabilidad y viabilidad de infraestructura
- Dificultad en la integración con sistemas de gestión de residuos existentes
Motivación de la Investigación: Nepal sigue estándares nacionales de gestión de residuos médicos y procedimientos operativos, clasificando residuos en residuos médicos generales y peligrosos, utilizando un sistema de codificación por colores. El estudio tiene como objetivo desarrollar una solución de clasificación de residuos automatizada impulsada por IA que se alinee con los estándares de Nepal.

Contribuciones Principales

Análisis Comparativo Multimodelo: Primera comparación sistemática de 5 modelos de aprendizaje profundo de última generación en la tarea de clasificación de residuos médicos
Aplicación Localizada: Alineación de resultados de clasificación con el sistema de codificación por colores estándar de gestión de residuos médicos de Nepal
Conjunto de Datos Integral: Integración de dos conjuntos de datos que cubren 23 categorías de residuos médicos
Implementación Práctica: Despliegue del modelo óptimo en la plataforma Hugging Face para uso público
Validación Estadística: Confirmación de la significancia estadística del desempeño del modelo mediante pruebas ANOVA repetidas

Explicación Detallada de Métodos

Definición de Tarea

Entrada: Imágenes RGB de residuos de atención médica (resolución 1920×1080) Salida: Resultados de clasificación de residuos en 23 categorías, mapeados a contenedores de codificación por colores correspondientes Restricciones: Debe cumplir con el sistema de codificación por colores del estándar nacional de gestión de residuos médicos de Nepal

Arquitecturas de Modelos

El estudio prueba 5 tipos diferentes de modelos de aprendizaje profundo:

ResNeXt-50: Variante de red residual que utiliza convoluciones agrupadas
EfficientNet-B0: Arquitectura CNN eficiente que equilibra precisión y eficiencia computacional
MobileNetV3-S: Red ligera adecuada para dispositivos móviles
YOLOv8-n: Versión más reciente del modelo de detección de objetos YOLO
YOLOv5-s: Variante madura del modelo YOLO

Estrategia de Entrenamiento:

Modelos CNN tradicionales (ResNeXt-50, EfficientNet-B0, MobileNetV3-S): Utilización de pesos preentrenados de ImageNet, congelación de capas base, adición de cabezal de clasificación personalizado
Modelos YOLO: Entrenamiento desde cero

Puntos de Innovación Técnica

Validación Cruzada Estratificada K-Fold: Utilización de validación cruzada estratificada de 5 pliegues, asegurando que cada etiqueta mantenga la misma proporción en cada pliegue
Manejo del Equilibrio de Datos:
- Reducción de imágenes en clases sobremuestreadas utilizando valor de conteo de clase mediana
- Aplicación de técnicas de aumento de datos como volteo y contraste de brillo para clases submuestreadas
Mapeo Localizado: Mapeo directo de resultados de clasificación a contenedores de codificación por colores estándar de Nepal

Configuración Experimental

Conjunto de Datos

Conjunto de Datos Combinado que contiene:

Medical Waste Dataset 4.0:
- Fuente: Región de Toscana, Italia, utilizando dispositivo de cámara OAK 4.0
- Categorías: Gasa, pares de guantes, guantes individuales, gorras médicas, gafas médicas, cubrezapatos, etc.
Pharmaceutical and Biomedical Waste dataset:
- Fuente: Recopilado por Engineering UBU
- Categorías: Tejido corporal, residuos orgánicos, empaques de equipos, agujas de jeringa, etc.

Preprocesamiento de Datos:

Eliminación de categorías de guantes duplicadas para reducir sesgos
Manejo del desequilibrio de clases utilizando conteo de clase mediana
Aplicación de técnicas de aumento de datos

Métricas de Evaluación

Precisión (Accuracy)
Exactitud (Precision)
Exhaustividad (Recall)
Puntuación F1 (F1-Score)
Tiempo de Inferencia (Inference Time)

Métodos Comparativos

Comparación mutua de cinco modelos: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n, YOLOv5-s

Detalles de Implementación

Hardware: Dos GPU NVIDIA Tesla T4
Épocas de Entrenamiento: 30 épocas
Validación Cruzada: Validación cruzada estratificada de 5 pliegues, 80% entrenamiento, 20% validación

Resultados Experimentales

Resultados Principales

Modelo	Precisión	Exactitud	Exhaustividad	Puntuación F1	Tiempo de Inferencia (ms)
YOLOv5-s	95.06%	96.65%	95.06%	94.87%	10.97
YOLOv8-n	94.68%	96.44%	94.68%	94.57%	9.29
EfficientNet-B0	93.22%	94.81%	93.22%	93.04%	444.67
MobileNetV3-S	91.05%	92.90%	91.05%	90.95%	369.24
ResNeXt-50	74.51%	76.53%	74.51%	74.48%	395.74

Hallazgos Clave

YOLOv5-s Presenta el Mejor Desempeño: Obtiene las puntuaciones más altas en precisión, exactitud, exhaustividad y puntuación F1
Ventajas de Velocidad de Inferencia: Los modelos YOLO (v5-s y v8-n) muestran ventajas significativas en tiempo de inferencia comparados con otros modelos
Compensación de Practicidad: YOLOv8-n supera ligeramente a YOLOv5-s en velocidad de inferencia, aunque con precisión ligeramente inferior

Validación Estadística

Los resultados de pruebas ANOVA repetidas muestran:

Efecto altamente significativo de los modelos en métricas de desempeño
Diferencias significativas entre diferentes métricas de evaluación
Interacción altamente significativa entre modelos y métricas

Comparación con Trabajos Relacionados

Estudio	Número de Categorías	Modelo Óptimo	Precisión
Bruno et al.	7 categorías	EfficientNet-B0	99.45%
Este Estudio	23 categorías	YOLOv5-s	95.06%

Aunque Bruno et al. logran 99.45% de precisión en una tarea de 7 categorías, este estudio logra 95.06% de precisión en una tarea más desafiante de 23 categorías.

Trabajos Relacionados

Direcciones Principales de Investigación

Aplicación de Aprendizaje Profundo en Clasificación de Residuos Médicos: Aplicación de modelos como ResNeXt-50 y EfficientNet
Integración de IoT e IA en Clasificación Automatizada: Integración de modelos YOLO con dispositivos IoT
Implementación en Tiempo Real y Computación de Borde: Aplicaciones prácticas en entornos médicos

Ventajas de Este Artículo

Cobertura de Categorías Más Completa: 23 categorías vs 6-8 categorías en investigaciones previas
Alineación con Estándares Locales: Cumplimiento con estándares nacionales de Nepal
Implementación Práctica: Proporciona aplicación web disponible

Conclusiones y Discusión

Conclusiones Principales

YOLOv5-s es la Opción Óptima: Presenta el mejor desempeño en precisión y rendimiento integral
Modelos YOLO Adecuados para Aplicaciones en Tiempo Real: Velocidad de inferencia rápida, adecuada para implementación práctica
El Aprendizaje Profundo Resuelve Efectivamente la Clasificación de Residuos Médicos: Proporciona una solución de IA viable para la gestión de residuos médicos en Nepal

Limitaciones

Limitaciones del Conjunto de Datos:
- Falta de ciertas categorías: residuos citotóxicos, radiactivos, patológicos, químicos y líquidos
- Datos sesgados hacia artículos comunes (guantes, gasa)
- Datos recopilados en entornos no nepalíes
Desafíos de Aplicación Práctica:
- Los residuos en entornos reales pueden estar obstruidos, mezclados o empaquetados de manera desordenada
- El modelo puede fallar en escenarios reales complejos

Direcciones Futuras

Expansión de Recopilación de Datos: Recopilación de más datos locales representativos
Complementación de Categorías Faltantes: Adición de todas las categorías de residuos en estándares de Nepal
Pruebas en Entornos Reales: Validación del desempeño del modelo en entornos médicos reales
Integración del Sistema: Integración con sistemas de gestión de residuos existentes

Evaluación Profunda

Fortalezas

Alto Valor Práctico: Resuelve problemas reales en la gestión de residuos médicos de Nepal
Metodología Rigurosa: Utilización de validación cruzada estratificada y pruebas de significancia estadística
Comparación Integral de Modelos: Cobertura de diferentes tipos de modelos de última generación
Implementación Práctica: Proporciona aplicación web disponible, mejorando la practicidad de la investigación
Consideración de Localización: Alineación con estándares locales, con valor de aplicación práctica

Deficiencias

Representatividad Insuficiente del Conjunto de Datos: Falta de datos localizados, que puede afectar la efectividad de aplicación práctica
Cobertura de Categorías Incompleta: No incluye todas las categorías de residuos en estándares de Nepal
Falta de Validación en Entornos Reales: Principalmente pruebas en entornos controlados
Innovación Técnica Limitada: Principalmente aplicación y comparación de modelos existentes, con innovación metodológica limitada

Impacto

Contribución al Campo: Proporciona un ejemplo de solución de IA para gestión de residuos médicos en países en desarrollo
Valor Práctico: Aplicable directamente a instituciones médicas de Nepal
Reproducibilidad: Conjunto de datos y código públicos, facilitando reproducción y extensión

Escenarios Aplicables

Instituciones Médicas: Clasificación de residuos en hospitales y clínicas
Centros de Tratamiento de Residuos: Procesamiento de residuos médicos a gran escala
Departamentos Reguladores: Inspección de cumplimiento en gestión de residuos
Otros Países en Desarrollo: Problemas similares de gestión de residuos médicos

Referencias

El artículo cita 16 referencias relacionadas, cubriendo investigaciones importantes en clasificación de residuos médicos mediante aprendizaje profundo, aplicaciones de IoT, y situación actual de gestión de residuos médicos en Nepal, proporcionando una base teórica sólida y referencias prácticas para esta investigación.

Evaluación General: Este es un artículo de investigación aplicada con fuerte valor práctico. Aunque es relativamente limitado en innovación técnica, su enfoque en problemas reales, diseño experimental riguroso y esfuerzos en implementación práctica le confieren importante valor social y perspectivas de aplicación.