2025-11-22T00:43:16.565097

Health Care Waste Classification Using Deep Learning Aligned with Nepal's Bin Color Guidelines

Kunwar, Rai
The increasing number of Health Care facilities in Nepal has added up the challenges on managing health care waste (HCW). Improper segregation and disposal of HCW leads to contamination, spreading of infectious diseases and risk for waste handlers. This study benchmarks the state of the art waste classification models: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n and YOLOv5-s using stratified 5-fold cross-validation technique on combined HCW data. YOLOv5-s achieved the highest accuracy (95.06%) but fell short with the YOLOv8-n model in inference speed with few milliseconds. The EfficientNet-B0 showed promising results of 93.22% accuracy but took the highest inference time. Following a repetitive ANOVA test to confirm the statistical significance, the best performing model (YOLOv5-s) was deployed to the web with bin color mapped using Nepal's HCW management standards. Further work is suggested to address data limitation and ensure localized context.
academic

Clasificación de Residuos de Atención Médica Utilizando Aprendizaje Profundo Alineado con las Directrices de Colores de Contenedores de Nepal

Información Básica

  • ID del Artículo: 2508.07450
  • Título: Health Care Waste Classification Using Deep Learning Aligned with Nepal's Bin Color Guidelines
  • Autores: Suman Kunwar (DWaste, USA), Prabesh Rai (Lambton College, Canada)
  • Clasificación: cs.CV (Visión por Computadora)
  • Fecha de Publicación: 15 de octubre de 2025 (arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2508.07450

Resumen

Con el aumento del número de instalaciones de atención médica en Nepal, la gestión de residuos de atención médica (HCW) enfrenta desafíos significativos. La separación y disposición inadecuadas conducen a contaminación, propagación de enfermedades infecciosas y riesgos para el personal de gestión de residuos. Este estudio realiza un análisis comparativo de modelos de clasificación de residuos de última generación utilizando validación cruzada estratificada de 5 pliegues en un conjunto de datos integral de HCW: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n e YOLOv5-s. YOLOv5-s logra la precisión más alta (95.06%), aunque es ligeramente inferior en velocidad de inferencia al modelo YOLOv8-n por unos milisegundos. EfficientNet-B0 muestra buenos resultados con 93.22%, pero presenta el tiempo de inferencia más largo. Después de confirmar la significancia estadística mediante pruebas ANOVA repetidas, el modelo de mejor desempeño (YOLOv5-s) se implementa en la web y se mapean los colores de contenedores de acuerdo con los estándares de gestión de HCW de Nepal.

Antecedentes de Investigación y Motivación

  1. Problema a Resolver: Nepal cuenta con 16,611 instalaciones de atención médica, enfrentando desafíos severos en la gestión de residuos médicos. Los métodos tradicionales de clasificación manual son intensivos en mano de obra, propensos a errores y representan una amenaza para el personal de gestión de residuos.
  2. Importancia del Problema: La separación y disposición inadecuadas de residuos médicos resultan en:
    • Contaminación ambiental
    • Propagación de enfermedades infecciosas
    • Riesgos para la salud del personal de gestión de residuos
    • Posibles daños a los residentes cercanos a hospitales
  3. Limitaciones de Métodos Existentes:
    • Tamaños de conjuntos de datos pequeños
    • Calidad de imagen deficiente
    • Pruebas en entornos controlados
    • Problemas de escalabilidad y viabilidad de infraestructura
    • Dificultad en la integración con sistemas de gestión de residuos existentes
  4. Motivación de la Investigación: Nepal sigue estándares nacionales de gestión de residuos médicos y procedimientos operativos, clasificando residuos en residuos médicos generales y peligrosos, utilizando un sistema de codificación por colores. El estudio tiene como objetivo desarrollar una solución de clasificación de residuos automatizada impulsada por IA que se alinee con los estándares de Nepal.

Contribuciones Principales

  1. Análisis Comparativo Multimodelo: Primera comparación sistemática de 5 modelos de aprendizaje profundo de última generación en la tarea de clasificación de residuos médicos
  2. Aplicación Localizada: Alineación de resultados de clasificación con el sistema de codificación por colores estándar de gestión de residuos médicos de Nepal
  3. Conjunto de Datos Integral: Integración de dos conjuntos de datos que cubren 23 categorías de residuos médicos
  4. Implementación Práctica: Despliegue del modelo óptimo en la plataforma Hugging Face para uso público
  5. Validación Estadística: Confirmación de la significancia estadística del desempeño del modelo mediante pruebas ANOVA repetidas

Explicación Detallada de Métodos

Definición de Tarea

Entrada: Imágenes RGB de residuos de atención médica (resolución 1920×1080) Salida: Resultados de clasificación de residuos en 23 categorías, mapeados a contenedores de codificación por colores correspondientes Restricciones: Debe cumplir con el sistema de codificación por colores del estándar nacional de gestión de residuos médicos de Nepal

Arquitecturas de Modelos

El estudio prueba 5 tipos diferentes de modelos de aprendizaje profundo:

  1. ResNeXt-50: Variante de red residual que utiliza convoluciones agrupadas
  2. EfficientNet-B0: Arquitectura CNN eficiente que equilibra precisión y eficiencia computacional
  3. MobileNetV3-S: Red ligera adecuada para dispositivos móviles
  4. YOLOv8-n: Versión más reciente del modelo de detección de objetos YOLO
  5. YOLOv5-s: Variante madura del modelo YOLO

Estrategia de Entrenamiento:

  • Modelos CNN tradicionales (ResNeXt-50, EfficientNet-B0, MobileNetV3-S): Utilización de pesos preentrenados de ImageNet, congelación de capas base, adición de cabezal de clasificación personalizado
  • Modelos YOLO: Entrenamiento desde cero

Puntos de Innovación Técnica

  1. Validación Cruzada Estratificada K-Fold: Utilización de validación cruzada estratificada de 5 pliegues, asegurando que cada etiqueta mantenga la misma proporción en cada pliegue
  2. Manejo del Equilibrio de Datos:
    • Reducción de imágenes en clases sobremuestreadas utilizando valor de conteo de clase mediana
    • Aplicación de técnicas de aumento de datos como volteo y contraste de brillo para clases submuestreadas
  3. Mapeo Localizado: Mapeo directo de resultados de clasificación a contenedores de codificación por colores estándar de Nepal

Configuración Experimental

Conjunto de Datos

Conjunto de Datos Combinado que contiene:

  1. Medical Waste Dataset 4.0:
    • Fuente: Región de Toscana, Italia, utilizando dispositivo de cámara OAK 4.0
    • Categorías: Gasa, pares de guantes, guantes individuales, gorras médicas, gafas médicas, cubrezapatos, etc.
  2. Pharmaceutical and Biomedical Waste dataset:
    • Fuente: Recopilado por Engineering UBU
    • Categorías: Tejido corporal, residuos orgánicos, empaques de equipos, agujas de jeringa, etc.

Preprocesamiento de Datos:

  • Eliminación de categorías de guantes duplicadas para reducir sesgos
  • Manejo del desequilibrio de clases utilizando conteo de clase mediana
  • Aplicación de técnicas de aumento de datos

Métricas de Evaluación

  • Precisión (Accuracy)
  • Exactitud (Precision)
  • Exhaustividad (Recall)
  • Puntuación F1 (F1-Score)
  • Tiempo de Inferencia (Inference Time)

Métodos Comparativos

Comparación mutua de cinco modelos: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n, YOLOv5-s

Detalles de Implementación

  • Hardware: Dos GPU NVIDIA Tesla T4
  • Épocas de Entrenamiento: 30 épocas
  • Validación Cruzada: Validación cruzada estratificada de 5 pliegues, 80% entrenamiento, 20% validación

Resultados Experimentales

Resultados Principales

ModeloPrecisiónExactitudExhaustividadPuntuación F1Tiempo de Inferencia (ms)
YOLOv5-s95.06%96.65%95.06%94.87%10.97
YOLOv8-n94.68%96.44%94.68%94.57%9.29
EfficientNet-B093.22%94.81%93.22%93.04%444.67
MobileNetV3-S91.05%92.90%91.05%90.95%369.24
ResNeXt-5074.51%76.53%74.51%74.48%395.74

Hallazgos Clave

  1. YOLOv5-s Presenta el Mejor Desempeño: Obtiene las puntuaciones más altas en precisión, exactitud, exhaustividad y puntuación F1
  2. Ventajas de Velocidad de Inferencia: Los modelos YOLO (v5-s y v8-n) muestran ventajas significativas en tiempo de inferencia comparados con otros modelos
  3. Compensación de Practicidad: YOLOv8-n supera ligeramente a YOLOv5-s en velocidad de inferencia, aunque con precisión ligeramente inferior

Validación Estadística

Los resultados de pruebas ANOVA repetidas muestran:

  • Efecto altamente significativo de los modelos en métricas de desempeño
  • Diferencias significativas entre diferentes métricas de evaluación
  • Interacción altamente significativa entre modelos y métricas

Comparación con Trabajos Relacionados

EstudioNúmero de CategoríasModelo ÓptimoPrecisión
Bruno et al.7 categoríasEfficientNet-B099.45%
Este Estudio23 categoríasYOLOv5-s95.06%

Aunque Bruno et al. logran 99.45% de precisión en una tarea de 7 categorías, este estudio logra 95.06% de precisión en una tarea más desafiante de 23 categorías.

Trabajos Relacionados

Direcciones Principales de Investigación

  1. Aplicación de Aprendizaje Profundo en Clasificación de Residuos Médicos: Aplicación de modelos como ResNeXt-50 y EfficientNet
  2. Integración de IoT e IA en Clasificación Automatizada: Integración de modelos YOLO con dispositivos IoT
  3. Implementación en Tiempo Real y Computación de Borde: Aplicaciones prácticas en entornos médicos

Ventajas de Este Artículo

  1. Cobertura de Categorías Más Completa: 23 categorías vs 6-8 categorías en investigaciones previas
  2. Alineación con Estándares Locales: Cumplimiento con estándares nacionales de Nepal
  3. Implementación Práctica: Proporciona aplicación web disponible

Conclusiones y Discusión

Conclusiones Principales

  1. YOLOv5-s es la Opción Óptima: Presenta el mejor desempeño en precisión y rendimiento integral
  2. Modelos YOLO Adecuados para Aplicaciones en Tiempo Real: Velocidad de inferencia rápida, adecuada para implementación práctica
  3. El Aprendizaje Profundo Resuelve Efectivamente la Clasificación de Residuos Médicos: Proporciona una solución de IA viable para la gestión de residuos médicos en Nepal

Limitaciones

  1. Limitaciones del Conjunto de Datos:
    • Falta de ciertas categorías: residuos citotóxicos, radiactivos, patológicos, químicos y líquidos
    • Datos sesgados hacia artículos comunes (guantes, gasa)
    • Datos recopilados en entornos no nepalíes
  2. Desafíos de Aplicación Práctica:
    • Los residuos en entornos reales pueden estar obstruidos, mezclados o empaquetados de manera desordenada
    • El modelo puede fallar en escenarios reales complejos

Direcciones Futuras

  1. Expansión de Recopilación de Datos: Recopilación de más datos locales representativos
  2. Complementación de Categorías Faltantes: Adición de todas las categorías de residuos en estándares de Nepal
  3. Pruebas en Entornos Reales: Validación del desempeño del modelo en entornos médicos reales
  4. Integración del Sistema: Integración con sistemas de gestión de residuos existentes

Evaluación Profunda

Fortalezas

  1. Alto Valor Práctico: Resuelve problemas reales en la gestión de residuos médicos de Nepal
  2. Metodología Rigurosa: Utilización de validación cruzada estratificada y pruebas de significancia estadística
  3. Comparación Integral de Modelos: Cobertura de diferentes tipos de modelos de última generación
  4. Implementación Práctica: Proporciona aplicación web disponible, mejorando la practicidad de la investigación
  5. Consideración de Localización: Alineación con estándares locales, con valor de aplicación práctica

Deficiencias

  1. Representatividad Insuficiente del Conjunto de Datos: Falta de datos localizados, que puede afectar la efectividad de aplicación práctica
  2. Cobertura de Categorías Incompleta: No incluye todas las categorías de residuos en estándares de Nepal
  3. Falta de Validación en Entornos Reales: Principalmente pruebas en entornos controlados
  4. Innovación Técnica Limitada: Principalmente aplicación y comparación de modelos existentes, con innovación metodológica limitada

Impacto

  1. Contribución al Campo: Proporciona un ejemplo de solución de IA para gestión de residuos médicos en países en desarrollo
  2. Valor Práctico: Aplicable directamente a instituciones médicas de Nepal
  3. Reproducibilidad: Conjunto de datos y código públicos, facilitando reproducción y extensión

Escenarios Aplicables

  1. Instituciones Médicas: Clasificación de residuos en hospitales y clínicas
  2. Centros de Tratamiento de Residuos: Procesamiento de residuos médicos a gran escala
  3. Departamentos Reguladores: Inspección de cumplimiento en gestión de residuos
  4. Otros Países en Desarrollo: Problemas similares de gestión de residuos médicos

Referencias

El artículo cita 16 referencias relacionadas, cubriendo investigaciones importantes en clasificación de residuos médicos mediante aprendizaje profundo, aplicaciones de IoT, y situación actual de gestión de residuos médicos en Nepal, proporcionando una base teórica sólida y referencias prácticas para esta investigación.


Evaluación General: Este es un artículo de investigación aplicada con fuerte valor práctico. Aunque es relativamente limitado en innovación técnica, su enfoque en problemas reales, diseño experimental riguroso y esfuerzos en implementación práctica le confieren importante valor social y perspectivas de aplicación.