The increasing number of Health Care facilities in Nepal has added up the challenges on managing health care waste (HCW). Improper segregation and disposal of HCW leads to contamination, spreading of infectious diseases and risk for waste handlers. This study benchmarks the state of the art waste classification models: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n and YOLOv5-s using stratified 5-fold cross-validation technique on combined HCW data. YOLOv5-s achieved the highest accuracy (95.06%) but fell short with the YOLOv8-n model in inference speed with few milliseconds. The EfficientNet-B0 showed promising results of 93.22% accuracy but took the highest inference time. Following a repetitive ANOVA test to confirm the statistical significance, the best performing model (YOLOv5-s) was deployed to the web with bin color mapped using Nepal's HCW management standards. Further work is suggested to address data limitation and ensure localized context.
Classificazione dei Rifiuti Sanitari Utilizzando Deep Learning Allineato alle Linee Guida dei Contenitori Colorati del Nepal
- ID Articolo: 2508.07450
- Titolo: Health Care Waste Classification Using Deep Learning Aligned with Nepal's Bin Color Guidelines
- Autori: Suman Kunwar (DWaste, USA), Prabesh Rai (Lambton College, Canada)
- Classificazione: cs.CV (Computer Vision)
- Data di Pubblicazione: 15 ottobre 2025 (arXiv)
- Link Articolo: https://arxiv.org/abs/2508.07450
Con l'aumento del numero di strutture sanitarie in Nepal, la gestione dei rifiuti sanitari (HCW) affronta sfide significative. La separazione e lo smaltimento impropri causano inquinamento, diffusione di malattie infettive e rischi per il personale addetto ai rifiuti. Questo studio utilizza la tecnica di convalida incrociata stratificata a 5 fold per sottoporre a benchmark i modelli all'avanguardia di classificazione dei rifiuti su dati HCW completi: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n e YOLOv5-s. YOLOv5-s raggiunge la massima precisione (95,06%), ma è leggermente inferiore al modello YOLOv8-n in termini di velocità di inferenza di pochi millisecondi. EfficientNet-B0 mostra buoni risultati del 93,22%, ma con il tempo di inferenza più lungo. Dopo la conferma della significatività statistica mediante test ANOVA ripetuto, il modello con le migliori prestazioni (YOLOv5-s) è stato distribuito sul web e i colori dei contenitori sono stati mappati secondo gli standard di gestione HCW del Nepal.
- Problema da Risolvere: Il Nepal possiede 16.611 strutture sanitarie e la gestione dei rifiuti sanitari affronta sfide severe. I metodi tradizionali di classificazione manuale sono ad alta intensità di lavoro, soggetti a errori e rappresentano una minaccia per il personale addetto ai rifiuti.
- Importanza del Problema:
- Inquinamento ambientale
- Diffusione di malattie infettive
- Rischi per la salute del personale addetto ai rifiuti
- Potenziali pericoli per i residenti intorno agli ospedali
- Limitazioni dei Metodi Esistenti:
- Dimensioni ridotte dei dataset
- Qualità scadente delle immagini
- Test in ambienti controllati
- Problemi di scalabilità e fattibilità infrastrutturale
- Difficoltà di integrazione con i sistemi di gestione dei rifiuti esistenti
- Motivazione della Ricerca: Il Nepal segue gli standard nazionali di gestione dei rifiuti sanitari e le procedure operative, classificando i rifiuti in rifiuti sanitari generali e rifiuti sanitari pericolosi, utilizzando un sistema di codifica cromatica. La ricerca mira a sviluppare una soluzione di classificazione automatica dei rifiuti guidata dall'IA conforme agli standard del Nepal.
- Benchmark Multi-Modello: Primo confronto sistematico di 5 modelli di deep learning all'avanguardia sul compito di classificazione dei rifiuti sanitari
- Applicazione Localizzata: Allineamento dei risultati di classificazione con gli standard di codifica cromatica della gestione dei rifiuti sanitari del Nepal
- Dataset Completo: Integrazione di due dataset che coprono 23 categorie di rifiuti sanitari
- Distribuzione Pratica: Distribuzione del modello migliore sulla piattaforma Hugging Face per uso pubblico
- Verifica Statistica: Utilizzo del test ANOVA ripetuto per confermare la significatività statistica delle prestazioni del modello
Input: Immagini RGB di rifiuti sanitari (risoluzione 1920×1080)
Output: Risultati di classificazione dei rifiuti in 23 categorie, mappati ai corrispondenti contenitori con codifica cromatica
Vincoli: Conformità al sistema di codifica cromatica dello standard nazionale di gestione dei rifiuti sanitari del Nepal
Lo studio ha testato 5 tipi diversi di modelli di deep learning:
- ResNeXt-50: Variante della rete residuale, utilizza convoluzione raggruppata
- EfficientNet-B0: Architettura CNN efficiente, bilancia accuratezza ed efficienza computazionale
- MobileNetV3-S: Rete leggera, adatta per dispositivi mobili
- YOLOv8-n: Versione più recente del modello di rilevamento oggetti YOLO
- YOLOv5-s: Variante matura del modello YOLO
Strategia di Addestramento:
- Modelli CNN tradizionali (ResNeXt-50, EfficientNet-B0, MobileNetV3-S): Utilizzo di pesi pre-addestrati su ImageNet, congelamento dei livelli di base, aggiunta di testata di classificazione personalizzata
- Modelli YOLO: Addestramento da zero
- Convalida Incrociata Stratificata K-Fold: Utilizzo di convalida incrociata stratificata a 5 fold, garantendo che ogni etichetta mantenga la stessa proporzione in ogni fold
- Gestione dell'Equilibrio dei Dati:
- Riduzione delle immagini per classi sovracampionate utilizzando il valore mediano del conteggio delle classi
- Utilizzo di tecniche di aumento dei dati come capovolgimento e contrasto di luminosità per classi sottocampionate
- Mappatura Localizzata: Mappatura diretta dei risultati di classificazione ai contenitori con codifica cromatica secondo gli standard del Nepal
Dataset Combinato contiene:
- Medical Waste Dataset 4.0:
- Fonte: Regione della Toscana, Italia, utilizzando dispositivo fotocamera OAK 4.0
- Categorie: Garze, coppie di guanti, guanti singoli, cuffie mediche, occhiali medici, copriscarpe, ecc.
- Pharmaceutical and Biomedical Waste Dataset:
- Fonte: Raccolto da Engineering UBU
- Categorie: Tessuti corporei, rifiuti organici, imballaggi di apparecchiature, aghi per siringhe, ecc.
Pre-elaborazione dei Dati:
- Rimozione di categorie di guanti duplicate per ridurre i bias
- Gestione dello squilibrio delle classi utilizzando il conteggio mediano delle classi
- Applicazione di tecniche di aumento dei dati
- Accuratezza (Accuracy)
- Precisione (Precision)
- Richiamo (Recall)
- Punteggio F1 (F1-Score)
- Tempo di Inferenza (Inference Time)
Confronto reciproco tra cinque modelli: ResNeXt-50, EfficientNet-B0, MobileNetV3-S, YOLOv8-n, YOLOv5-s
- Hardware: Due GPU NVIDIA Tesla T4
- Epoche di Addestramento: 30 epoch
- Convalida Incrociata: Convalida incrociata stratificata a 5 fold, 80% addestramento, 20% validazione
| Modello | Accuratezza | Precisione | Richiamo | Punteggio F1 | Tempo di Inferenza (ms) |
|---|
| YOLOv5-s | 95,06% | 96,65% | 95,06% | 94,87% | 10,97 |
| YOLOv8-n | 94,68% | 96,44% | 94,68% | 94,57% | 9,29 |
| EfficientNet-B0 | 93,22% | 94,81% | 93,22% | 93,04% | 444,67 |
| MobileNetV3-S | 91,05% | 92,90% | 91,05% | 90,95% | 369,24 |
| ResNeXt-50 | 74,51% | 76,53% | 74,51% | 74,48% | 395,74 |
- YOLOv5-s Mostra le Migliori Prestazioni: Ottiene i punteggi più alti in accuratezza, precisione, richiamo e punteggio F1
- Vantaggi nella Velocità di Inferenza: I modelli YOLO (v5-s e v8-n) mostrano vantaggi significativi nel tempo di inferenza rispetto agli altri modelli
- Compromessi Pratici: YOLOv8-n è leggermente superiore a YOLOv5-s nella velocità di inferenza, ma con accuratezza leggermente inferiore
I risultati del test ANOVA ripetuto mostrano:
- Effetto altamente significativo dei modelli sugli indicatori di prestazione
- Differenze significative tra diverse metriche di valutazione
- Interazione altamente significativa tra modello e metrica
| Studio | Numero di Categorie | Modello Migliore | Accuratezza |
|---|
| Bruno et al. | 7 categorie | EfficientNet-B0 | 99,45% |
| Questo Studio | 23 categorie | YOLOv5-s | 95,06% |
Sebbene Bruno et al. abbiano raggiunto un'accuratezza del 99,45% nel compito a 7 categorie, questo studio ha realizzato un'accuratezza del 95,06% nel compito più impegnativo a 23 categorie.
- Applicazione del Deep Learning nella Classificazione dei Rifiuti Sanitari: Applicazione di modelli come ResNeXt-50 e EfficientNet
- Combinazione di IoT e IA per la Smistamento Automatico: Integrazione dei modelli YOLO con dispositivi IoT
- Distribuzione in Tempo Reale e Edge Computing: Applicazioni pratiche negli ambienti sanitari
- Copertura di Categorie Più Completa: 23 categorie vs 6-8 categorie negli studi precedenti
- Allineamento con Standard Localizzati: Conformità agli standard nazionali del Nepal
- Distribuzione Pratica: Fornitura di un'applicazione web utilizzabile
- YOLOv5-s è la Scelta Migliore: Mostra le migliori prestazioni in accuratezza e prestazioni complessive
- I Modelli YOLO Sono Adatti per Applicazioni in Tempo Reale: Velocità di inferenza rapida, adatti per la distribuzione pratica
- Il Deep Learning Può Risolvere Efficacemente il Problema della Classificazione dei Rifiuti Sanitari: Fornisce una soluzione IA praticabile per la gestione dei rifiuti sanitari del Nepal
- Limitazioni del Dataset:
- Mancanza di alcune categorie: rifiuti citotossici, radioattivi, patologici, chimici e liquidi
- Dati orientati verso oggetti comuni (guanti, garze)
- Dati raccolti in ambienti non nepalesi
- Sfide nell'Applicazione Pratica:
- I rifiuti in ambienti reali potrebbero essere occultati, mescolati o imballati disordinatamente
- Il modello potrebbe fallire in scenari reali complessi
- Espansione della Raccolta Dati: Raccolta di più dati rappresentativi locali
- Integrazione di Categorie Mancanti: Aggiunta di tutte le categorie di rifiuti negli standard del Nepal
- Test in Ambienti Reali: Verifica delle prestazioni del modello in ambienti sanitari reali
- Integrazione del Sistema: Integrazione con i sistemi di gestione dei rifiuti esistenti
- Alto Valore Pratico: Risolve il problema pratico della gestione dei rifiuti sanitari del Nepal
- Metodologia Rigorosa: Utilizzo di convalida incrociata stratificata e test di significatività statistica
- Confronto Completo dei Modelli: Copertura di diversi tipi di modelli all'avanguardia
- Distribuzione Pratica: Fornitura di un'applicazione web utilizzabile, aumentando l'utilità pratica della ricerca
- Considerazione della Localizzazione: Allineamento con gli standard locali, con valore di applicazione pratica
- Rappresentatività Insufficiente del Dataset: Mancanza di dati localizzati, potrebbe influire sull'efficacia dell'applicazione pratica
- Copertura Incompleta delle Categorie: Non include tutte le categorie di rifiuti negli standard del Nepal
- Mancanza di Verifica in Ambienti Reali: Principalmente testato in ambienti controllati
- Innovazione Tecnica Limitata: Principalmente applicazione e confronto di modelli esistenti, con limitata innovazione metodologica
- Contributo al Settore: Fornisce un esempio di soluzione IA per la gestione dei rifiuti sanitari nei paesi in via di sviluppo
- Valore Pratico: Può essere direttamente applicato alle istituzioni sanitarie del Nepal
- Riproducibilità: Dataset e codice pubblici, facilitano la riproduzione e l'estensione
- Istituzioni Sanitarie: Classificazione dei rifiuti in ospedali e cliniche
- Centri di Trattamento dei Rifiuti: Trattamento su larga scala dei rifiuti sanitari
- Enti Normativi: Controllo della conformità nella gestione dei rifiuti
- Altri Paesi in Via di Sviluppo: Problemi simili di gestione dei rifiuti sanitari
L'articolo cita 16 articoli correlati, coprendo ricerche importanti nel deep learning per la classificazione dei rifiuti sanitari, applicazioni IoT e lo stato attuale della gestione dei rifiuti sanitari del Nepal, fornendo una base teorica solida e riferimenti pratici per questo studio.
Valutazione Complessiva: Questo è un articolo di ricerca applicata con forte valore pratico. Sebbene relativamente limitato nell'innovazione tecnica, la sua attenzione ai problemi pratici, il rigore nella progettazione sperimentale e gli sforzi di distribuzione pratica gli conferiscono importante valore sociale e prospettive di applicazione.