A Novel Approach using CapsNet and Deep Belief Network for Detection and Identification of Oral Leukopenia
GV, M, S
Oral cancer constitutes a significant global health concern, resulting in 277,484 fatalities in 2023, with the highest prevalence observed in low- and middle-income nations. Facilitating automation in the detection of possibly malignant and malignant lesions in the oral cavity could result in cost-effective and early disease diagnosis. Establishing an extensive repository of meticulously annotated oral lesions is essential. In this research photos are being collected from global clinical experts, who have been equipped with an annotation tool to generate comprehensive labelling. This research presents a novel approach for integrating bounding box annotations from various doctors. Additionally, Deep Belief Network combined with CAPSNET is employed to develop automated systems that extracted intricate patterns to address this challenging problem. This study evaluated two deep learning-based computer vision methodologies for the automated detection and classification of oral lesions to facilitate the early detection of oral cancer: image classification utilizing CAPSNET. Image classification attained an F1 score of 94.23% for detecting photos with lesions 93.46% for identifying images necessitating referral. Object detection attained an F1 score of 89.34% for identifying lesions for referral. Subsequent performances are documented about classification based on the sort of referral decision. Our preliminary findings indicate that deep learning possesses the capability to address this complex problem.
academic
Un Approccio Innovativo Utilizzando CapsNet e Deep Belief Network per la Rilevazione e l'Identificazione del Cancro Orale
Il cancro orale rappresenta un grave problema sanitario globale, causando 277.484 decessi nel 2023, con il più alto tasso di incidenza nei paesi a reddito basso e medio. Questo studio propone un metodo innovativo che combina CapsNet e Deep Belief Network (DBN) per la rilevazione e la classificazione automatica delle lesioni orali. La ricerca ha raccolto dati di immagini da esperti clinici globali, dotati di strumenti di annotazione per un'etichettatura completa. Il metodo ha raggiunto un punteggio F1 del 94,23% per la rilevazione di immagini con lesioni nei compiti di classificazione delle immagini, un punteggio F1 del 93,46% per l'identificazione di immagini che richiedono rinvio, e un punteggio F1 dell'89,34% nei compiti di rilevazione di oggetti.
Onere Sanitario Globale: Il cancro orale rappresenta un grave problema sanitario a livello mondiale, con GLOBOCAN 2021 che prevede 387.864 nuovi casi e 234.384 decessi
Disparità Geografiche: Tre quarti dei casi si verificano nei paesi a basso reddito, con Africa e India che rappresentano la metà dei casi globali
Diagnosi Ritardata: Nei paesi a reddito basso e medio (LMIC), oltre due terzi dei casi vengono scoperti in fase avanzata, con tassi di sopravvivenza inferiori
Onere Economico: I costi del trattamento del cancro sono estremamente elevati, in particolare nei casi di diagnosi tardiva
Carenza di Professionisti: Mancanza di medici specialisti e risorse mediche, in particolare nelle regioni LMIC
Soggettività Diagnostica: La diagnosi tradizionale dipende dall'esperienza del clinico, mancando di metodi standardizzati
Requisiti di Apparecchiature: I metodi di apprendimento profondo esistenti richiedono apparecchiature costose o piattaforme di screening appositamente progettate
Problemi di Accessibilità: Il requisito di esame con microscopio ad alto ingrandimento della ROI limita l'applicazione diffusa
Idea Centrale: Simula le unità di elaborazione "capsule" nel cervello umano
Struttura Capsule: Ogni capsula rappresenta un'entità specifica nell'immagine, con lo stato dei neuroni che codifica le caratteristiche dell'entità
Output Vettoriale: La lunghezza del vettore di output rappresenta la probabilità di esistenza dell'entità, la direzione riflette gli attributi dell'entità
Routing Dinamico: Sostituisce il tradizionale max pooling con il meccanismo di "routing per consenso"
Funzione di Compressione: Applica una trasformazione non lineare all'output vettoriale, garantendo una rappresentazione di scala appropriata
Vantaggi Tecnici:
CNN Tradizionale: Stacking sequenziale → Perdita di caratteristiche
CapsNet: Annidamento gerarchico → Preservazione delle relazioni spaziali
L'articolo cita 15 studi correlati, coprendo molteplici aspetti tra cui rilevazione del cancro orale, applicazioni di apprendimento profondo, metodi multimodali, ecc., fornendo una solida base teorica e confronti tecnici per questa ricerca.
Valutazione Complessiva: Questo studio propone un framework ibrido innovativo di apprendimento profondo per la rilevazione del cancro orale, con importante valore di applicazione clinica. Sebbene vi sia spazio per miglioramenti nell'analisi teorica e nella verifica sperimentale, il suo approccio di progettazione orientato alle esigenze pratiche e le eccellenti prestazioni lo rendono un contributo prezioso in questo campo.