A Novel Approach using CapsNet and Deep Belief Network for Detection and Identification of Oral Leukopenia
GV, M, S
Oral cancer constitutes a significant global health concern, resulting in 277,484 fatalities in 2023, with the highest prevalence observed in low- and middle-income nations. Facilitating automation in the detection of possibly malignant and malignant lesions in the oral cavity could result in cost-effective and early disease diagnosis. Establishing an extensive repository of meticulously annotated oral lesions is essential. In this research photos are being collected from global clinical experts, who have been equipped with an annotation tool to generate comprehensive labelling. This research presents a novel approach for integrating bounding box annotations from various doctors. Additionally, Deep Belief Network combined with CAPSNET is employed to develop automated systems that extracted intricate patterns to address this challenging problem. This study evaluated two deep learning-based computer vision methodologies for the automated detection and classification of oral lesions to facilitate the early detection of oral cancer: image classification utilizing CAPSNET. Image classification attained an F1 score of 94.23% for detecting photos with lesions 93.46% for identifying images necessitating referral. Object detection attained an F1 score of 89.34% for identifying lesions for referral. Subsequent performances are documented about classification based on the sort of referral decision. Our preliminary findings indicate that deep learning possesses the capability to address this complex problem.
academic
Un Enfoque Novedoso Utilizando CapsNet y Red de Creencias Profundas para la Detección e Identificación del Cáncer Oral
El cáncer oral es un problema de salud global significativo que causó 277,484 muertes en 2023, con la mayor incidencia en países de ingresos bajos y medios. Este estudio propone un método novedoso que combina CapsNet y Red de Creencias Profundas (DBN) para la detección y clasificación automática de lesiones orales. La investigación recopiló datos de imágenes de expertos clínicos globales y los equipó con herramientas de anotación para un etiquetado integral. El método alcanzó una puntuación F1 del 94.23% en tareas de clasificación de imágenes para detectar imágenes de lesiones, 93.46% de puntuación F1 para identificar imágenes que requieren derivación, y 89.34% de puntuación F1 en tareas de detección de objetos.
Carga Global de Salud: El cáncer oral es un problema de salud significativo a nivel mundial, con predicciones de GLOBOCAN 2021 de 387,864 nuevos casos y 234,384 muertes
Variaciones Geográficas: Tres cuartas partes de los casos ocurren en países de bajos ingresos, con África e India representando la mitad de los casos globales
Diagnóstico Retrasado: En países de ingresos bajos y medios (PIBM), más de dos tercios de los casos se detectan en etapas avanzadas, resultando en tasas de supervivencia más bajas
Carga Económica: Los costos del tratamiento del cáncer son extremadamente altos, especialmente en casos de diagnóstico tardío
Idea Central: Simula unidades de procesamiento de "cápsulas" en el cerebro humano
Estructura de Cápsulas: Cada cápsula representa una entidad específica en la imagen, con el estado neuronal codificando características de la entidad
Salida Vectorial: La longitud del vector de salida representa la probabilidad de existencia de la entidad, mientras que la dirección refleja atributos de la entidad
Enrutamiento Dinámico: Reemplaza el agrupamiento máximo tradicional mediante el mecanismo de "enrutamiento por acuerdo"
Función de Compresión: Aplica transformación no lineal a la salida vectorial, asegurando representación de escala apropiada
Ventajas Técnicas:
CNN Tradicional: Apilamiento capa por capa → Pérdida de características
CapsNet: Anidamiento jerárquico → Preservación de relaciones espaciales
El artículo cita 15 investigaciones relacionadas, cubriendo múltiples aspectos incluyendo detección de cáncer oral, aplicaciones de aprendizaje profundo, métodos multimodales, etc., proporcionando una base teórica sólida y comparación técnica para esta investigación.
Evaluación General: Esta investigación propone un marco innovador de aprendizaje profundo híbrido para la detección de cáncer oral, con importante valor de aplicación clínica. Aunque hay espacio para mejora en análisis teórico y verificación experimental, su enfoque de diseño orientado a necesidades prácticas y su rendimiento excepcional la convierten en una contribución valiosa en este campo.