A Novel Approach using CapsNet and Deep Belief Network for Detection and Identification of Oral Leukopenia
GV, M, S
Oral cancer constitutes a significant global health concern, resulting in 277,484 fatalities in 2023, with the highest prevalence observed in low- and middle-income nations. Facilitating automation in the detection of possibly malignant and malignant lesions in the oral cavity could result in cost-effective and early disease diagnosis. Establishing an extensive repository of meticulously annotated oral lesions is essential. In this research photos are being collected from global clinical experts, who have been equipped with an annotation tool to generate comprehensive labelling. This research presents a novel approach for integrating bounding box annotations from various doctors. Additionally, Deep Belief Network combined with CAPSNET is employed to develop automated systems that extracted intricate patterns to address this challenging problem. This study evaluated two deep learning-based computer vision methodologies for the automated detection and classification of oral lesions to facilitate the early detection of oral cancer: image classification utilizing CAPSNET. Image classification attained an F1 score of 94.23% for detecting photos with lesions 93.46% for identifying images necessitating referral. Object detection attained an F1 score of 89.34% for identifying lesions for referral. Subsequent performances are documented about classification based on the sort of referral decision. Our preliminary findings indicate that deep learning possesses the capability to address this complex problem.
academic
Une Approche Novatrice Utilisant CapsNet et le Réseau de Croyance Profond pour la Détection et l'Identification du Cancer Oral
Le cancer oral constitue un problème majeur de santé mondiale, ayant causé 277 484 décès en 2023, avec les taux d'incidence les plus élevés dans les pays à revenus faibles et intermédiaires. Cette étude propose une approche novatrice combinant CapsNet et le Réseau de Croyance Profond (DBN) pour la détection et la classification automatiques des lésions orales. L'étude a collecté des données d'images auprès d'experts cliniques mondiaux et les a équipées d'outils d'annotation pour un étiquetage complet. La méthode a atteint un score F1 de 94,23% pour la détection d'images de lésions, 93,46% pour l'identification d'images nécessitant une orientation, et 89,34% pour les tâches de détection d'objets.
Charge de santé mondiale: Le cancer oral constitue un problème majeur de santé à l'échelle mondiale, avec 387 864 nouveaux cas et 234 384 décès prévus selon GLOBOCAN 2021
Disparités géographiques: Trois quarts des cas surviennent dans les pays à faibles revenus, l'Afrique et l'Inde représentant la moitié des cas mondiaux
Diagnostic retardé: Dans les pays à revenus faibles et intermédiaires (PRFI), plus des deux tiers des cas sont découverts à un stade avancé, avec des taux de survie plus faibles
Fardeau économique: Les coûts du traitement du cancer sont extrêmement élevés, particulièrement en cas de diagnostic tardif
Pénurie de professionnels: Manque de médecins spécialistes et de ressources médicales, particulièrement dans les régions PRFI
Subjectivité du diagnostic: Le diagnostic traditionnel dépend de l'expérience du clinicien, sans méthode standardisée
Exigences d'équipement: Les méthodes d'apprentissage profond existantes nécessitent des équipements coûteux ou des plateformes de dépistage spécialement conçues
Problèmes d'accessibilité: Les exigences de microscopie à fort grossissement pour examiner la région d'intérêt limitent l'application généralisée
Idée fondamentale: Simulation des unités de traitement de "capsules" dans le cerveau humain
Structure de capsule: Chaque capsule représente une entité spécifique dans l'image, l'état des neurones codant les caractéristiques de l'entité
Sortie vectorielle: La longueur du vecteur de sortie représente la probabilité d'existence de l'entité, la direction reflétant les attributs de l'entité
Routage dynamique: Remplacement du regroupement maximal traditionnel par un mécanisme de "routage par accord"
Fonction de compression: Application d'une transformation non linéaire à la sortie vectorielle, assurant une représentation d'échelle appropriée
Avantages techniques:
CNN traditionnel: Empilement couche par couche → Perte de caractéristiques
CapsNet: Imbrication hiérarchique → Préservation des relations spatiales
L'article cite 15 études connexes, couvrant la détection du cancer oral, l'application de l'apprentissage profond, les méthodes multimodales et d'autres aspects, fournissant une base théorique solide et une comparaison technique pour cette recherche.
Évaluation globale: Cette étude propose un cadre d'apprentissage profond hybride innovant pour la détection du cancer oral, possédant une valeur clinique d'application importante. Bien qu'il existe un espace d'amélioration dans l'analyse théorique et la vérification expérimentale, son approche de conception répondant aux besoins pratiques et ses performances exceptionnelles en font une contribution précieuse dans ce domaine.