Multi Class Parkinsons Disease Detection Based on Finger Tapping Using Attention-Enhanced CNN BiLSTM
Miah, Hassan, Hossain et al.
Effective clinical management and intervention development depend on accurate evaluation of Parkinsons disease (PD) severity. Many researchers have worked on developing gesture-based PD recognition systems; however, their performance accuracy is not satisfactory. In this study, we propose a multi-class Parkinson Disease detection system based on finger tapping using an attention-enhanced CNN BiLSTM. We collected finger tapping videos and derived temporal, frequency, and amplitude based features from wrist and hand movements. Then, we proposed a hybrid deep learning framework integrating CNN, BiLSTM, and attention mechanisms for multi-class PD severity classification from video-derived motion features. First, the input sequence is reshaped and passed through a Conv1D MaxPooling block to capture local spatial dependencies. The resulting feature maps are fed into a BiLSTM layer to model temporal dynamics. An attention mechanism focuses on the most informative temporal features, producing a context vector that is further processed by a second BiLSTM layer. CNN-derived features and attention-enhanced BiLSTM outputs are concatenated, followed by dense and dropout layers, before the final softmax classifier outputs the predicted PD severity level. The model demonstrated strong performance in distinguishing between the five severity classes, suggesting that integrating spatial temporal representations with attention mechanisms can improve automated PD severity detection, making it a promising non-invasive tool to support clinicians in PD monitoring and progression tracking.
academic
Mehrklassen-Parkinson-Erkrankungserkennung basierend auf Fingerklopfen unter Verwendung von Attention-Enhanced CNN-BiLSTM
Die wirksame klinische Behandlung und Interventionsentwicklung der Parkinson-Erkrankung (PD) hängt von einer genauen Bewertung des Krankheitsschweregrad ab. Diese Forschung schlägt ein Mehrklassen-PD-Erkennungssystem basierend auf Fingerklopfen vor, das eine aufmerksamkeitsgesteuerte CNN-BiLSTM-Architektur verwendet. Die Studie extrahiert zeitliche, Frequenz- und Amplitudenmerkmale aus Fingerklopf-Videos und konstruiert ein hybrides Deep-Learning-Framework, das CNN, BiLSTM und Aufmerksamkeitsmechanismen integriert. Das Modell erfasst lokale räumliche Abhängigkeiten durch Conv1D-MaxPooling-Blöcke, modelliert zeitliche Dynamiken durch BiLSTM-Schichten und konzentriert sich durch Aufmerksamkeitsmechanismen auf die informativsten zeitlichen Merkmale. Letztendlich wird eine Klassifizierungsgenauigkeit von 93% erreicht, mit hervorragender Leistung bei der Unterscheidung von fünf Schweregrad-Ebenen.
Die Parkinson-Erkrankung ist eine progressive neurodegenerative Erkrankung, die weltweit über 10 Millionen Menschen betrifft und sich hauptsächlich durch Tremor, Steifheit, Bradykinesie und Haltungsinstabilität manifestiert. Die traditionelle PD-Schweregradbeurteilung beruht hauptsächlich auf klinischen Skalen wie der UPDRS (Unified Parkinson's Disease Rating Scale) und MDS-UPDRS.
Entwicklung einer nicht-invasiven, objektiven und zugänglichen Methode zur automatischen Bewertung des PD-Schweregrades basierend auf Videoanalyse, unter Verwendung von Computervisionstechniken und maschinellem Lernen zur Erreichung präziser Krankheitsklassifizierung und Bereitstellung zuverlässiger Hilfsmittel für die klinische Diagnose.
Vorschlag einer aufmerksamkeitsgesteuerten CNN-BiLSTM-Hybrid-Architektur, die räumliche Merkmalsextraktion und Zeitreihenmodellierung effektiv kombiniert
Realisierung einer Mehrklassen-PD-Schweregradklassifizierung, die fünf verschiedene Schweregrad-Ebenen unterscheiden kann
Integration eines Aufmerksamkeitsmechanismus, der die Fähigkeit des Modells zur Fokussierung auf kritische zeitliche Merkmale verbessert
Erreichung einer Klassifizierungsgenauigkeit von 93%, deutlich besser als Baseline-Methoden
Bereitstellung eines nicht-invasiven PD-Überwachungswerkzeugs, das Kliniker bei der Verfolgung des Krankheitsverlaufs unterstützt
Im Vergleich zu bestehenden Arbeiten integriert dieses Papier erstmals CNN, BiLSTM und Aufmerksamkeitsmechanismen vollständig für die Mehrklassen-PD-Schweregradklassifizierung und erreicht bessere Leistung auf videoabgeleiteten Bewegungsmerkmalen.
Methodische Effektivität: Die aufmerksamkeitsgesteuerte CNN-BiLSTM-Architektur kann effektiv Mehrklassen-PD-Schweregrad erkennen
Merkmalsbedeutung: Die Kombination zeitlicher, Frequenz- und Amplitudenmerkmale ist für die PD-Klassifizierung entscheidend
Klinischer Wert: Bietet objektive, wiederholbare Werkzeuge zur Krankheitsbewertung
Technische Vorteile: Die Integration räumlich-zeitlicher Darstellung mit Aufmerksamkeitsmechanismen verbessert signifikant die automatisierte PD-Schweregradererkennung
1 Md Saiful Islam et al. Using ai to measure parkinson's disease severity at home. NPJ digital medicine, 6(1):156, 2023.
27 Daniel Deng et al. Interpretable video-based tracking and quantification of parkinsonism clinical motor states. npj Parkinson's Disease, 10(1):122, 2024.
30 Umesh Kumar Lilhore et al. Hybrid cnn-lstm model with efficient hyperparameter tuning for prediction of parkinson's disease. Scientific Reports, 13(1):14605, 2023.
Gesamtbewertung: Dies ist ein technisch solides Forschungspapier mit klarem Anwendungswert. Die von den Autoren vorgeschlagene aufmerksamkeitsgesteuerte CNN-BiLSTM-Architektur erreicht gute Ergebnisse bei der Mehrklassen-PD-Erkennungsaufgabe und leistet wertvolle technische Beiträge zu diesem Gebiet. Trotz Einschränkungen bei der Datensatzgröße und Generalisierung ist die Gesamtforschungsqualität hoch mit guten klinischen Anwendungsaussichten.