Multi Class Parkinsons Disease Detection Based on Finger Tapping Using Attention-Enhanced CNN BiLSTM
Miah, Hassan, Hossain et al.
Effective clinical management and intervention development depend on accurate evaluation of Parkinsons disease (PD) severity. Many researchers have worked on developing gesture-based PD recognition systems; however, their performance accuracy is not satisfactory. In this study, we propose a multi-class Parkinson Disease detection system based on finger tapping using an attention-enhanced CNN BiLSTM. We collected finger tapping videos and derived temporal, frequency, and amplitude based features from wrist and hand movements. Then, we proposed a hybrid deep learning framework integrating CNN, BiLSTM, and attention mechanisms for multi-class PD severity classification from video-derived motion features. First, the input sequence is reshaped and passed through a Conv1D MaxPooling block to capture local spatial dependencies. The resulting feature maps are fed into a BiLSTM layer to model temporal dynamics. An attention mechanism focuses on the most informative temporal features, producing a context vector that is further processed by a second BiLSTM layer. CNN-derived features and attention-enhanced BiLSTM outputs are concatenated, followed by dense and dropout layers, before the final softmax classifier outputs the predicted PD severity level. The model demonstrated strong performance in distinguishing between the five severity classes, suggesting that integrating spatial temporal representations with attention mechanisms can improve automated PD severity detection, making it a promising non-invasive tool to support clinicians in PD monitoring and progression tracking.
academic
ध्यान-संवर्धित CNN-BiLSTM का उपयोग करके उंगली टैपिंग के आधार पर बहु-वर्गीय पार्किंसन रोग का पता लगाना
पार्किंसन रोग (PD) के प्रभावी नैदानिक प्रबंधन और हस्तक्षेप विकास रोग की गंभीरता के सटीक मूल्यांकन पर निर्भर करता है। यह अनुसंधान उंगली टैपिंग के आधार पर बहु-वर्गीय पार्किंसन रोग का पता लगाने के लिए एक प्रणाली प्रस्तावित करता है, जो ध्यान-संवर्धित CNN-BiLSTM आर्किटेक्चर का उपयोग करता है। अनुसंधान उंगली टैपिंग वीडियो से अस्थायी, आवृत्ति और आयाम विशेषताओं को निकालता है, CNN, BiLSTM और ध्यान तंत्र को एकीकृत करने वाली एक संकर गहन शिक्षण रूपरेखा का निर्माण करता है। यह मॉडल Conv1D-MaxPooling ब्लॉक के माध्यम से स्थानीय स्थानिक निर्भरता को कैप्चर करता है, BiLSTM परत अस्थायी गतिशीलता को मॉडल करती है, और ध्यान तंत्र सबसे सूचनात्मक अस्थायी विशेषताओं पर ध्यान केंद्रित करता है। अंततः 93% वर्गीकरण सटीकता प्राप्त की गई, जो पाँच गंभीरता स्तरों के भेदभाव में उत्कृष्ट प्रदर्शन करती है।
पार्किंसन रोग एक प्रगतिशील न्यूरोडीजेनेरेटिव रोग है जो विश्व स्तर पर 10 मिलियन से अधिक लोगों को प्रभावित करता है, जिसमें मुख्य रूप से कंपन, कठोरता, गतिविधि मंदता और मुद्रा अस्थिरता जैसे गतिविधि लक्षण प्रदर्शित होते हैं। PD गंभीरता का पारंपरिक मूल्यांकन मुख्य रूप से UPDRS (एकीकृत पार्किंसन रोग रेटिंग स्केल) और MDS-UPDRS जैसे नैदानिक पैमानों पर निर्भर करता है।
वीडियो विश्लेषण के आधार पर गैर-आक्रामक, उद्देश्यपूर्ण, सुलभ PD गंभीरता स्वचालित मूल्यांकन विधि विकसित करना, कंप्यूटर विजन और मशीन लर्निंग तकनीकों का उपयोग करके सटीक रोग वर्गीकरण प्राप्त करना, और नैदानिक चिकित्सकों को विश्वसनीय सहायक निदान उपकरण प्रदान करना।
इनपुट: उंगली टैपिंग वीडियो से प्राप्त 57-आयामी विशेषता वेक्टर, जिसमें अस्थायी, आवृत्ति और आयाम विशेषताएं शामिल हैं
आउटपुट: पाँच-वर्गीय PD गंभीरता वर्गीकरण परिणाम (Class 0-4)
बाधाएं: MDS-UPDRS मानक के आधार पर विशेषज्ञ-एनोटेटेड डेटा
मौजूदा कार्य की तुलना में, यह पेपर पहली बार CNN, BiLSTM और ध्यान तंत्र को बहु-वर्गीय PD गंभीरता वर्गीकरण के लिए पूरी तरह से एकीकृत करता है, वीडियो-व्युत्पन्न गतिविधि विशेषताओं पर बेहतर प्रदर्शन प्राप्त करता है।
1 Md Saiful Islam et al. Using ai to measure parkinson's disease severity at home. NPJ digital medicine, 6(1):156, 2023.
27 Daniel Deng et al. Interpretable video-based tracking and quantification of parkinsonism clinical motor states. npj Parkinson's Disease, 10(1):122, 2024.
30 Umesh Kumar Lilhore et al. Hybrid cnn-lstm model with efficient hyperparameter tuning for prediction of parkinson's disease. Scientific Reports, 13(1):14605, 2023.
समग्र मूल्यांकन: यह एक तकनीकी रूप से ठोस और अनुप्रयोग मूल्य स्पष्ट अनुसंधान पेपर है। लेखकों द्वारा प्रस्तावित ध्यान-संवर्धित CNN-BiLSTM आर्किटेक्चर PD बहु-वर्गीय पहचान कार्य पर अच्छे परिणाम प्राप्त करता है, जो इस क्षेत्र को मूल्यवान तकनीकी योगदान प्रदान करता है। हालांकि डेटा आकार और सामान्यीकरण जैसी सीमाएं हैं, लेकिन समग्र अनुसंधान गुणवत्ता अच्छी है और इसमें अच्छी नैदानिक अनुप्रयोग संभावनाएं हैं।