This study introduces a novel auditory neuronal network model that integrates speech signal input, cochlear processing, and a cortical excitatory-inhibitory (E-I) balanced network. Our findings reveal that increasing noise intensity attenuates the auditory steady-state responses in gamma oscillations, a mechanism validated by public EEG data. Moreover, enhancing the brain's E-I balance significantly improves auditory attention during speech recognition. This work not only elucidates the neural basis of selective attention in noisy environments but also offers a promising therapeutic strategy for auditory attention disorders, marking a significant advancement in the field of computational neuroscience and auditory processing.
पेपर ID : 2504.04329शीर्षक : श्रवण स्थिर-अवस्था प्रतिक्रिया और उत्तेजक-निरोधक संतुलित तंत्रिका नेटवर्क में गामा दोलनलेखक : Duoyu Feng, Jiajia Liवर्गीकरण : q-bio.NC (मात्रात्मक जीव विज्ञान - न्यूरॉन्स और संज्ञान)संस्थान : शी'आन आर्किटेक्चर एंड टेक्नोलॉजी विश्वविद्यालय सूचना और नियंत्रण इंजीनियरिंग कॉलेज, सेंट्रल थिएटर जनरल हॉस्पिटल न्यूरोसर्जरी विभागपेपर लिंक : https://arxiv.org/abs/2504.04329 यह अध्ययन एक नवीन श्रवण तंत्रिका नेटवर्क मॉडल प्रस्तुत करता है जो भाषण संकेत इनपुट, कोक्लीयर प्रसंस्करण और कॉर्टिकल उत्तेजक-निरोधक (E-I) संतुलन नेटवर्क को एकीकृत करता है। अध्ययन से पता चलता है कि शोर की तीव्रता में वृद्धि गामा दोलन में श्रवण स्थिर-अवस्था प्रतिक्रिया को कमजोर करती है, यह तंत्र सार्वजनिक EEG डेटा द्वारा सत्यापित है। इसके अतिरिक्त, मस्तिष्क के E-I संतुलन को बढ़ाने से भाषण पहचान प्रक्रिया में श्रवण ध्यान में उल्लेखनीय सुधार होता है। यह कार्य न केवल शोरगुल वाले वातावरण में चयनात्मक ध्यान के तंत्रिका आधार को स्पष्ट करता है, बल्कि श्रवण ध्यान विकारों के लिए आशाजनक चिकित्सीय रणनीतियाँ भी प्रदान करता है।
यह अध्ययन क्लासिक "कॉकटेल पार्टी समस्या" (cocktail party problem) को हल करने का लक्ष्य रखता है—अर्थात्, मानव मस्तिष्क शोरगुल वाले वातावरण में लक्ष्य भाषण संकेत को प्रभावी ढंग से कैसे समझता है। विशेष रूप से हल की जाने वाली समस्याओं में शामिल हैं:
मस्तिष्क की कॉर्टेक्स पर्यावरणीय शोर में भाषण जानकारी को कैसे समझती है गामा दोलन और श्रवण ध्यान निर्माण के बीच संबंध उत्तेजक-निरोधक संतुलन पर ध्यान विनियमन का तंत्र सैद्धांतिक महत्व : मानव मस्तिष्क की भाषण पहचान तंत्र की गहन समझ कम्प्यूटेशनल न्यूरोसाइंस के लिए महत्वपूर्ण हैअनुप्रयोग मूल्य : मानव-कंप्यूटर इंटरैक्शन (HCI) में भाषण पहचान प्रणालियों के अनुकूलन के लिए सैद्धांतिक आधार प्रदान करता हैनैदानिक महत्व : श्रवण ध्यान विकार, श्रवण हानि जैसी बीमारियों के लिए संभावित चिकित्सीय रणनीतियाँ प्रदान करता हैमौजूदा अनुसंधान अधिकतर "ब्लैक बॉक्स" मॉडल का उपयोग करते हैं, मॉडल व्याख्यात्मकता की कमी है तंत्रिका दोलन गतिशीलता तंत्र के गहन विश्लेषण की कमी है उत्तेजक-निरोधक संतुलन द्वारा ध्यान विनियमन के तंत्र की समझ अपर्याप्त है संपूर्ण श्रवण प्रसंस्करण मॉडल का निर्माण : भाषण इनपुट-कोक्लीयर-थैलेमस-कॉर्टेक्स के संपूर्ण श्रवण पथ मॉडल को एकीकृत कियागामा दोलन एन्कोडिंग तंत्र का प्रकटीकरण : गामा दोलन शिखर पैटर्न भाषण संकेत विशेषताओं को एन्कोड कर सकते हैंशोर मास्किंग प्रभाव का सत्यापन : कम्प्यूटेशनल मॉडल और EEG डेटा के माध्यम से शोर के गामा दोलन पर दमनकारी प्रभाव का सत्यापनध्यान विनियमन रणनीति का प्रस्ताव : E-I संतुलन को बढ़ाने से श्रवण ध्यान में सुधार हो सकता है, नैदानिक उपचार के लिए नई सोच प्रदान करता हैअवस्था संक्रमण एटलस की स्थापना : शोर तीव्रता और E-I संतुलन पैरामीटर के तहत कॉर्टिकल धारणा अवस्था संक्रमण का निर्माणश्रवण कॉर्टेक्स तंत्रिका नेटवर्क की विभिन्न शोर स्थितियों के तहत भाषण संकेत प्रतिक्रिया विशेषताओं का अध्ययन, विशेष रूप से ध्यान केंद्रित करना:
इनपुट : सतत भाषण संकेत, शुद्ध टोन संकेत, विभिन्न तीव्रता का शोरआउटपुट : स्थानीय क्षेत्र विभव (LFP), न्यूरॉन निर्वहन पैटर्न, गामा बैंड दोलन (GBO)उद्देश्य : शोर मास्किंग तंत्र और ध्यान पर E-I संतुलन के विनियमन प्रभाव को समझनाX = FFT_transform(Voice_Signal) (1)
x = envelope(X) (2)
x' = (x - x_min)/(x_max - x_min) (3)
I_thalamus,i^E = A_i^E · x' (4)
I_thalamus,j^I = A_j^I · x' (5)
जहाँ, A_i^E : A_j^I = 5:2, कॉर्टिकल नेटवर्क के शारीरिक पैरामीटर अनुपात का अनुकरण करता है।
200 उत्तेजक पिरामिड न्यूरॉन्स और 50 निरोधक अंतर्निहित न्यूरॉन्स वाला E-I संतुलन नेटवर्क का निर्माण:
उत्तेजक न्यूरॉन्स (द्वि-कक्ष मॉडल) :
C_m,E dV_E,i/dt = f_E(V_E,i, m_i, n_i, h_i) + g_c/p(V_Ed,i - V_E,i) (6)
C_m,E dV_Ed,i/dt = f_Ed(V_Ed,i, Ca^2+, s_n) + g_c/(1-p)(V_E,i - V_Ed,i) + I_syn,i^Ed + I_thalamus,i^Ed (7)
निरोधक न्यूरॉन्स (तीव्र निर्वहन अंतर्निहित न्यूरॉन मॉडल) :
C_m,I dV_I,j/dt = f_I(V_I,j, m_j, n_j, h_j) + I_syn,j^I + I_thalamus,j^I (8)
उत्तेजक न्यूरॉन्स द्वारा प्राप्त सिनैप्टिक करंट :
I_syn,i^Ed = Σ[g_I w_k^I→E y_GABA,k(V_Ed,i - V_GABA)] + Σ[g_E y_AMPA,k(V_Ed,i - V_AMPA)/N_E] (9)
निरोधक न्यूरॉन्स द्वारा प्राप्त सिनैप्टिक करंट :
I_syn,j^I = Σ[g_E w_k^E→I y_AMPA,k(V_I,j - V_AMPA)] + g_GABA,j^autapse y_GABA(V_I,j - V_GABA) + Σ[g_I y_GABA,k(V_I,j - V_GABA)/N_I] (13)
बहु-स्तरीय एकीकरण मॉडल : पहली बार कोक्लीयर आवृत्ति पृथक्करण, थैलेमस विशेषता विश्लेषण और कॉर्टिकल E-I नेटवर्क को एकीकृत ढांचे में एकीकृत कियागतिशीलता विश्लेषण विधि : शोर के न्यूरॉन निर्वहन पैटर्न पर प्रभाव तंत्र को प्रकट करने के लिए विभाजन विश्लेषण का उपयोगगामा दोलन एन्कोडिंग सिद्धांत : गामा दोलन शिखर पैटर्न द्वारा भाषण विशेषताओं को एन्कोड करने का नया तंत्र प्रस्तावितअवस्था संक्रमण नियंत्रण : पैरामीटर समायोजन के माध्यम से धारणा अवस्था के नियंत्रणीय संक्रमण की विधि की खोजसिमुलेशन डेटा :सतत भाषण संकेत (शोर के साथ/बिना शोर की स्थिति) 200-1000Hz शुद्ध टोन संकेत 20-80dB सफेद शोर सत्यापन डेटा :सार्वजनिक EEG डेटासेट41 : 13 प्रतिभागी उत्तेजना: 1000Hz और 500Hz शुद्ध टोन, 76dB सफेद शोर प्रत्येक उत्तेजना 60ms तक चलती है, प्रयोग अवधि 13 मिनट गामा बैंड दोलन (GBO) : 30-100Hz आवृत्ति बैंड शक्तिशिखर आयाम : GBO वक्र का अधिकतम मानशिखर एन्ट्रॉपी : Shannon एन्ट्रॉपी पर आधारित GBO शिखर एन्कोडिंग सूचना मात्राE-I अनुपात : उत्तेजक और निरोधक सिनैप्टिक पश्च-धारा का अनुपातIIR डिजिटल फिल्टर : 30-100Hz गामा आवृत्ति बैंड निष्कर्षणशक्ति स्पेक्ट्रम विश्लेषण : फ़िल्टर किए गए संकेत की वर्ग शक्ति की गणनाविभाजन विश्लेषण : प्रणाली स्थिरता और निर्वहन पैटर्न संक्रमण का अध्ययनसमय-आवृत्ति रूपांतरण : भाषण संकेत की आवृत्ति डोमेन विशेषताओं का विश्लेषणशोर-रहित स्थिति : GBO शिखर आयाम 40-60 श्रेणी में, निर्वहन आवृत्ति >50Hzशोर स्थिति : GBO शिखर आयाम 0-20 श्रेणी तक गिरता है, निर्वहन आवृत्ति <35Hzमहत्वपूर्ण सीमा : 40dB शोर के महत्वपूर्ण प्रभाव का क्रांतिक बिंदु है, Hahad आदि45 के प्रायोगिक परिणामों के अनुरूपशुद्ध टोन आवृत्ति 200Hz से 1000Hz तक बढ़ने पर, GBO शिखर आरोही प्रवृत्ति दिखाता है सफेद शोर उत्तेजना के तहत GBO शिखर हमेशा 20 से कम रहता है, शुद्ध टोन उत्तेजना से काफी कम EEG सत्यापन डेटा समान आवृत्ति-निर्भर पैटर्न दिखाता है उत्तेजक सिनैप्टिक चालकता g_E को 0.1 से 0.6 तक बढ़ाने पर:
E-I अनुपात में उल्लेखनीय वृद्धि GBO अधिकतम आयाम लगभग 20 से 60 तक बढ़ता है शिखर एन्कोडिंग एन्ट्रॉपी में उल्लेखनीय सुधार उत्तेजक न्यूरॉन्स : Hopf विभाजन बिंदु HBPE,L और HBPE,R के बीच निर्वहन अवस्था में प्रवेश करते हैंनिरोधक न्यूरॉन्स : समान विभाजन विशेषताएँ, लेकिन IPSC परिवर्तन छोटा हैमहत्वपूर्ण खोज : शोर मुख्य रूप से EPSC गतिशीलता को प्रभावित करके न्यूरॉन निर्वहन पैटर्न को विनियमित करता हैशोर तीव्रता (20-80dB) और g_E (0.1-1.0) का द्वि-आयामी पैरामीटर स्पेस निर्माण:
अवस्था ① धारणा : कम शोर, अच्छी भाषण एन्कोडिंग क्षमताअवस्था ② मास्किंग : उच्च शोर, भाषण धारणा क्षमता का नुकसानअवस्था ③ पुनः प्राप्ति : g_E को बढ़ाकर धारणा क्षमता की पुनः प्राप्तिअवस्था ④ तीव्र लहरें-तरंगें : अत्यधिक उत्तेजना अवस्था (100-200Hz)एन्कोडिंग तंत्र : गामा दोलन शिखर का स्पेशियो-टेम्पोरल पैटर्न भाषण संकेत विशेषताओं को एन्कोड कर सकता हैमास्किंग तंत्र : शोर मुख्य रूप से EPSC को कम करके न्यूरॉन उत्तेजना को कम करता हैपुनः प्राप्ति रणनीति : E-I संतुलन को बढ़ाने से शोर वातावरण में ध्यान की पुनः प्राप्ति संभव हैमहत्वपूर्ण घटना : स्पष्ट शोर तीव्रता सीमा (~40dB) और विनियमन पैरामीटर श्रेणी मौजूद हैKerlin आदि4 : कॉकटेल पार्टी वातावरण में ध्यान लाभ नियंत्रण Petkov आदि20 : मानव श्रवण कॉर्टेक्स का ध्यान विनियमन Jensen आदि47 : गामा दोलन और ध्यान स्मृति के बीच संबंध Wang & Buzsáki33 : हिप्पोकैम्पस अंतर्निहित न्यूरॉन नेटवर्क का गामा दोलन Economo & White48 : उत्तेजक निरोधक संतुलन का गामा दोलन पर नियंत्रण वर्तमान कार्य की तुलना में मौजूदा कार्य के लाभ: संपूर्ण श्रवण पथ को एकीकृत करता है, व्याख्यात्मक गतिशीलता तंत्र प्रदान करता है मौजूदा अनुसंधान अधिकतर एकल स्तर के E-I संतुलन पर ध्यान केंद्रित करते हैं यह कार्य पहली बार E-I संतुलन को श्रवण ध्यान और भाषण पहचान से जोड़ता है मात्रात्मक विनियमन रणनीति और पैरामीटर श्रेणी प्रदान करता है गामा दोलन ध्यान का तंत्रिका मार्कर है : गामा दोलन आयाम एन्कोडिंग सीधे ध्यान स्तर को प्रतिबिंबित करता हैशोर EPSC पथ के माध्यम से ध्यान को प्रभावित करता है : शोर मुख्य रूप से उत्तेजक सिनैप्टिक करंट को कम करके ध्यान को कमजोर करता हैE-I संतुलन ध्यान अवस्था को विनियमित कर सकता है : उत्तेजक निरोधक संतुलन को बढ़ाने से शोर वातावरण में भाषण धारणा में सुधार हो सकता हैनियंत्रणीय अवस्था संक्रमण तंत्र मौजूद है : पैरामीटर समायोजन के माध्यम से धारणा अवस्था के प्रतिवर्ती संक्रमण को प्राप्त करना संभव हैमॉडल सरलीकरण : कोक्लीयर-थैलेमस प्रणाली सरलीकृत संकेत प्रसंस्करण मॉडल का उपयोग करती हैपैरामीटर निश्चित : कुछ शारीरिक पैरामीटर साहित्य मानों पर आधारित हैं, व्यक्तिगत भिन्नता संभव हैसत्यापन श्रेणी : मुख्य रूप से शुद्ध टोन और सरल भाषण पर केंद्रित, जटिल भाषण वातावरण सत्यापन सीमित हैनैदानिक अनुवाद : कम्प्यूटेशनल मॉडल से वास्तविक चिकित्सीय अनुप्रयोग तक अधिक सत्यापन की आवश्यकता हैबहु-मोडल एकीकरण : दृश्य जैसे अन्य संवेदी चैनलों की जानकारी प्रसंस्करण को शामिल करनाव्यक्तिगत मॉडलिंग : व्यक्तिगत भिन्नता के पैरामीटर अनुकूलन पर विचार करनानैदानिक अनुप्रयोग : E-I संतुलन विनियमन पर आधारित चिकित्सीय योजना विकसित करनातंत्रिका नियंत्रण : ऑप्टोजेनेटिक्स आदि तकनीकों के साथ प्रायोगिक सत्यापन को जोड़नासैद्धांतिक नवाचार :पहली बार गामा दोलन शिखर द्वारा भाषण एन्कोडिंग तंत्र का प्रस्ताव E-I संतुलन और श्रवण ध्यान के बीच मात्रात्मक संबंध स्थापित व्याख्यात्मक तंत्रिका गतिशीलता मॉडल प्रदान करता है विधि पूर्णता :कोक्लीयर से कॉर्टेक्स तक संपूर्ण श्रवण पथ को एकीकृत करता है कम्प्यूटेशनल मॉडलिंग और प्रायोगिक डेटा सत्यापन को जोड़ता है कई विश्लेषण विधियों का उपयोग करता है (विभाजन विश्लेषण, समय-आवृत्ति विश्लेषण आदि) व्यावहारिक मूल्य :श्रवण ध्यान विकारों के लिए संभावित चिकित्सीय रणनीति प्रदान करता है कृत्रिम बुद्धिमत्ता भाषण पहचान के लिए जैविक प्रेरणा प्रदान करता है संचालन योग्य पैरामीटर विनियमन ढांचा स्थापित करता है मॉडल जटिलता :बड़ी संख्या में पैरामीटर शामिल हैं, पैरामीटर ट्यूनिंग जटिलता अधिक है कुछ जैविक विवरण अत्यधिक सरलीकृत हो सकते हैं कम्प्यूटेशनल लागत अधिक है सत्यापन सीमाएँ :EEG सत्यापन डेटा नमूना आकार अपेक्षाकृत छोटा है (13 व्यक्ति) अधिक जटिल भाषण वातावरण का सत्यापन अभाव है नैदानिक प्रभावकारिता को आगे सत्यापन की आवश्यकता है सामान्यीकरण समस्या :मुख्य रूप से सामान्य श्रवण वाली जनसंख्या पर केंद्रित रोग संबंधी अवस्था में मॉडल प्रयोज्यता अज्ञात है अंतर-सांस्कृतिक, अंतर-भाषा प्रयोज्यता को सत्यापन की आवश्यकता है शैक्षणिक योगदान :कम्प्यूटेशनल न्यूरोसाइंस क्षेत्र के लिए नया मॉडलिंग ढांचा प्रदान करता है श्रवण ध्यान तंत्र की समझ को आगे बढ़ाता है सिद्धांत और प्रयोग के बीच पुल स्थापित करता है अनुप्रयोग संभावनाएँ :श्रवण यंत्र और कृत्रिम कोक्लीयर के एल्गोरिदम अनुकूलन में सहायता करता है भाषण पहचान प्रणाली की शोर-प्रतिरोधी क्षमता में सुधार करता है ध्यान कमी विकार आदि बीमारियों के नए उपचार विधि प्रदान करता है पुनरुत्पादनीयता :विस्तृत गणितीय मॉडल और पैरामीटर प्रदान करता है सार्वजनिक EEG डेटासेट सत्यापन का उपयोग करता है विधि विवरण अपेक्षाकृत संपूर्ण है मौलिक अनुसंधान : श्रवण तंत्रिका विज्ञान, संज्ञानात्मक तंत्रिका विज्ञान अनुसंधाननैदानिक अनुप्रयोग : श्रवण ध्यान विकार, श्रवण हानि का निदान और उपचारइंजीनियरिंग अनुप्रयोग : बुद्धिमान भाषण प्रणाली, श्रवण उपकरणों के एल्गोरिदम अनुकूलनशैक्षणिक अनुप्रयोग : तंत्रिका इंजीनियरिंग और कम्प्यूटेशनल न्यूरोसाइंस की शिक्षा के लिए केस स्टडीयह पेपर 65 संबंधित संदर्भों का हवाला देता है, मुख्य रूप से शामिल हैं:
मुख्य सैद्धांतिक साहित्य :
Wang, X. J., & Buzsáki, G. (1996). हिप्पोकैम्पस अंतर्निहित न्यूरॉन नेटवर्क मॉडल में सिनैप्टिक निषेध द्वारा गामा दोलन Jensen, O., Kaiser, J., & Lachaux, J. P. (2007). ध्यान और स्मृति से जुड़े मानव गामा-आवृत्ति दोलन सत्यापन डेटा :
Delorme, A. (2022). श्रवण oddball कार्य से EEG डेटा। OpenNeuro पद्धति संदर्भ :
Economo, M. N., & White, J. A. (2012). झिल्ली गुण और उत्तेजक निरोधक संतुलन गामा-आवृत्ति दोलन को नियंत्रित करता है यह पेपर कम्प्यूटेशनल न्यूरोसाइंस और श्रवण प्रसंस्करण क्षेत्र में महत्वपूर्ण योगदान देता है, न केवल नया सैद्धांतिक ढांचा प्रदान करता है, बल्कि नैदानिक अनुप्रयोग के लिए नई दिशाएँ भी खोलता है। इसकी एकीकृत मॉडलिंग विधि और व्यवस्थित सत्यापन इस क्षेत्र के बाद के अनुसंधान के लिए ठोस आधार प्रदान करते हैं।