2025-11-24T01:19:17.947804

Auditory steady-state response and gamma oscillations in an excitatory-inhibitory balanced neuronal network

Feng, Li
This study introduces a novel auditory neuronal network model that integrates speech signal input, cochlear processing, and a cortical excitatory-inhibitory (E-I) balanced network. Our findings reveal that increasing noise intensity attenuates the auditory steady-state responses in gamma oscillations, a mechanism validated by public EEG data. Moreover, enhancing the brain's E-I balance significantly improves auditory attention during speech recognition. This work not only elucidates the neural basis of selective attention in noisy environments but also offers a promising therapeutic strategy for auditory attention disorders, marking a significant advancement in the field of computational neuroscience and auditory processing.
academic

श्रवण स्थिर-अवस्था प्रतिक्रिया और उत्तेजक-निरोधक संतुलित तंत्रिका नेटवर्क में गामा दोलन

मूल जानकारी

  • पेपर ID: 2504.04329
  • शीर्षक: श्रवण स्थिर-अवस्था प्रतिक्रिया और उत्तेजक-निरोधक संतुलित तंत्रिका नेटवर्क में गामा दोलन
  • लेखक: Duoyu Feng, Jiajia Li
  • वर्गीकरण: q-bio.NC (मात्रात्मक जीव विज्ञान - न्यूरॉन्स और संज्ञान)
  • संस्थान: शी'आन आर्किटेक्चर एंड टेक्नोलॉजी विश्वविद्यालय सूचना और नियंत्रण इंजीनियरिंग कॉलेज, सेंट्रल थिएटर जनरल हॉस्पिटल न्यूरोसर्जरी विभाग
  • पेपर लिंक: https://arxiv.org/abs/2504.04329

सारांश

यह अध्ययन एक नवीन श्रवण तंत्रिका नेटवर्क मॉडल प्रस्तुत करता है जो भाषण संकेत इनपुट, कोक्लीयर प्रसंस्करण और कॉर्टिकल उत्तेजक-निरोधक (E-I) संतुलन नेटवर्क को एकीकृत करता है। अध्ययन से पता चलता है कि शोर की तीव्रता में वृद्धि गामा दोलन में श्रवण स्थिर-अवस्था प्रतिक्रिया को कमजोर करती है, यह तंत्र सार्वजनिक EEG डेटा द्वारा सत्यापित है। इसके अतिरिक्त, मस्तिष्क के E-I संतुलन को बढ़ाने से भाषण पहचान प्रक्रिया में श्रवण ध्यान में उल्लेखनीय सुधार होता है। यह कार्य न केवल शोरगुल वाले वातावरण में चयनात्मक ध्यान के तंत्रिका आधार को स्पष्ट करता है, बल्कि श्रवण ध्यान विकारों के लिए आशाजनक चिकित्सीय रणनीतियाँ भी प्रदान करता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

मुख्य समस्या

यह अध्ययन क्लासिक "कॉकटेल पार्टी समस्या" (cocktail party problem) को हल करने का लक्ष्य रखता है—अर्थात्, मानव मस्तिष्क शोरगुल वाले वातावरण में लक्ष्य भाषण संकेत को प्रभावी ढंग से कैसे समझता है। विशेष रूप से हल की जाने वाली समस्याओं में शामिल हैं:

  1. मस्तिष्क की कॉर्टेक्स पर्यावरणीय शोर में भाषण जानकारी को कैसे समझती है
  2. गामा दोलन और श्रवण ध्यान निर्माण के बीच संबंध
  3. उत्तेजक-निरोधक संतुलन पर ध्यान विनियमन का तंत्र

समस्या की महत्ता

  • सैद्धांतिक महत्व: मानव मस्तिष्क की भाषण पहचान तंत्र की गहन समझ कम्प्यूटेशनल न्यूरोसाइंस के लिए महत्वपूर्ण है
  • अनुप्रयोग मूल्य: मानव-कंप्यूटर इंटरैक्शन (HCI) में भाषण पहचान प्रणालियों के अनुकूलन के लिए सैद्धांतिक आधार प्रदान करता है
  • नैदानिक महत्व: श्रवण ध्यान विकार, श्रवण हानि जैसी बीमारियों के लिए संभावित चिकित्सीय रणनीतियाँ प्रदान करता है

मौजूदा विधियों की सीमाएँ

  • मौजूदा अनुसंधान अधिकतर "ब्लैक बॉक्स" मॉडल का उपयोग करते हैं, मॉडल व्याख्यात्मकता की कमी है
  • तंत्रिका दोलन गतिशीलता तंत्र के गहन विश्लेषण की कमी है
  • उत्तेजक-निरोधक संतुलन द्वारा ध्यान विनियमन के तंत्र की समझ अपर्याप्त है

मुख्य योगदान

  1. संपूर्ण श्रवण प्रसंस्करण मॉडल का निर्माण: भाषण इनपुट-कोक्लीयर-थैलेमस-कॉर्टेक्स के संपूर्ण श्रवण पथ मॉडल को एकीकृत किया
  2. गामा दोलन एन्कोडिंग तंत्र का प्रकटीकरण: गामा दोलन शिखर पैटर्न भाषण संकेत विशेषताओं को एन्कोड कर सकते हैं
  3. शोर मास्किंग प्रभाव का सत्यापन: कम्प्यूटेशनल मॉडल और EEG डेटा के माध्यम से शोर के गामा दोलन पर दमनकारी प्रभाव का सत्यापन
  4. ध्यान विनियमन रणनीति का प्रस्ताव: E-I संतुलन को बढ़ाने से श्रवण ध्यान में सुधार हो सकता है, नैदानिक उपचार के लिए नई सोच प्रदान करता है
  5. अवस्था संक्रमण एटलस की स्थापना: शोर तीव्रता और E-I संतुलन पैरामीटर के तहत कॉर्टिकल धारणा अवस्था संक्रमण का निर्माण

विधि विवरण

कार्य परिभाषा

श्रवण कॉर्टेक्स तंत्रिका नेटवर्क की विभिन्न शोर स्थितियों के तहत भाषण संकेत प्रतिक्रिया विशेषताओं का अध्ययन, विशेष रूप से ध्यान केंद्रित करना:

  • इनपुट: सतत भाषण संकेत, शुद्ध टोन संकेत, विभिन्न तीव्रता का शोर
  • आउटपुट: स्थानीय क्षेत्र विभव (LFP), न्यूरॉन निर्वहन पैटर्न, गामा बैंड दोलन (GBO)
  • उद्देश्य: शोर मास्किंग तंत्र और ध्यान पर E-I संतुलन के विनियमन प्रभाव को समझना

मॉडल आर्किटेक्चर

1. भाषण इनपुट-कोक्लीयर युग्मन प्रणाली

X = FFT_transform(Voice_Signal)                    (1)
x = envelope(X)                                    (2)
x' = (x - x_min)/(x_max - x_min)                  (3)
I_thalamus,i^E = A_i^E · x'                       (4)
I_thalamus,j^I = A_j^I · x'                       (5)

जहाँ, A_i^E : A_j^I = 5:2, कॉर्टिकल नेटवर्क के शारीरिक पैरामीटर अनुपात का अनुकरण करता है।

2. श्रवण कॉर्टेक्स तंत्रिका नेटवर्क मॉडल

200 उत्तेजक पिरामिड न्यूरॉन्स और 50 निरोधक अंतर्निहित न्यूरॉन्स वाला E-I संतुलन नेटवर्क का निर्माण:

उत्तेजक न्यूरॉन्स (द्वि-कक्ष मॉडल):

  • कोशिका काय समीकरण:
C_m,E dV_E,i/dt = f_E(V_E,i, m_i, n_i, h_i) + g_c/p(V_Ed,i - V_E,i)    (6)
  • डेंड्राइट समीकरण:
C_m,E dV_Ed,i/dt = f_Ed(V_Ed,i, Ca^2+, s_n) + g_c/(1-p)(V_E,i - V_Ed,i) + I_syn,i^Ed + I_thalamus,i^Ed    (7)

निरोधक न्यूरॉन्स (तीव्र निर्वहन अंतर्निहित न्यूरॉन मॉडल):

C_m,I dV_I,j/dt = f_I(V_I,j, m_j, n_j, h_j) + I_syn,j^I + I_thalamus,j^I    (8)

3. सिनैप्टिक करंट मॉडल

उत्तेजक न्यूरॉन्स द्वारा प्राप्त सिनैप्टिक करंट:

I_syn,i^Ed = Σ[g_I w_k^I→E y_GABA,k(V_Ed,i - V_GABA)] + Σ[g_E y_AMPA,k(V_Ed,i - V_AMPA)/N_E]    (9)

निरोधक न्यूरॉन्स द्वारा प्राप्त सिनैप्टिक करंट:

I_syn,j^I = Σ[g_E w_k^E→I y_AMPA,k(V_I,j - V_AMPA)] + g_GABA,j^autapse y_GABA(V_I,j - V_GABA) + Σ[g_I y_GABA,k(V_I,j - V_GABA)/N_I]    (13)

तकनीकी नवाचार बिंदु

  1. बहु-स्तरीय एकीकरण मॉडल: पहली बार कोक्लीयर आवृत्ति पृथक्करण, थैलेमस विशेषता विश्लेषण और कॉर्टिकल E-I नेटवर्क को एकीकृत ढांचे में एकीकृत किया
  2. गतिशीलता विश्लेषण विधि: शोर के न्यूरॉन निर्वहन पैटर्न पर प्रभाव तंत्र को प्रकट करने के लिए विभाजन विश्लेषण का उपयोग
  3. गामा दोलन एन्कोडिंग सिद्धांत: गामा दोलन शिखर पैटर्न द्वारा भाषण विशेषताओं को एन्कोड करने का नया तंत्र प्रस्तावित
  4. अवस्था संक्रमण नियंत्रण: पैरामीटर समायोजन के माध्यम से धारणा अवस्था के नियंत्रणीय संक्रमण की विधि की खोज

प्रायोगिक सेटअप

डेटासेट

  1. सिमुलेशन डेटा:
    • सतत भाषण संकेत (शोर के साथ/बिना शोर की स्थिति)
    • 200-1000Hz शुद्ध टोन संकेत
    • 20-80dB सफेद शोर
  2. सत्यापन डेटा:
    • सार्वजनिक EEG डेटासेट41: 13 प्रतिभागी
    • उत्तेजना: 1000Hz और 500Hz शुद्ध टोन, 76dB सफेद शोर
    • प्रत्येक उत्तेजना 60ms तक चलती है, प्रयोग अवधि 13 मिनट

मूल्यांकन मेट्रिक्स

  1. गामा बैंड दोलन (GBO): 30-100Hz आवृत्ति बैंड शक्ति
  2. शिखर आयाम: GBO वक्र का अधिकतम मान
  3. शिखर एन्ट्रॉपी: Shannon एन्ट्रॉपी पर आधारित GBO शिखर एन्कोडिंग सूचना मात्रा
  4. E-I अनुपात: उत्तेजक और निरोधक सिनैप्टिक पश्च-धारा का अनुपात

विश्लेषण विधियाँ

  1. IIR डिजिटल फिल्टर: 30-100Hz गामा आवृत्ति बैंड निष्कर्षण
  2. शक्ति स्पेक्ट्रम विश्लेषण: फ़िल्टर किए गए संकेत की वर्ग शक्ति की गणना
  3. विभाजन विश्लेषण: प्रणाली स्थिरता और निर्वहन पैटर्न संक्रमण का अध्ययन
  4. समय-आवृत्ति रूपांतरण: भाषण संकेत की आवृत्ति डोमेन विशेषताओं का विश्लेषण

प्रायोगिक परिणाम

मुख्य परिणाम

1. शोर मास्किंग प्रभाव सत्यापन

  • शोर-रहित स्थिति: GBO शिखर आयाम 40-60 श्रेणी में, निर्वहन आवृत्ति >50Hz
  • शोर स्थिति: GBO शिखर आयाम 0-20 श्रेणी तक गिरता है, निर्वहन आवृत्ति <35Hz
  • महत्वपूर्ण सीमा: 40dB शोर के महत्वपूर्ण प्रभाव का क्रांतिक बिंदु है, Hahad आदि45 के प्रायोगिक परिणामों के अनुरूप

2. आवृत्ति-निर्भर प्रतिक्रिया

  • शुद्ध टोन आवृत्ति 200Hz से 1000Hz तक बढ़ने पर, GBO शिखर आरोही प्रवृत्ति दिखाता है
  • सफेद शोर उत्तेजना के तहत GBO शिखर हमेशा 20 से कम रहता है, शुद्ध टोन उत्तेजना से काफी कम
  • EEG सत्यापन डेटा समान आवृत्ति-निर्भर पैटर्न दिखाता है

3. E-I संतुलन विनियमन प्रभाव

  • उत्तेजक सिनैप्टिक चालकता g_E को 0.1 से 0.6 तक बढ़ाने पर:
    • E-I अनुपात में उल्लेखनीय वृद्धि
    • GBO अधिकतम आयाम लगभग 20 से 60 तक बढ़ता है
    • शिखर एन्कोडिंग एन्ट्रॉपी में उल्लेखनीय सुधार

विलोपन प्रयोग

विभाजन गतिशीलता विश्लेषण

  • उत्तेजक न्यूरॉन्स: Hopf विभाजन बिंदु HBPE,L और HBPE,R के बीच निर्वहन अवस्था में प्रवेश करते हैं
  • निरोधक न्यूरॉन्स: समान विभाजन विशेषताएँ, लेकिन IPSC परिवर्तन छोटा है
  • महत्वपूर्ण खोज: शोर मुख्य रूप से EPSC गतिशीलता को प्रभावित करके न्यूरॉन निर्वहन पैटर्न को विनियमित करता है

अवस्था संक्रमण विश्लेषण

शोर तीव्रता (20-80dB) और g_E (0.1-1.0) का द्वि-आयामी पैरामीटर स्पेस निर्माण:

  1. अवस्था ① धारणा: कम शोर, अच्छी भाषण एन्कोडिंग क्षमता
  2. अवस्था ② मास्किंग: उच्च शोर, भाषण धारणा क्षमता का नुकसान
  3. अवस्था ③ पुनः प्राप्ति: g_E को बढ़ाकर धारणा क्षमता की पुनः प्राप्ति
  4. अवस्था ④ तीव्र लहरें-तरंगें: अत्यधिक उत्तेजना अवस्था (100-200Hz)

प्रायोगिक निष्कर्ष

  1. एन्कोडिंग तंत्र: गामा दोलन शिखर का स्पेशियो-टेम्पोरल पैटर्न भाषण संकेत विशेषताओं को एन्कोड कर सकता है
  2. मास्किंग तंत्र: शोर मुख्य रूप से EPSC को कम करके न्यूरॉन उत्तेजना को कम करता है
  3. पुनः प्राप्ति रणनीति: E-I संतुलन को बढ़ाने से शोर वातावरण में ध्यान की पुनः प्राप्ति संभव है
  4. महत्वपूर्ण घटना: स्पष्ट शोर तीव्रता सीमा (~40dB) और विनियमन पैरामीटर श्रेणी मौजूद है

संबंधित कार्य

श्रवण ध्यान तंत्र अनुसंधान

  • Kerlin आदि4: कॉकटेल पार्टी वातावरण में ध्यान लाभ नियंत्रण
  • Petkov आदि20: मानव श्रवण कॉर्टेक्स का ध्यान विनियमन
  • Jensen आदि47: गामा दोलन और ध्यान स्मृति के बीच संबंध

तंत्रिका नेटवर्क मॉडलिंग

  • Wang & Buzsáki33: हिप्पोकैम्पस अंतर्निहित न्यूरॉन नेटवर्क का गामा दोलन
  • Economo & White48: उत्तेजक निरोधक संतुलन का गामा दोलन पर नियंत्रण
  • वर्तमान कार्य की तुलना में मौजूदा कार्य के लाभ: संपूर्ण श्रवण पथ को एकीकृत करता है, व्याख्यात्मक गतिशीलता तंत्र प्रदान करता है

E-I संतुलन सिद्धांत

  • मौजूदा अनुसंधान अधिकतर एकल स्तर के E-I संतुलन पर ध्यान केंद्रित करते हैं
  • यह कार्य पहली बार E-I संतुलन को श्रवण ध्यान और भाषण पहचान से जोड़ता है
  • मात्रात्मक विनियमन रणनीति और पैरामीटर श्रेणी प्रदान करता है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. गामा दोलन ध्यान का तंत्रिका मार्कर है: गामा दोलन आयाम एन्कोडिंग सीधे ध्यान स्तर को प्रतिबिंबित करता है
  2. शोर EPSC पथ के माध्यम से ध्यान को प्रभावित करता है: शोर मुख्य रूप से उत्तेजक सिनैप्टिक करंट को कम करके ध्यान को कमजोर करता है
  3. E-I संतुलन ध्यान अवस्था को विनियमित कर सकता है: उत्तेजक निरोधक संतुलन को बढ़ाने से शोर वातावरण में भाषण धारणा में सुधार हो सकता है
  4. नियंत्रणीय अवस्था संक्रमण तंत्र मौजूद है: पैरामीटर समायोजन के माध्यम से धारणा अवस्था के प्रतिवर्ती संक्रमण को प्राप्त करना संभव है

सीमाएँ

  1. मॉडल सरलीकरण: कोक्लीयर-थैलेमस प्रणाली सरलीकृत संकेत प्रसंस्करण मॉडल का उपयोग करती है
  2. पैरामीटर निश्चित: कुछ शारीरिक पैरामीटर साहित्य मानों पर आधारित हैं, व्यक्तिगत भिन्नता संभव है
  3. सत्यापन श्रेणी: मुख्य रूप से शुद्ध टोन और सरल भाषण पर केंद्रित, जटिल भाषण वातावरण सत्यापन सीमित है
  4. नैदानिक अनुवाद: कम्प्यूटेशनल मॉडल से वास्तविक चिकित्सीय अनुप्रयोग तक अधिक सत्यापन की आवश्यकता है

भविष्य की दिशाएँ

  1. बहु-मोडल एकीकरण: दृश्य जैसे अन्य संवेदी चैनलों की जानकारी प्रसंस्करण को शामिल करना
  2. व्यक्तिगत मॉडलिंग: व्यक्तिगत भिन्नता के पैरामीटर अनुकूलन पर विचार करना
  3. नैदानिक अनुप्रयोग: E-I संतुलन विनियमन पर आधारित चिकित्सीय योजना विकसित करना
  4. तंत्रिका नियंत्रण: ऑप्टोजेनेटिक्स आदि तकनीकों के साथ प्रायोगिक सत्यापन को जोड़ना

गहन मूल्यांकन

शक्तियाँ

  1. सैद्धांतिक नवाचार:
    • पहली बार गामा दोलन शिखर द्वारा भाषण एन्कोडिंग तंत्र का प्रस्ताव
    • E-I संतुलन और श्रवण ध्यान के बीच मात्रात्मक संबंध स्थापित
    • व्याख्यात्मक तंत्रिका गतिशीलता मॉडल प्रदान करता है
  2. विधि पूर्णता:
    • कोक्लीयर से कॉर्टेक्स तक संपूर्ण श्रवण पथ को एकीकृत करता है
    • कम्प्यूटेशनल मॉडलिंग और प्रायोगिक डेटा सत्यापन को जोड़ता है
    • कई विश्लेषण विधियों का उपयोग करता है (विभाजन विश्लेषण, समय-आवृत्ति विश्लेषण आदि)
  3. व्यावहारिक मूल्य:
    • श्रवण ध्यान विकारों के लिए संभावित चिकित्सीय रणनीति प्रदान करता है
    • कृत्रिम बुद्धिमत्ता भाषण पहचान के लिए जैविक प्रेरणा प्रदान करता है
    • संचालन योग्य पैरामीटर विनियमन ढांचा स्थापित करता है

कमियाँ

  1. मॉडल जटिलता:
    • बड़ी संख्या में पैरामीटर शामिल हैं, पैरामीटर ट्यूनिंग जटिलता अधिक है
    • कुछ जैविक विवरण अत्यधिक सरलीकृत हो सकते हैं
    • कम्प्यूटेशनल लागत अधिक है
  2. सत्यापन सीमाएँ:
    • EEG सत्यापन डेटा नमूना आकार अपेक्षाकृत छोटा है (13 व्यक्ति)
    • अधिक जटिल भाषण वातावरण का सत्यापन अभाव है
    • नैदानिक प्रभावकारिता को आगे सत्यापन की आवश्यकता है
  3. सामान्यीकरण समस्या:
    • मुख्य रूप से सामान्य श्रवण वाली जनसंख्या पर केंद्रित
    • रोग संबंधी अवस्था में मॉडल प्रयोज्यता अज्ञात है
    • अंतर-सांस्कृतिक, अंतर-भाषा प्रयोज्यता को सत्यापन की आवश्यकता है

प्रभाव

  1. शैक्षणिक योगदान:
    • कम्प्यूटेशनल न्यूरोसाइंस क्षेत्र के लिए नया मॉडलिंग ढांचा प्रदान करता है
    • श्रवण ध्यान तंत्र की समझ को आगे बढ़ाता है
    • सिद्धांत और प्रयोग के बीच पुल स्थापित करता है
  2. अनुप्रयोग संभावनाएँ:
    • श्रवण यंत्र और कृत्रिम कोक्लीयर के एल्गोरिदम अनुकूलन में सहायता करता है
    • भाषण पहचान प्रणाली की शोर-प्रतिरोधी क्षमता में सुधार करता है
    • ध्यान कमी विकार आदि बीमारियों के नए उपचार विधि प्रदान करता है
  3. पुनरुत्पादनीयता:
    • विस्तृत गणितीय मॉडल और पैरामीटर प्रदान करता है
    • सार्वजनिक EEG डेटासेट सत्यापन का उपयोग करता है
    • विधि विवरण अपेक्षाकृत संपूर्ण है

प्रयोज्य परिदृश्य

  1. मौलिक अनुसंधान: श्रवण तंत्रिका विज्ञान, संज्ञानात्मक तंत्रिका विज्ञान अनुसंधान
  2. नैदानिक अनुप्रयोग: श्रवण ध्यान विकार, श्रवण हानि का निदान और उपचार
  3. इंजीनियरिंग अनुप्रयोग: बुद्धिमान भाषण प्रणाली, श्रवण उपकरणों के एल्गोरिदम अनुकूलन
  4. शैक्षणिक अनुप्रयोग: तंत्रिका इंजीनियरिंग और कम्प्यूटेशनल न्यूरोसाइंस की शिक्षा के लिए केस स्टडी

संदर्भ

यह पेपर 65 संबंधित संदर्भों का हवाला देता है, मुख्य रूप से शामिल हैं:

मुख्य सैद्धांतिक साहित्य:

  • Wang, X. J., & Buzsáki, G. (1996). हिप्पोकैम्पस अंतर्निहित न्यूरॉन नेटवर्क मॉडल में सिनैप्टिक निषेध द्वारा गामा दोलन
  • Jensen, O., Kaiser, J., & Lachaux, J. P. (2007). ध्यान और स्मृति से जुड़े मानव गामा-आवृत्ति दोलन

सत्यापन डेटा:

  • Delorme, A. (2022). श्रवण oddball कार्य से EEG डेटा। OpenNeuro

पद्धति संदर्भ:

  • Economo, M. N., & White, J. A. (2012). झिल्ली गुण और उत्तेजक निरोधक संतुलन गामा-आवृत्ति दोलन को नियंत्रित करता है

यह पेपर कम्प्यूटेशनल न्यूरोसाइंस और श्रवण प्रसंस्करण क्षेत्र में महत्वपूर्ण योगदान देता है, न केवल नया सैद्धांतिक ढांचा प्रदान करता है, बल्कि नैदानिक अनुप्रयोग के लिए नई दिशाएँ भी खोलता है। इसकी एकीकृत मॉडलिंग विधि और व्यवस्थित सत्यापन इस क्षेत्र के बाद के अनुसंधान के लिए ठोस आधार प्रदान करते हैं।