2025-11-24T01:19:17.947804

Auditory steady-state response and gamma oscillations in an excitatory-inhibitory balanced neuronal network

Feng, Li
This study introduces a novel auditory neuronal network model that integrates speech signal input, cochlear processing, and a cortical excitatory-inhibitory (E-I) balanced network. Our findings reveal that increasing noise intensity attenuates the auditory steady-state responses in gamma oscillations, a mechanism validated by public EEG data. Moreover, enhancing the brain's E-I balance significantly improves auditory attention during speech recognition. This work not only elucidates the neural basis of selective attention in noisy environments but also offers a promising therapeutic strategy for auditory attention disorders, marking a significant advancement in the field of computational neuroscience and auditory processing.
academic

Réponse auditive en régime permanent et oscillations gamma dans un réseau neuronal équilibré excitateur-inhibiteur

Informations de base

  • ID de l'article: 2504.04329
  • Titre: Auditory steady-state response and gamma oscillations in an excitatory-inhibitory balanced neuronal network
  • Auteurs: Duoyu Feng, Jiajia Li
  • Classification: q-bio.NC (Biologie quantitative - Neurones et cognition)
  • Institutions: École d'ingénierie de l'information et du contrôle, Université de technologie de Xi'an ; Département de neurochirurgie, Hôpital général du commandement militaire central
  • Lien de l'article: https://arxiv.org/abs/2504.04329

Résumé

Cette étude propose un nouveau modèle de réseau neuronal auditif intégrant l'entrée de signal vocal, le traitement cochléaire et un réseau cortical équilibré excitateur-inhibiteur (E-I). Les résultats montrent que l'augmentation de l'intensité du bruit affaiblit la réponse auditive en régime permanent dans les oscillations gamma, mécanisme vérifié par des données EEG publiques. De plus, l'amélioration de l'équilibre E-I cérébral améliore significativement l'attention auditive lors du traitement de la parole. Ce travail élucide non seulement les bases neurales de l'attention sélective en environnement bruyant, mais offre également des stratégies thérapeutiques prometteuses pour les troubles de l'attention auditive.

Contexte et motivation de la recherche

Problèmes fondamentaux

Cette étude vise à résoudre le problème classique du « cocktail party » — comment le cerveau humain perçoit efficacement les signaux vocaux cibles dans un environnement bruyant. Les problèmes spécifiques à résoudre incluent :

  1. Comment le cortex cérébral perçoit les informations vocales dans le bruit environnemental
  2. La relation entre les oscillations gamma et la construction de l'attention auditive
  3. Le mécanisme par lequel l'équilibre excitateur-inhibiteur régule l'attention

Importance du problème

  • Signification théorique: La compréhension approfondie du mécanisme de reconnaissance vocale du cerveau humain a une valeur importante pour la neuroscience computationnelle
  • Valeur applicative: Fournir une base théorique pour l'optimisation des systèmes de reconnaissance vocale dans l'interaction homme-machine (IHM)
  • Signification clinique: Offrir des stratégies thérapeutiques potentielles pour les troubles de l'attention auditive, la perte auditive et autres maladies

Limitations des méthodes existantes

  • Les recherches existantes utilisent principalement des modèles « boîte noire » manquant d'interprétabilité
  • Manque d'analyse approfondie des mécanismes dynamiques des oscillations neurales
  • Compréhension insuffisante du mécanisme par lequel l'équilibre E-I régule l'attention

Contributions principales

  1. Construction d'un modèle complet de traitement auditif: Intégration d'un modèle de voie auditive complet allant de l'entrée vocale à la cochlée, au thalamus et au cortex
  2. Révélation du mécanisme de codage des oscillations gamma: Découverte que le motif de pic des oscillations gamma peut coder les caractéristiques du signal vocal
  3. Vérification de l'effet de masquage du bruit: Validation par modèle computationnel et données EEG de l'effet inhibiteur du bruit sur les oscillations gamma
  4. Proposition d'une stratégie de régulation de l'attention: Découverte que l'amélioration de l'équilibre E-I peut améliorer l'attention auditive, offrant de nouvelles perspectives cliniques
  5. Établissement d'un atlas de transition d'état: Construction d'une cartographie des transitions d'état de perception corticale sous différents paramètres d'intensité de bruit et d'équilibre E-I

Détails méthodologiques

Définition de la tâche

Étude de la réponse du réseau neuronal du cortex auditif aux signaux vocaux dans différentes conditions de bruit, en se concentrant particulièrement sur :

  • Entrées: Signaux vocaux continus, signaux de ton pur, bruits de différentes intensités
  • Sorties: Potentiels de champ local (LFP), motifs de décharge neuronale, oscillations de bande gamma (GBO)
  • Objectif: Comprendre le mécanisme de masquage du bruit et l'effet de régulation de l'équilibre E-I sur l'attention

Architecture du modèle

1. Système d'entrée vocale couplé à la cochlée

X = FFT_transform(Voice_Signal)                    (1)
x = envelope(X)                                    (2)
x' = (x - x_min)/(x_max - x_min)                  (3)
I_thalamus,i^E = A_i^E · x'                       (4)
I_thalamus,j^I = A_j^I · x'                       (5)

Où A_i^E : A_j^I = 5:2, simulant les paramètres physiologiques du réseau cortical.

2. Modèle de réseau neuronal du cortex auditif

Construction d'un réseau E-I équilibré contenant 200 neurones pyramidaux excitateurs et 50 interneurones inhibiteurs :

Neurones excitateurs (modèle à deux compartiments):

  • Équation du soma :
C_m,E dV_E,i/dt = f_E(V_E,i, m_i, n_i, h_i) + g_c/p(V_Ed,i - V_E,i)    (6)
  • Équation dendritique :
C_m,E dV_Ed,i/dt = f_Ed(V_Ed,i, Ca^2+, s_n) + g_c/(1-p)(V_E,i - V_Ed,i) + I_syn,i^Ed + I_thalamus,i^Ed    (7)

Neurones inhibiteurs (modèle d'interneurones à décharge rapide):

C_m,I dV_I,j/dt = f_I(V_I,j, m_j, n_j, h_j) + I_syn,j^I + I_thalamus,j^I    (8)

3. Modèle de courant synaptique

Courant synaptique reçu par les neurones excitateurs:

I_syn,i^Ed = Σ[g_I w_k^I→E y_GABA,k(V_Ed,i - V_GABA)] + Σ[g_E y_AMPA,k(V_Ed,i - V_AMPA)/N_E]    (9)

Courant synaptique reçu par les neurones inhibiteurs:

I_syn,j^I = Σ[g_E w_k^E→I y_AMPA,k(V_I,j - V_AMPA)] + g_GABA,j^autapse y_GABA(V_I,j - V_GABA) + Σ[g_I y_GABA,k(V_I,j - V_GABA)/N_I]    (13)

Points d'innovation technique

  1. Modèle d'intégration multi-échelle: Première intégration de la séparation de fréquence cochléaire, de l'analyse des caractéristiques thalamiques et du réseau E-I cortical dans un cadre unifié
  2. Méthode d'analyse dynamique: Utilisation de l'analyse de bifurcation pour révéler les mécanismes d'influence du bruit sur les motifs de décharge neuronale
  3. Théorie du codage des oscillations gamma: Proposition d'un nouveau mécanisme de codage des caractéristiques vocales par les motifs de pic des oscillations gamma
  4. Régulation de la transition d'état: Découverte d'une méthode pour réaliser une transition d'état de perception contrôlable par ajustement des paramètres

Configuration expérimentale

Ensembles de données

  1. Données de simulation:
    • Signaux vocaux continus (avec/sans bruit)
    • Signaux de ton pur 200-1000Hz
    • Bruit blanc 20-80dB
  2. Données de vérification:
    • Ensemble de données EEG public41: 13 sujets
    • Stimuli: Tons purs 1000Hz et 500Hz, bruit blanc 76dB
    • Durée de stimulation 60ms, durée expérimentale 13 minutes

Indicateurs d'évaluation

  1. Oscillations de bande gamma (GBO): Puissance dans la bande 30-100Hz
  2. Amplitude de pic: Valeur maximale de la courbe GBO
  3. Entropie de pic: Quantité d'information de codage de pic GBO basée sur l'entropie de Shannon
  4. Ratio E-I: Rapport entre les courants post-synaptiques excitateurs et inhibiteurs

Méthodes d'analyse

  1. Filtre numérique IIR: Extraction de la bande gamma 30-100Hz
  2. Analyse spectrale de puissance: Calcul de la puissance au carré du signal filtré
  3. Analyse de bifurcation: Étude de la stabilité du système et de la transition des motifs de décharge
  4. Transformation temps-fréquence: Analyse des caractéristiques du domaine fréquentiel du signal vocal

Résultats expérimentaux

Résultats principaux

1. Vérification de l'effet de masquage du bruit

  • Condition sans bruit: Amplitude de pic GBO dans la plage 40-60, fréquence de décharge >50Hz
  • Condition avec bruit: Amplitude de pic GBO réduite à 0-20, fréquence de décharge <35Hz
  • Seuil critique: 40dB est le point critique d'influence significative du bruit, cohérent avec les résultats expérimentaux de Hahad et al.45

2. Réponse dépendante de la fréquence

  • Lorsque la fréquence du ton pur augmente de 200Hz à 1000Hz, le pic GBO montre une tendance croissante
  • Le pic GBO sous stimulation de bruit blanc reste toujours inférieur à 20, significativement inférieur à celui sous stimulation de ton pur
  • Les données de vérification EEG montrent un motif de dépendance fréquentielle similaire

3. Effet de régulation de l'équilibre E-I

  • Lorsque la conductance synaptique excitatrice g_E augmente de 0,1 à 0,6:
    • Le ratio E-I augmente significativement
    • L'amplitude maximale GBO passe d'environ 20 à 60
    • L'entropie de codage de pic s'améliore significativement

Expériences d'ablation

Analyse dynamique de bifurcation

  • Neurones excitateurs: Entrée en état de décharge entre les points de bifurcation Hopf HBPE,L et HBPE,R
  • Neurones inhibiteurs: Caractéristiques de bifurcation similaires, mais variation IPSC plus faible
  • Découverte clé: Le bruit régule principalement les motifs de décharge neuronale en affectant la dynamique EPSC

Analyse de transition d'état

Construction d'un espace de paramètres bidimensionnel d'intensité de bruit (20-80dB) et g_E (0,1-1,0):

  1. État ① Perception: Bruit faible, bonne capacité de codage vocal
  2. État ② Masquage: Bruit élevé, perte de capacité de perception vocale
  3. État ③ Récupération: Récupération de la capacité de perception par augmentation de g_E
  4. État ④ Ondulations aigues: État de surexcitation (100-200Hz)

Découvertes expérimentales

  1. Mécanisme de codage: Le motif spatio-temporel du pic des oscillations gamma peut coder les caractéristiques du signal vocal
  2. Mécanisme de masquage: Le bruit réduit principalement l'excitabilité neuronale en diminuant l'EPSC
  3. Stratégie de récupération: L'amélioration de l'équilibre E-I peut restaurer l'attention en environnement bruyant
  4. Phénomènes critiques: Existence de seuils clairs d'intensité de bruit (~40dB) et de plages de paramètres de régulation

Travaux connexes

Recherche sur les mécanismes de l'attention auditive

  • Kerlin et al.4: Contrôle du gain de l'attention dans l'environnement du cocktail party
  • Petkov et al.20: Régulation de l'attention dans le cortex auditif humain
  • Jensen et al.47: Relation entre oscillations gamma et mémoire d'attention

Modélisation de réseaux de neurones

  • Wang & Buzsáki33: Oscillations gamma dans les réseaux d'interneurones hippocampiques
  • Economo & White48: Contrôle de l'équilibre excitateur-inhibiteur sur les oscillations gamma
  • Avantages par rapport aux travaux existants: Intégration de la voie auditive complète, fourniture d'un mécanisme dynamique interprétable

Théorie de l'équilibre E-I

  • Les recherches existantes se concentrent principalement sur l'équilibre E-I à une seule échelle
  • Cet article établit pour la première fois le lien entre l'équilibre E-I et l'attention auditive et la reconnaissance vocale
  • Fournit des stratégies de régulation quantitatives et des plages de paramètres

Conclusions et discussion

Conclusions principales

  1. Les oscillations gamma sont un marqueur neuronal de l'attention: L'amplitude des oscillations gamma code directement le niveau d'attention
  2. Le bruit affecte l'attention via la voie EPSC: Le bruit affaiblit principalement l'attention en réduisant le courant synaptique excitateur
  3. L'équilibre E-I peut réguler l'état d'attention: L'amélioration de l'équilibre excitateur-inhibiteur peut améliorer la perception vocale en environnement bruyant
  4. Existence d'un mécanisme de transition d'état contrôlable: Réalisation d'une transition d'état de perception réversible par ajustement des paramètres

Limitations

  1. Simplification du modèle: Le système cochlée-thalamus utilise un modèle simplifié de traitement du signal
  2. Paramètres fixes: Certains paramètres physiologiques sont basés sur des valeurs littéraires, avec possibilité de variations individuelles
  3. Portée de vérification: Principalement pour les tons purs et la parole simple, vérification limitée en environnement vocal complexe
  4. Traduction clinique: Nécessite une vérification supplémentaire pour passer du modèle computationnel au traitement réel

Directions futures

  1. Intégration multimodale: Intégration des informations de traitement d'autres canaux sensoriels comme la vision
  2. Modélisation personnalisée: Optimisation des paramètres tenant compte des différences individuelles
  3. Applications cliniques: Développement de schémas thérapeutiques basés sur la régulation de l'équilibre E-I
  4. Neuromodulation: Vérification expérimentale combinée avec des techniques comme l'optogénétique

Évaluation approfondie

Points forts

  1. Innovation théorique:
    • Première proposition du mécanisme de codage vocal par les pics des oscillations gamma
    • Établissement d'une relation quantitative entre l'équilibre E-I et l'attention auditive
    • Fourniture d'un modèle de dynamique neuronale interprétable
  2. Complétude méthodologique:
    • Intégration de la voie auditive complète de la cochlée au cortex
    • Combinaison de la modélisation computationnelle et de la vérification par données expérimentales
    • Utilisation de multiples méthodes d'analyse (analyse de bifurcation, analyse temps-fréquence, etc.)
  3. Valeur pratique:
    • Fourniture de stratégies thérapeutiques potentielles pour les troubles de l'attention auditive
    • Inspiration biologique pour la reconnaissance vocale en intelligence artificielle
    • Établissement d'un cadre d'ajustement des paramètres opérationnel

Insuffisances

  1. Complexité du modèle:
    • Contient un grand nombre de paramètres, complexité d'ajustement élevée
    • Certains détails biologiques peuvent être trop simplifiés
    • Coût computationnel relativement élevé
  2. Limitations de vérification:
    • Taille d'échantillon relativement petite pour les données de vérification EEG (13 sujets)
    • Manque de vérification en environnement vocal plus complexe
    • L'efficacité clinique nécessite une vérification supplémentaire
  3. Problèmes d'universalité:
    • Principalement ciblé sur les populations ayant une audition normale
    • Applicabilité du modèle en état pathologique inconnue
    • L'applicabilité transculturelle et multilingue nécessite une vérification

Impact

  1. Contribution académique:
    • Fourniture d'un nouveau cadre de modélisation pour le domaine de la neuroscience computationnelle
    • Avancement de la compréhension des mécanismes de l'attention auditive
    • Établissement d'un pont entre théorie et expérience
  2. Perspectives d'application:
    • Optimisation d'algorithmes pour les appareils auditifs et implants cochléaires
    • Amélioration de la capacité de résistance au bruit des systèmes de reconnaissance vocale
    • Nouvelles méthodes de traitement pour les troubles du déficit de l'attention
  3. Reproductibilité:
    • Fourniture d'un modèle mathématique détaillé et de paramètres
    • Utilisation d'ensembles de données EEG publics pour la vérification
    • Description des méthodes relativement complète

Scénarios d'application

  1. Recherche fondamentale: Recherche en neuroscience auditive, neuroscience cognitive
  2. Applications cliniques: Diagnostic et traitement des troubles de l'attention auditive, perte auditive
  3. Applications d'ingénierie: Systèmes de reconnaissance vocale intelligents, optimisation d'algorithmes de dispositifs auditifs
  4. Applications éducatives: Cas d'enseignement en ingénierie neuronale et neuroscience computationnelle

Références

Cet article cite 65 références pertinentes, incluant principalement:

Références théoriques fondamentales:

  • Wang, X. J., & Buzsáki, G. (1996). Gamma oscillation by synaptic inhibition in a hippocampal interneuronal network model
  • Jensen, O., Kaiser, J., & Lachaux, J. P. (2007). Human gamma-frequency oscillations associated with attention and memory

Données de vérification:

  • Delorme, A. (2022). EEG data from an auditory oddball task. OpenNeuro

Références méthodologiques:

  • Economo, M. N., & White, J. A. (2012). Membrane properties and the balance between excitation and inhibition control gamma-frequency oscillations

Cet article apporte des contributions importantes dans les domaines de la neuroscience computationnelle et du traitement auditif, fournissant non seulement un nouveau cadre théorique, mais ouvrant également de nouvelles directions pour les applications cliniques. Sa approche de modélisation intégrative et sa vérification systématique jettent une base solide pour les recherches ultérieures dans ce domaine.