This study introduces a novel auditory neuronal network model that integrates speech signal input, cochlear processing, and a cortical excitatory-inhibitory (E-I) balanced network. Our findings reveal that increasing noise intensity attenuates the auditory steady-state responses in gamma oscillations, a mechanism validated by public EEG data. Moreover, enhancing the brain's E-I balance significantly improves auditory attention during speech recognition. This work not only elucidates the neural basis of selective attention in noisy environments but also offers a promising therapeutic strategy for auditory attention disorders, marking a significant advancement in the field of computational neuroscience and auditory processing.
Auditory steady-state response and gamma oscillations in an excitatory-inhibitory balanced neuronal network 论文ID : 2504.04329标题 : Auditory steady-state response and gamma oscillations in an excitatory-inhibitory balanced neuronal network作者 : Duoyu Feng, Jiajia Li分类 : q-bio.NC (Quantitative Biology - Neurons and Cognition)机构 : 西安建筑科技大学信息与控制工程学院、中部战区总医院神经外科论文链接 : https://arxiv.org/abs/2504.04329 本研究提出了一个新颖的听觉神经网络模型,整合了语音信号输入、耳蜗处理和皮层兴奋-抑制(E-I)平衡网络。研究发现,噪声强度的增加会减弱伽马振荡中的听觉稳态反应,这一机制通过公开EEG数据得到验证。此外,增强大脑的E-I平衡显著改善了语音识别过程中的听觉注意力。该工作不仅阐明了嘈杂环境中选择性注意的神经基础,还为听觉注意障碍提供了有前景的治疗策略。
本研究旨在解决经典的"鸡尾酒会问题"(cocktail party problem)——即人脑如何在嘈杂环境中有效感知目标语音信号。具体要解决的问题包括:
大脑皮层如何在环境噪声中感知语音信息 伽马振荡与听觉注意力构建的关系 兴奋-抑制平衡对注意力调节的机制 理论意义 : 深入理解人脑语音识别机制对计算神经科学具有重要价值应用价值 : 为人机交互(HCI)中的语音识别系统优化提供理论基础临床意义 : 为听觉注意障碍、听力损失等疾病提供潜在治疗策略现有研究多采用"黑盒"模型,缺乏模型可解释性 缺乏对神经振荡动力学机制的深入分析 对兴奋-抑制平衡调节注意力的机制理解不足 构建了完整的听觉处理模型 :整合了语音输入-耳蜗-丘脑-皮层的完整听觉通路模型揭示了伽马振荡编码机制 :发现伽马振荡峰值模式可以编码语音信号特征验证了噪声掩蔽效应 :通过计算模型和EEG数据验证了噪声对伽马振荡的抑制作用提出了注意力调节策略 :发现增强E-I平衡可以改善听觉注意力,为临床治疗提供新思路建立了状态转换图谱 :构建了噪声强度和E-I平衡参数下的皮层感知状态转换图研究听觉皮层神经网络在不同噪声条件下对语音信号的响应特性,特别关注:
输入 :连续语音信号、纯音信号、不同强度的噪声输出 :局部场电位(LFP)、神经元放电模式、伽马带振荡(GBO)目标 :理解噪声掩蔽机制和E-I平衡对注意力的调节作用X = FFT_transform(Voice_Signal) (1)
x = envelope(X) (2)
x' = (x - x_min)/(x_max - x_min) (3)
I_thalamus,i^E = A_i^E · x' (4)
I_thalamus,j^I = A_j^I · x' (5)
其中,A_i^E : A_j^I = 5:2,模拟皮层网络的生理参数比例。
构建包含200个兴奋性锥体神经元和50个抑制性中间神经元的E-I平衡网络:
兴奋性神经元(双室模型) :
C_m,E dV_E,i/dt = f_E(V_E,i, m_i, n_i, h_i) + g_c/p(V_Ed,i - V_E,i) (6)
C_m,E dV_Ed,i/dt = f_Ed(V_Ed,i, Ca^2+, s_n) + g_c/(1-p)(V_E,i - V_Ed,i) + I_syn,i^Ed + I_thalamus,i^Ed (7)
抑制性神经元(快放电中间神经元模型) :
C_m,I dV_I,j/dt = f_I(V_I,j, m_j, n_j, h_j) + I_syn,j^I + I_thalamus,j^I (8)
兴奋性神经元接收的突触电流 :
I_syn,i^Ed = Σ[g_I w_k^I→E y_GABA,k(V_Ed,i - V_GABA)] + Σ[g_E y_AMPA,k(V_Ed,i - V_AMPA)/N_E] (9)
抑制性神经元接收的突触电流 :
I_syn,j^I = Σ[g_E w_k^E→I y_AMPA,k(V_I,j - V_AMPA)] + g_GABA,j^autapse y_GABA(V_I,j - V_GABA) + Σ[g_I y_GABA,k(V_I,j - V_GABA)/N_I] (13)
多尺度整合模型 :首次将耳蜗频率分离、丘脑特征分析和皮层E-I网络整合在统一框架中动力学分析方法 :采用分岔分析揭示噪声对神经元放电模式的影响机制伽马振荡编码理论 :提出伽马振荡峰值模式编码语音特征的新机制状态转换调控 :发现通过调节E-I平衡实现感知状态可控转换的方法仿真数据 :连续语音信号(有/无噪声条件) 200-1000Hz纯音信号 20-80dB白噪声 验证数据 :公开EEG数据集41 :13名受试者 刺激:1000Hz和500Hz纯音、76dB白噪声 每次刺激持续60ms,实验时长13分钟 伽马带振荡(GBO) :30-100Hz频段功率峰值幅度 :GBO曲线的最大值峰值熵 :基于Shannon熵的GBO峰值编码信息量E-I比值 :兴奋性与抑制性突触后电流的比值IIR数字滤波器 :提取30-100Hz伽马频段功率谱分析 :计算滤波信号的平方功率分岔分析 :研究系统稳定性和放电模式转换时频变换 :分析语音信号的频域特征无噪声条件 :GBO峰值幅度在40-60范围,放电频率>50Hz噪声条件 :GBO峰值幅度降至0-20范围,放电频率<35Hz关键阈值 :40dB为噪声显著影响的临界点,与Hahad等人45 的实验结果一致纯音频率从200Hz增加到1000Hz时,GBO峰值呈递增趋势 白噪声刺激下的GBO峰值始终低于20,显著低于纯音刺激 EEG验证数据显示相似的频率依赖模式 兴奋性突触电导g_E从0.1增加到0.6时:
E-I比值显著增加 GBO最大幅度从约20提升至60 峰值编码熵显著改善 兴奋性神经元 :在Hopf分岔点HBPE,L和HBPE,R之间进入放电状态抑制性神经元 :类似的分岔特性,但IPSC变化较小关键发现 :噪声主要通过影响EPSC动态来调节神经元放电模式构建了噪声强度(20-80dB)和g_E(0.1-1.0)的二维参数空间:
状态①感知 :低噪声,良好的语音编码能力状态②掩蔽 :高噪声,语音感知能力丧失状态③恢复 :通过增强g_E恢复感知能力状态④锐波涟漪 :过度兴奋状态(100-200Hz)编码机制 :伽马振荡峰值的时空模式可以编码语音信号特征掩蔽机制 :噪声主要通过减少EPSC来降低神经元兴奋性恢复策略 :增强E-I平衡可以在噪声环境中恢复注意力临界现象 :存在明确的噪声强度阈值(~40dB)和调节参数范围Kerlin等4 :鸡尾酒会环境中的注意增益控制 Petkov等20 :人类听觉皮层的注意调节 Jensen等47 :伽马振荡与注意记忆的关系 Wang & Buzsáki33 :海马中间神经元网络的伽马振荡 Economo & White48 :兴奋抑制平衡对伽马振荡的控制 本文相比现有工作的优势:整合了完整听觉通路,提供了可解释的动力学机制 现有研究多关注单一尺度的E-I平衡 本文首次将E-I平衡与听觉注意力和语音识别联系起来 提供了定量的调节策略和参数范围 伽马振荡是注意力的神经标记 :伽马振荡幅度编码直接反映注意力水平噪声通过EPSC途径影响注意力 :噪声主要通过降低兴奋性突触电流来减弱注意力E-I平衡可调节注意力状态 :增强兴奋抑制平衡能够改善噪声环境下的语音感知存在可控的状态转换机制 :通过参数调节实现感知状态的可逆转换模型简化 :耳蜗-丘脑系统采用了简化的信号处理模型参数固定 :某些生理参数基于文献值,可能存在个体差异验证范围 :主要针对纯音和简单语音,复杂语音环境验证有限临床转化 :从计算模型到实际治疗应用还需要更多验证多模态整合 :结合视觉等其他感觉通道的信息处理个体化建模 :考虑个体差异的参数优化临床应用 :开发基于E-I平衡调节的治疗方案神经调控 :结合光遗传学等技术的实验验证理论创新性 :首次提出伽马振荡峰值编码语音的机制 建立了E-I平衡与听觉注意力的定量关系 提供了可解释的神经动力学模型 方法完整性 :整合了从耳蜗到皮层的完整听觉通路 结合了计算建模和实验数据验证 采用了多种分析方法(分岔分析、时频分析等) 实用价值 :为听觉注意障碍提供了潜在治疗策略 为人工智能语音识别提供了生物启发 建立了可操作的参数调节框架 模型复杂度 :包含大量参数,调参复杂度较高 某些生物学细节可能过于简化 计算成本较高 验证局限性 :EEG验证数据样本量相对较小(13人) 缺乏更复杂语音环境的验证 临床有效性需要进一步验证 普适性问题 :主要针对正常听力人群 病理状态下的模型适用性未知 跨文化、跨语言的适用性需要验证 学术贡献 :为计算神经科学领域提供了新的建模框架 推进了对听觉注意机制的理解 建立了理论与实验的桥梁 应用前景 :助听器和人工耳蜗的算法优化 语音识别系统的抗噪声能力提升 注意力缺陷等疾病的新治疗方法 可复现性 :提供了详细的数学模型和参数 使用了公开的EEG数据集验证 方法描述相对完整 基础研究 :听觉神经科学、认知神经科学研究临床应用 :听觉注意障碍、听力损失的诊断和治疗工程应用 :智能语音系统、助听设备的算法优化教育应用 :神经工程和计算神经科学的教学案例本文引用了65篇相关文献,主要包括:
核心理论文献 :
Wang, X. J., & Buzsáki, G. (1996). Gamma oscillation by synaptic inhibition in a hippocampal interneuronal network model Jensen, O., Kaiser, J., & Lachaux, J. P. (2007). Human gamma-frequency oscillations associated with attention and memory 验证数据 :
Delorme, A. (2022). EEG data from an auditory oddball task. OpenNeuro 方法学参考 :
Economo, M. N., & White, J. A. (2012). Membrane properties and the balance between excitation and inhibition control gamma-frequency oscillations 该论文在计算神经科学和听觉处理领域做出了重要贡献,不仅提供了新的理论框架,还为临床应用开辟了新的方向。其整合性的建模方法和系统性的验证为该领域的后续研究奠定了坚实基础。