2025-11-24T16:10:25.080119

Using Information Geometry to Characterize Higher-Order Interactions in EEG

Albers, Marriott, Tatsuno
In neuroscience, methods from information geometry (IG) have been successfully applied in the modelling of binary vectors from spike train data, using the orthogonal decomposition of the Kullback-Leibler divergence and mutual information to isolate different orders of interaction between neurons. While spike train data is well-approximated with a binary model, here we apply these IG methods to data from electroencephalography (EEG), a continuous signal requiring appropriate discretization strategies. We developed and compared three different binarization methods and used them to identify third-order interactions in an experiment involving imagined motor movements. The statistical significance of these interactions was assessed using phase-randomized surrogate data that eliminated higher-order dependencies while preserving the spectral characteristics of the original signals. We validated our approach by implementing known second- and third-order dependencies in a forward model and quantified information attenuation at different steps of the analysis. This revealed that the greatest loss in information occurred when going from the idealized binary case to enforcing these dependencies using oscillatory signals. When applied to the real EEG dataset, our analysis detected statistically significant third-order interactions during the task condition despite the relatively sparse data (45 trials per condition). This work demonstrates that IG methods can successfully extract genuine higher-order dependencies from continuous neural recordings when paired with appropriate binarization schemes.
academic

Using Information Geometry to Characterize Higher-Order Interactions in EEG

基本信息

  • 论文ID: 2510.14188
  • 标题: Using Information Geometry to Characterize Higher-Order Interactions in EEG
  • 作者: Eric Albers, Paul Marriott, Masami Tatsuno
  • 分类: q-bio.NC (Neurons and Cognition), q-bio.QM (Quantitative Methods)
  • 发表时间: 2025年10月16日 (arXiv预印本)
  • 论文链接: https://arxiv.org/abs/2510.14188

摘要

本研究将信息几何(Information Geometry, IG)方法从传统的二进制脊波序列数据扩展到连续的脑电图(EEG)信号分析。通过Kullback-Leibler散度和互信息的正交分解来识别神经元间不同阶次的相互作用。研究开发了三种二值化方法用于识别运动想象实验中的三阶相互作用,并使用相位随机化替代数据评估统计显著性。通过前向模型验证方法的有效性,量化了分析各步骤的信息衰减。结果表明,尽管数据相对稀疏(每条件45个试验),该方法仍能在任务条件下检测到统计显著的三阶相互作用。

研究背景与动机

问题定义

传统神经科学研究主要关注脑区间的成对关系(二阶相互作用),但大脑作为复杂系统可能存在超越成对关系的高阶相互作用。现有的功能连接网络基于成对相关性构建,可能无法完全捕捉大脑信息处理的复杂性。

重要性

  1. 理论意义: 理解大脑是否需要三阶或更高阶的相互作用来完成认知功能
  2. 方法学意义: 扩展信息几何方法从离散的脊波数据到连续的EEG信号
  3. 应用价值: 为脑机接口和神经疾病诊断提供新的分析工具

现有方法局限性

  1. 信息几何方法: 主要应用于二进制脊波数据,对连续信号缺乏有效的离散化策略
  2. 传统EEG分析: 主要基于成对相关性,忽略了高阶依赖关系
  3. 统计推断: 在稀疏数据条件下,标准渐近工具(如χ²分布)可能不适用

研究动机

将成功应用于脊波分析的信息几何方法扩展到EEG数据,开发适当的二值化策略来捕捉连续神经记录中的真实高阶依赖关系。

核心贡献

  1. 方法学创新: 开发了三种二值化方法(Sign、Diff、Power)将连续EEG信号转换为适合信息几何分析的二进制表示
  2. 验证框架: 建立了基于相位随机化替代数据的统计显著性检验方法
  3. 前向建模: 实现了已知二阶和三阶依赖关系的前向模型,量化了分析过程中的信息衰减
  4. 实证发现: 在运动想象EEG数据中检测到统计显著的三阶相互作用
  5. 理论洞察: 揭示了从理想化二进制情况到振荡信号实施依赖关系时发生最大信息损失

方法详解

任务定义

输入: 多通道EEG连续信号 输出: 通道三元组间的一阶、二阶、三阶互信息分量 约束: 处理稀疏数据(45个试验/条件)和连续信号的离散化挑战

信息几何理论基础

对于三个二进制变量X₁, X₂, X₃,联合概率分布可表示为8个概率的向量:

p = (p₀₀₀, p₀₀₁, p₀₁₀, p₀₁₁, p₁₀₀, p₁₀₁, p₁₁₀, p₁₁₁)

期望参数η坐标系统:

  • η₁, η₂, η₃: 边际激活率
  • η₁₂, η₁₃, η₂₃: 成对激活率
  • η₁₂₃: 三元激活率

自然参数θ坐标系统通过对数比值定义,如:

θ₁₂₃ = log(p₀₀₁p₀₁₀p₁₀₀p₁₁₁)/(p₁₁₀p₁₀₁p₀₁₁p₀₀₀)

KL散度的正交分解

使用混合坐标系统,KL散度可正交分解为:

D[p : q] = D[p : p̄] + D[p̄ : p̃] + D[p̃ : q]

其中:

  • Dp : p̄: 三元相互作用信息
  • Dp̄ : p̃: 成对相互作用信息
  • Dp̃ : q: 激活率调制信息

二值化方法

1. Sign方法

binary_signal = 1 if EEG_signal > 0 else 0

捕捉粗糙的相位信息,忽略幅度。

2. Diff方法

diff_signal = diff(EEG_signal)
binary_signal = 1 if diff_signal > 0 else 0

捕捉相位转换模式。

3. Power方法

power = EEG_signal²
envelope = moving_average(power, 30_samples)
z_scores = (envelope - mean) / std
binary_signal = 1 if z_scores > 1 else 0

捕捉高幅度时期,与相位无关。

统计显著性检验

使用测试统计量:

λ = 2N·D[p : p̄] ~ χ²(1)

由于数据稀疏,χ²近似不佳,采用基于IAAFT(迭代幅度调整傅里叶变换)替代数据的非参数检验。

实验设置

数据集

OpenNeuro运动想象数据集 (Triana-Guzman et al., 2022):

  • 参与者: 32名健康受试者(16名女性)
  • 电极: 17个电极,按国际10-20系统放置
  • 采样率: 250 Hz
  • 试验设计:
    • 6个区块(3个坐姿,3个站姿)
    • 每区块30个试验(15个运动想象,15个空闲状态)
    • 总计每条件45个试验

试验结构:

  1. 注视(4秒): 注视屏幕十字
  2. 观察(3秒): 显示即将执行的任务
  3. 想象(4秒): 执行心理任务(运动想象或空闲状态)
  4. 休息(4秒): 自由活动

数据预处理

  1. 滤波: 0.5 Hz高通滤波,58-62 Hz陷波滤波
  2. 伪影去除: 使用ASR(伪影子空间重构)方法
  3. 频段滤波: 分为Delta(0.5-4Hz)、Theta(4-8Hz)、Alpha(8-12Hz)、Beta(12-30Hz)、Gamma(30-60Hz)
  4. 时期提取: 从想象任务开始前7秒到开始后4秒的11秒时期

评价指标

  • 一阶互信息(I₁): 激活率调制信息
  • 二阶互信息(I₂): 成对相互作用信息
  • 三阶互信息(I₃): 三元相互作用信息
  • 统计显著性: p < 0.01 (基于IAAFT替代数据)

对比方法

  1. 白噪声替代数据: 纯随机结构的影响
  2. IAAFT替代数据: 保持功率谱和幅度分布,随机化相位
  3. 不同二值化方法: Sign vs Diff vs Power方法对比

实验结果

主要结果

替代数据验证

  1. IAAFT数据产生比白噪声更高的信息值,这是预期的,因为IAAFT保持了试验阶段间的功率谱差异
  2. Power方法在所有频段中显示I₁ > I₂ > I₃的递减趋势
  3. Sign和Diff方法显示I₂偏向,在高频段尤其明显,限制了其捕捉三阶相互作用的能力

运动想象数据结果

  1. χ²近似失效: 由于数据稀疏(45个试验),标准渐近分布不适用
  2. 显著三阶相互作用: 在观察和想象阶段检测到统计显著的I₃
  3. 假阳性控制: 注视阶段的显著三元组约为1%,验证了零假设的适当性
  4. 时间动态: 不同频段和三元组的三阶信息时间动态不同

前向模型验证结果

信息衰减量化

  1. 最大信息损失: 从理想化二进制信号到振荡信号时发生(约50%的I₃损失)
  2. 体积传导影响较小: 从源信号到头皮电极的信息损失相对较小
  3. 噪声敏感性: 在中等SNR以下,I₂和I₃都大幅下降

依赖关系实现

成功在振荡源信号中实现了已知的二阶和三阶依赖关系:

  • 二阶情况: 目标信号相关,与控制信号状态无关
  • 三阶情况: 当控制信号为高(1)时目标信号相关,为低(0)时反相关

频段特异性发现

  • Delta和Theta: Sign和Diff方法的I₂偏向较不明显
  • Alpha及更高频段: Sign和Diff方法显著偏向I₂,限制I₃检测
  • 所有频段: Power方法保持I₁ > I₂ > I₃的合理层次结构

相关工作

信息几何在神经科学中的应用

  • Amari & Nagaoka (2000): 信息几何的基础理论
  • Nakahara & Amari (2002): 神经脊波的信息几何测量
  • Tatsuno et al. (2009): 连接强度和外部输入的鲁棒估计

EEG分析方法

  • 传统方法: 主要基于功率谱分析和成对相关性
  • 功能连接: Friston (1995)定义的基于统计依赖性的区域关系
  • 网络分析: Bullmore & Sporns (2009)的复杂脑网络分析

高阶相互作用研究

  • Battiston et al. (2020, 2021): 超越成对相互作用的网络结构和动力学
  • 本文贡献: 首次将信息几何方法系统应用于EEG数据的高阶相互作用分析

结论与讨论

主要结论

  1. 方法可行性: 信息几何方法可成功扩展到连续EEG信号分析
  2. 二值化策略重要性: Power方法最适合检测高阶相互作用
  3. 真实高阶相互作用: 在运动想象任务中检测到统计显著的三阶相互作用
  4. 信息损失机制: 主要信息损失发生在二进制到振荡信号的转换过程中

局限性

  1. 计算复杂度: 17个通道已接近可行性极限,高密度阵列(128-256通道)可能计算困难
  2. 时间分辨率: 1秒非重叠窗口提供的时间动态较粗糙
  3. 频段内分析: 仅考虑同频段内的相互作用,未涉及跨频段分析
  4. 二值化限制: 可能错过更复杂的非线性相互作用模式

未来方向

  1. 混合二值化: 结合不同二值化方法检测相位-幅度耦合等现象
  2. 自适应窗口: 使用频率自适应的重叠窗口提高时间分辨率
  3. 跨频段分析: 扩展到不同频段间的高阶相互作用
  4. 更高阶相互作用: 探索四阶及以上的相互作用模式

深度评价

优点

  1. 方法学创新: 成功将信息几何方法从离散扩展到连续信号领域
  2. 严格验证: 通过前向模型和替代数据提供了完整的验证框架
  3. 实用价值: 为EEG数据的高阶相互作用分析提供了可操作的工具
  4. 理论贡献: 量化了分析过程中各步骤的信息损失

不足

  1. 样本量限制: 45个试验相对较少,可能影响统计功效
  2. 二值化简化: 将复杂的连续信号简化为二进制可能丢失重要信息
  3. 计算可扩展性: 对于高密度EEG阵列的计算挑战未充分解决
  4. 生物学解释: 对检测到的三阶相互作用的神经生物学意义讨论不足

影响力

  1. 方法学影响: 为神经信号的高阶分析提供了新的数学工具
  2. 应用前景: 可应用于脑机接口、神经疾病诊断等领域
  3. 理论价值: 推进了对大脑复杂网络组织的理解
  4. 可复现性: 提供了开源代码和公开数据集,支持结果复现

适用场景

  1. 基础神经科学研究: 探索大脑网络的高阶组织原理
  2. 临床应用: 神经疾病的高阶连接模式分析
  3. 脑机接口: 提取更丰富的神经信号特征用于控制
  4. 认知神经科学: 研究认知任务中的复杂神经相互作用

参考文献

本文引用了28篇重要参考文献,主要包括:

  1. 信息几何基础: Amari & Nagaoka (2000), Amari (2001)
  2. 神经科学应用: Nakahara & Amari (2002), Tatsuno et al. (2009)
  3. EEG方法学: Delorme & Makeig (2004), Oostenveld et al. (2011)
  4. 高阶网络: Battiston et al. (2020, 2021)
  5. 数据来源: Triana-Guzman et al. (2022)

总评: 这是一篇高质量的方法学论文,成功地将信息几何理论扩展到EEG信号分析领域。虽然在计算可扩展性和生物学解释方面存在一些局限,但其严格的验证框架和创新的二值化策略为神经信号的高阶相互作用分析提供了重要的理论和实践贡献。