2025-11-11T16:04:09.679573

A Mixed Model Approach for Estimating Regional Functional Connectivity from Voxel-level BOLD Signals

Liu, Zhang, Tran et al.
Resting-state brain functional connectivity quantifies the synchrony between activity patterns of different brain regions. In functional magnetic resonance imaging (fMRI), each region comprises a set of spatially contiguous voxels at which blood-oxygen-level-dependent signals are acquired. The ubiquitous Correlation of Averages (CA) estimator, and other similar metrics, are computed from spatially aggregated signals within each region, and remain the quantifications of inter-regional connectivity most used by neuroscientists despite their bias that stems from intra-regional correlation and measurement error. We leverage the framework of linear mixed-effects models to isolate different sources of variability in the voxel-level signals, including both inter-regional and intra-regional correlation and measurement error. A novel computational pipeline, focused on subject-level inter-regional correlation parameters of interest, is developed to address the challenges of applying maximum (or restricted maximum) likelihood estimation to such structured, high-dimensional spatiotemporal data. Simulation results demonstrate the reliability of correlation estimates and their large sample standard error approximations, and their superiority relative to CA. The proposed method is applied to two public fMRI data sets. First, we analyze scans of a dead rat to assess false positive performance when connectivity is absent. Second, individual human brain networks are constructed for subjects from a Human Connectome Project test-retest database. Concordance between inter-regional correlation estimates for test-retest scans of the same subject are shown to be higher for the proposed method relative to CA.
academic

A Mixed Model Approach for Estimating Regional Functional Connectivity from Voxel-level BOLD Signals

基本信息

  • 论文ID: 2211.02192
  • 标题: A Mixed Model Approach for Estimating Regional Functional Connectivity from Voxel-level BOLD Signals
  • 作者: Ruobin Liu, Chao Zhang, Chau Tran, Sophie Achard, Wendy Meiring, Alexander Petersen
  • 分类: stat.ME (Statistics - Methodology), stat.AP (Statistics - Applications)
  • 发表时间: 2022年11月(arXiv预印本,2025年11月更新)
  • 论文链接: https://arxiv.org/abs/2211.02192

摘要

本文针对功能磁共振成像(fMRI)中静息态脑功能连接估计问题,提出了一种基于线性混合效应模型的新方法。传统的"平均相关性"(Correlation of Averages, CA)估计器虽然被广泛使用,但由于区域内相关性和测量误差导致的偏差问题一直存在。本文通过线性混合效应模型框架,分离体素级信号中的不同变异性来源,包括区域间和区域内相关性以及测量误差。研究开发了一个新颖的计算管道,专注于个体水平的区域间相关参数估计,并采用最大似然估计方法处理高维时空数据的挑战。仿真结果证明了相关性估计的可靠性及其相对于CA的优越性。

研究背景与动机

问题定义

  1. 核心问题: 如何从体素级BOLD信号准确估计脑区间功能连接性,避免传统方法的偏差问题
  2. 技术挑战:
    • fMRI数据具有复杂的时空依赖性
    • 体素数量远大于时间维度,导致计算挑战
    • 区域内空间相关性和测量误差影响连接性估计的准确性

研究重要性

  • 功能连接性是研究神经退行性疾病和意识障碍等病理学的基础
  • 准确的连接性估计对个体和群体水平的神经科学研究至关重要
  • 现有方法的偏差可能影响疾病诊断和个体特征化研究

现有方法局限性

传统CA估计器存在的问题:

  1. 偏差问题: 由区域内相关性αⱼ和噪声信号比βⱼ约束,导致估计值偏向0
  2. 依赖性忽略: 未考虑体素级信号的时空依赖性
  3. 参数约束: 连接性参数受采样方案和机器噪声影响,缺乏内在性

核心贡献

  1. 提出新的统计模型: 基于线性混合效应模型的体素级BOLD信号建模框架,明确区分区域间和区域内变异性
  2. 开发高效估计方法:
    • 两阶段估计策略,结合限制最大似然估计(ReML)
    • 首次在功能连接建模中应用Vecchia似然近似方法
  3. 理论保证: 提供估计器的大样本性质和渐近推断理论
  4. 实证验证: 在仿真和真实数据(死鼠扫描、HCP测试-重测数据)上验证方法的优越性

方法详解

任务定义

输入: 体素级BOLD信号的小波系数 Xⱼₗₘ,其中j=1,...,J为脑区,l=1,...,Lⱼ为体素,m=1,...,M为小波系数 输出: 区域间相关性参数 ρⱼⱼ',用于构建功能连接网络 约束: 处理高维时空数据的计算可行性

模型架构

BOLD混合效应模型

核心模型为:

X = Zμ + Uη + γ + ε

其中:

  • μⱼ: 区域固定效应(区域均值)
  • ηⱼₘ: 区域随机效应(诱导区域间依赖性)
  • γⱼₗₘ: 体素级随机效应(诱导区域内依赖性)
  • εⱼₗₘ: 测量误差

协方差结构参数化

  1. 区域间相关性: Var(η) = (SRS) ⊗ A,其中R = {ρⱼⱼ'}为目标相关矩阵
  2. 区域内结构: Λⱼ = Cⱼ ⊗ Bⱼ (可分离的空间-时间协方差)
  3. 核函数定义:
    • 空间核: Matérn核 K(d; ν, φ)
    • 时间核: 高斯核 H(|m-m'|; τ)

技术创新点

两阶段估计策略

阶段1: 区域特异性参数估计

  • 使用ReML估计每个区域的参数 θⱼ = kᵧⱼ, σ²ᵧⱼ, φᵧⱼ, τᵧⱼ
  • 通过限制似然消除区域效应的影响

阶段2: 全局和区域间参数估计

  • 估计区域间相关性参数 θ = τη, kη, ρ₁₂, σ²η
  • 固定阶段1的估计值,专注于连接性参数

Vecchia近似

为解决计算复杂度问题(O(N³)时间,O(N²)内存),采用Vecchia似然近似:

p(X) ≈ p(X_π(1)) ∏ᵢ₌₂ᴺ p(X_π(i) | X_π(j), j ∈ Jᵢ)

通过小的条件集|Jᵢ|=100实现计算效率提升

实验设置

数据集

  1. 仿真数据:
    • J=3个脑区,M=60个小波系数
    • 使用活鼠实验的空间坐标(L₁=41, L₂=25, L₃=77个体素)
    • 变化信号强度δⱼ ∈ {0.1, 0.5, 0.7}和空间协方差ψⱼ ∈ {0.2, 0.5, 0.8}
  2. 真实数据:
    • 死鼠扫描数据(验证假阳性率)
    • HCP测试-重测数据库(42个被试,J=92个默认模式网络区域)

评价指标

  1. 仿真: 均方误差(MSE)、平均绝对偏差(MAD)
  2. HCP数据: 一致性相关系数(CCC)评估测试-重测可靠性
  3. 死鼠数据: 假阳性率分析

对比方法

  1. ρ̂CA: 传统平均相关性估计器
  2. ρ̂EBLUE: 基于经验最佳线性无偏估计器的相关性
  3. ρ̂ReML: 完整ReML估计器
  4. ρ̂Vecchia: Vecchia近似估计器

实现细节

  • 核函数: 高斯核H(u;τ) = exp(-τ²u²/2),Matérn-5/2核
  • 优化: L-BFGS准牛顿方法
  • Vecchia条件集大小: |Jᵢ| = 100
  • 显著性检验: Benjamini-Yekutieli程序,FDR < 0.2

实验结果

主要结果

仿真实验表现

  1. 准确性: ρ̂ReML在所有设置下标准差最小,中位数最接近真实值
  2. 偏差分析:
    • 当ρ=0.6时,CA和EBLUE显著偏向0
    • 高空间协方差(ψ=0.8)时,CA和EBLUE偏差加剧
    • ρ̂ReML在各种设置下保持稳健性

数值结果示例

在中等信号强度(δ=0.5)下:

  • 低空间协方差(ψ=0.2): ρ̂ReML的MSE为0.008-0.025,显著低于CA的0.016-0.033
  • 高空间协方差(ψ=0.8): 差距更加明显,ρ̂ReML的MSE为0.012-0.028,CA为0.056-0.194

消融实验

  1. Vecchia近似验证: ρ̂Vecchia与ρ̂ReML性能几乎相同,证明近似方法的有效性
  2. 模型误设定鲁棒性: 在替代协方差结构下,ρ̂ReML仍优于传统方法
  3. Oracle估计器对比: 两阶段程序的性能损失最小

真实数据结果

死鼠扫描分析

  • 假阳性控制: ρ̂Vecchia在5%显著性水平下无显著边,CA方法仍有显著边
  • FDR控制: 两种方法在BY调整(q<0.2)后均无显著边,符合预期

HCP测试-重测分析

  • 一致性提升: 在所有图构建策略下,大多数被试的混合模型方法CCC更高
  • 边缘比例: 从1%-20%的边缘选择中,混合模型方法持续优于CA
  • 统计显著性: 在10%顶部边缘中,约60-80%的被试表现出更高的测试-重测一致性

相关工作

主要研究方向

  1. 体素级建模: Woolrich et al.(2004)的任务相关激活混合模型
  2. 群体水平连接性: Bowman et al.(2008)的贝叶斯层次模型
  3. 频域方法: Kang et al.(2012)的频域混合效应模型
  4. 时空建模: Castruccio et al.(2018)的VAR过程方法

本文优势

  1. 静息态专用: 针对静息态数据设计,区别于任务态研究
  2. 个体水平: 关注个体脑网络构建,而非群体推断
  3. 连接性优先: 以区域间相关性为主要参数,而非任务效应
  4. 计算创新: 首次在功能连接中应用Vecchia近似

结论与讨论

主要结论

  1. 方法有效性: 混合效应模型显著改善了功能连接估计的准确性和可靠性
  2. 偏差纠正: 成功解决了CA估计器的系统性偏差问题
  3. 计算可行性: Vecchia近似使方法适用于大规模数据
  4. 实用价值: 在真实数据中表现出更好的测试-重测一致性

局限性

  1. 计算复杂度: 尽管有近似方法,仍比CA计算量大
  2. 模型假设: 依赖高斯假设和可分离协方差结构
  3. 参数估计: 某些平滑参数需要预设而非估计
  4. 区域预定义: 依赖预定义的脑区划分,而非数据驱动

未来方向

  1. 主体特异性区域: 结合数据驱动的区域发现方法
  2. 多尺度建模: 扩展到多个小波尺度的联合分析
  3. 非高斯扩展: 考虑非高斯分布的鲁棒性
  4. 实时应用: 开发更高效的在线估计算法

深度评价

优点

  1. 理论严谨: 提供完整的统计理论框架和渐近性质
  2. 方法创新: 巧妙结合混合效应模型和计算近似技术
  3. 实验充分: 涵盖仿真、对照实验和真实数据验证
  4. 实用性强: 解决了神经科学中的实际问题
  5. 可重现性: 提供详细的实现细节和参数设置

不足

  1. 计算开销: 相比传统方法仍有较大计算负担
  2. 参数调优: 需要较多超参数选择和模型设定
  3. 扩展性: 对于更大规模数据集的适用性需进一步验证
  4. 生物解释: 缺乏对模型参数生物学意义的深入讨论

影响力

  1. 学术贡献: 为功能连接分析提供了新的统计框架
  2. 实用价值: 可直接应用于临床和基础神经科学研究
  3. 方法论影响: 推动了计算神经科学中统计方法的发展
  4. 可复现性: 详细的方法描述有利于后续研究

适用场景

  1. 个体脑网络分析: 特别适用于需要准确个体连接性估计的研究
  2. 临床应用: 疾病诊断和治疗效果评估
  3. 纵向研究: 测试-重测可靠性要求高的研究
  4. 大规模数据: 具有高维时空结构的神经影像数据分析

参考文献

论文引用了63篇相关文献,主要包括:

  • Achard et al. (2023): 区域间相关估计器的理论分析
  • Vecchia (1988): 空间过程的似然近似方法
  • Bowman et al. (2008): fMRI数据的贝叶斯层次建模
  • Kang et al. (2012, 2017): 时空混合效应模型
  • Castruccio et al. (2018): 多分辨率时空模型

本论文通过严谨的统计建模和计算创新,为fMRI功能连接分析提供了重要的方法学贡献,具有较高的学术价值和实用意义。