2025-11-11T16:04:09.679573

A Mixed Model Approach for Estimating Regional Functional Connectivity from Voxel-level BOLD Signals

Liu, Zhang, Tran et al.

Resting-state brain functional connectivity quantifies the synchrony between activity patterns of different brain regions. In functional magnetic resonance imaging (fMRI), each region comprises a set of spatially contiguous voxels at which blood-oxygen-level-dependent signals are acquired. The ubiquitous Correlation of Averages (CA) estimator, and other similar metrics, are computed from spatially aggregated signals within each region, and remain the quantifications of inter-regional connectivity most used by neuroscientists despite their bias that stems from intra-regional correlation and measurement error. We leverage the framework of linear mixed-effects models to isolate different sources of variability in the voxel-level signals, including both inter-regional and intra-regional correlation and measurement error. A novel computational pipeline, focused on subject-level inter-regional correlation parameters of interest, is developed to address the challenges of applying maximum (or restricted maximum) likelihood estimation to such structured, high-dimensional spatiotemporal data. Simulation results demonstrate the reliability of correlation estimates and their large sample standard error approximations, and their superiority relative to CA. The proposed method is applied to two public fMRI data sets. First, we analyze scans of a dead rat to assess false positive performance when connectivity is absent. Second, individual human brain networks are constructed for subjects from a Human Connectome Project test-retest database. Concordance between inter-regional correlation estimates for test-retest scans of the same subject are shown to be higher for the proposed method relative to CA.

academic

Un Enfoque de Modelo Mixto para Estimar la Conectividad Funcional Regional a partir de Señales BOLD a Nivel de Vóxel

Información Básica

ID del Artículo: 2211.02192
Título: A Mixed Model Approach for Estimating Regional Functional Connectivity from Voxel-level BOLD Signals
Autores: Ruobin Liu, Chao Zhang, Chau Tran, Sophie Achard, Wendy Meiring, Alexander Petersen
Clasificación: stat.ME (Estadística - Metodología), stat.AP (Estadística - Aplicaciones)
Fecha de Publicación: Noviembre de 2022 (preimpresión en arXiv, actualizado en noviembre de 2025)
Enlace del Artículo: https://arxiv.org/abs/2211.02192

Resumen

Este artículo propone un nuevo método basado en modelos lineales de efectos mixtos para abordar el problema de la estimación de conectividad funcional cerebral en estado de reposo en resonancia magnética funcional (fMRI). Aunque el estimador tradicional de "Correlación de Promedios" (Correlation of Averages, CA) es ampliamente utilizado, presenta problemas de sesgo causados por la correlación intrarregional y errores de medición. A través del marco de modelos de efectos mixtos lineales, este trabajo separa diferentes fuentes de variabilidad en las señales a nivel de vóxel, incluyendo correlaciones interregionales e intrarregionales, así como errores de medición. Se desarrolló un nuevo pipeline computacional enfocado en la estimación de parámetros de correlación interregional a nivel individual, empleando métodos de máxima verosimilitud para abordar los desafíos de datos espacio-temporales de alta dimensión. Los resultados de simulación demuestran la confiabilidad de la estimación de correlación y su superioridad respecto al método CA.

Antecedentes de Investigación y Motivación

Definición del Problema

Problema Central: Cómo estimar con precisión la conectividad funcional entre regiones cerebrales a partir de señales BOLD a nivel de vóxel, evitando los problemas de sesgo de los métodos tradicionales
Desafíos Técnicos:
- Los datos de fMRI presentan dependencias espacio-temporales complejas
- El número de vóxeles es mucho mayor que la dimensión temporal, lo que genera desafíos computacionales
- La correlación espacial intrarregional y los errores de medición afectan la precisión de la estimación de conectividad

Importancia de la Investigación

La conectividad funcional es fundamental para estudiar patologías como enfermedades neurodegenerativas y trastornos de conciencia
La estimación precisa de conectividad es crítica para investigaciones de neurociencia a nivel individual y poblacional
El sesgo en los métodos existentes puede afectar el diagnóstico de enfermedades y estudios de caracterización individual

Limitaciones de Métodos Existentes

Problemas del estimador CA tradicional:

Problema de Sesgo: Limitado por la correlación intrarregional αⱼ y la relación de señal de ruido βⱼ, causando que las estimaciones se desplacen hacia 0
Ignorancia de Dependencias: No considera las dependencias espacio-temporales de las señales a nivel de vóxel
Restricciones de Parámetros: Los parámetros de conectividad están afectados por el esquema de muestreo y el ruido de la máquina, careciendo de intrínsecas

Contribuciones Principales

Propuesta de Nuevo Modelo Estadístico: Marco de modelado de señales BOLD a nivel de vóxel basado en modelos lineales de efectos mixtos, distinguiendo explícitamente entre variabilidad interregional e intrarregional
Desarrollo de Métodos de Estimación Eficientes:
- Estrategia de estimación en dos etapas, combinando máxima verosimilitud restringida (ReML)
- Primera aplicación de aproximación de verosimilitud de Vecchia en modelado de conectividad funcional
Garantías Teóricas: Proporciona propiedades asintóticas del estimador e inferencia asintótica
Verificación Empírica: Validación de la superioridad del método en simulaciones y datos reales (escaneos de ratas muertas, datos de prueba-reprueba de HCP)

Explicación Detallada del Método

Definición de Tarea

Entrada: Coeficientes de ondícula de señales BOLD a nivel de vóxel Xⱼₗₘ, donde j=1,...,J son regiones cerebrales, l=1,...,Lⱼ son vóxeles, m=1,...,M son coeficientes de ondícula Salida: Parámetro de correlación interregional ρⱼⱼ', utilizado para construir la red de conectividad funcional Restricciones: Manejar la viabilidad computacional de datos espacio-temporales de alta dimensión

Arquitectura del Modelo

Modelo de Efectos Mixtos BOLD

El modelo central es:

X = Zμ + Uη + γ + ε

Donde:

μⱼ: Efecto fijo regional (media regional)
ηⱼₘ: Efecto aleatorio regional (induce dependencia interregional)
γⱼₗₘ: Efecto aleatorio a nivel de vóxel (induce dependencia intrarregional)
εⱼₗₘ: Error de medición

Parametrización de Estructura de Covarianza

Correlación Interregional: Var(η) = (SRS) ⊗ A, donde R = {ρⱼⱼ'} es la matriz de correlación objetivo
Estructura Intrarregional: Λⱼ = Cⱼ ⊗ Bⱼ (covarianza espacio-temporal separable)
Definición de Núcleos:
- Núcleo espacial: Núcleo de Matérn K(d; ν, φ)
- Núcleo temporal: Núcleo gaussiano H(|m-m'|; τ)

Puntos de Innovación Técnica

Estrategia de Estimación en Dos Etapas

Etapa 1: Estimación de parámetros específicos de región

Utiliza ReML para estimar parámetros de cada región θⱼ = kᵧⱼ, σ²ᵧⱼ, φᵧⱼ, τᵧⱼ
Elimina el efecto de los efectos regionales mediante verosimilitud restringida

Etapa 2: Estimación de parámetros globales e interregionales

Estima parámetros de correlación interregional θ = τη, kη, ρ₁₂, σ²η
Fija las estimaciones de la Etapa 1, enfocándose en parámetros de conectividad

Aproximación de Vecchia

Para resolver la complejidad computacional (tiempo O(N³), memoria O(N²)), se utiliza la aproximación de verosimilitud de Vecchia:

p(X) ≈ p(X_π(1)) ∏ᵢ₌₂ᴺ p(X_π(i) | X_π(j), j ∈ Jᵢ)

Logra mejora de eficiencia computacional mediante conjuntos condicionales pequeños |Jᵢ|=100

Configuración Experimental

Conjuntos de Datos

Datos Simulados:
- J=3 regiones cerebrales, M=60 coeficientes de ondícula
- Utilizando coordenadas espaciales de experimentos con ratas vivas (L₁=41, L₂=25, L₃=77 vóxeles)
- Variación de intensidad de señal δⱼ ∈ {0.1, 0.5, 0.7} y covarianza espacial ψⱼ ∈ {0.2, 0.5, 0.8}
Datos Reales:
- Datos de escaneo de ratas muertas (verificación de tasa de falsos positivos)
- Base de datos de prueba-reprueba de HCP (42 sujetos, J=92 regiones de red de modo predeterminado)

Métricas de Evaluación

Simulación: Error cuadrático medio (MSE), desviación absoluta media (MAD)
Datos de HCP: Coeficiente de correlación de concordancia (CCC) para evaluar confiabilidad prueba-reprueba
Datos de Ratas Muertas: Análisis de tasa de falsos positivos

Métodos de Comparación

ρ̂CA: Estimador tradicional de correlación de promedios
ρ̂EBLUE: Correlación basada en estimador lineal insesgado óptimo empírico
ρ̂ReML: Estimador ReML completo
ρ̂Vecchia: Estimador de aproximación de Vecchia

Detalles de Implementación

Núcleos: Núcleo gaussiano H(u;τ) = exp(-τ²u²/2), núcleo Matérn-5/2
Optimización: Método cuasi-Newton L-BFGS
Tamaño del conjunto condicional de Vecchia: |Jᵢ| = 100
Prueba de significancia: Procedimiento de Benjamini-Yekutieli, FDR < 0.2

Resultados Experimentales

Resultados Principales

Desempeño de Experimentos de Simulación

Precisión: ρ̂ReML tiene la desviación estándar más pequeña en todas las configuraciones, con mediana más cercana al valor verdadero
Análisis de Sesgo:
- Cuando ρ=0.6, CA y EBLUE se desplazan significativamente hacia 0
- Con alta covarianza espacial (ψ=0.8), el sesgo de CA y EBLUE se agrava
- ρ̂ReML mantiene robustez en diversas configuraciones

Ejemplo de Resultados Numéricos

Con intensidad de señal moderada (δ=0.5):

Baja covarianza espacial (ψ=0.2): MSE de ρ̂ReML es 0.008-0.025, significativamente menor que CA de 0.016-0.033
Alta covarianza espacial (ψ=0.8): La brecha es más evidente, MSE de ρ̂ReML es 0.012-0.028, CA es 0.056-0.194

Experimentos de Ablación

Verificación de Aproximación de Vecchia: El desempeño de ρ̂Vecchia es casi idéntico a ρ̂ReML, demostrando la efectividad del método de aproximación
Robustez de Especificación Errónea del Modelo: ρ̂ReML sigue siendo superior a métodos tradicionales bajo estructuras de covarianza alternativas
Comparación con Estimador Oracle: El procedimiento de dos etapas tiene pérdida de desempeño mínima

Resultados de Datos Reales

Análisis de Escaneo de Ratas Muertas

Control de Falsos Positivos: ρ̂Vecchia no tiene bordes significativos al nivel de significancia del 5%, mientras que el método CA aún tiene bordes significativos
Control de FDR: Ambos métodos no tienen bordes significativos después del ajuste BY (q<0.2), como se esperaba

Análisis de Prueba-Reprueba de HCP

Mejora de Consistencia: En todas las estrategias de construcción de gráficos, la mayoría de sujetos tienen CCC más alto con el método de modelo mixto
Proporción de Bordes: De selecciones de bordes del 1%-20%, el método de modelo mixto es consistentemente superior a CA
Significancia Estadística: Entre los 10% de bordes principales, aproximadamente 60-80% de sujetos muestran mayor consistencia prueba-reprueba

Trabajo Relacionado

Direcciones de Investigación Principal

Modelado a Nivel de Vóxel: Modelo de efectos mixtos de activación relacionada con tareas de Woolrich et al. (2004)
Conectividad a Nivel Poblacional: Modelo jerárquico bayesiano de Bowman et al. (2008)
Métodos en Dominio de Frecuencia: Modelo de efectos mixtos en dominio de frecuencia de Kang et al. (2012)
Modelado Espacio-Temporal: Método de proceso VAR de Castruccio et al. (2018)

Ventajas de Este Artículo

Especializado en Estado de Reposo: Diseñado específicamente para datos en estado de reposo, diferente de investigaciones de tareas
Nivel Individual: Enfocado en construcción de redes cerebrales individuales, en lugar de inferencia poblacional
Prioridad de Conectividad: Correlación interregional como parámetro principal, en lugar de efectos de tareas
Innovación Computacional: Primera aplicación de aproximación de Vecchia en conectividad funcional

Conclusiones y Discusión

Conclusiones Principales

Validez del Método: El modelo de efectos mixtos mejora significativamente la precisión y confiabilidad de la estimación de conectividad funcional
Corrección de Sesgo: Resuelve exitosamente el problema de sesgo sistemático del estimador CA
Viabilidad Computacional: La aproximación de Vecchia hace que el método sea aplicable a datos a gran escala
Valor Práctico: Muestra mejor consistencia prueba-reprueba en datos reales

Limitaciones

Complejidad Computacional: A pesar de los métodos de aproximación, sigue siendo más intensivo computacionalmente que CA
Supuestos del Modelo: Depende de supuestos gaussianos y estructura de covarianza separable
Estimación de Parámetros: Algunos parámetros de suavizado requieren preestablecimiento en lugar de estimación
Predefinición de Regiones: Depende de divisiones de regiones cerebrales predefinidas, no impulsadas por datos

Direcciones Futuras

Regiones Específicas del Sujeto: Integración con métodos de descubrimiento de regiones impulsados por datos
Modelado Multiescala: Extensión a análisis conjunto de múltiples escalas de ondícula
Extensión No Gaussiana: Consideración de robustez bajo distribuciones no gaussianas
Aplicaciones en Tiempo Real: Desarrollo de algoritmos de estimación en línea más eficientes

Evaluación Profunda

Fortalezas

Rigor Teórico: Proporciona marco estadístico completo y propiedades asintóticas
Innovación Metodológica: Combina ingeniosamente modelos de efectos mixtos y técnicas de aproximación computacional
Experimentación Exhaustiva: Abarca simulaciones, experimentos de control y validación con datos reales
Aplicabilidad Práctica: Resuelve problemas reales en neurociencia
Reproducibilidad: Proporciona detalles de implementación detallados y configuración de parámetros

Deficiencias

Carga Computacional: Sigue teniendo carga computacional considerable en comparación con métodos tradicionales
Ajuste de Parámetros: Requiere muchas selecciones de hiperparámetros y especificación de modelo
Escalabilidad: La aplicabilidad a conjuntos de datos más grandes requiere verificación adicional
Interpretación Biológica: Carece de discusión profunda sobre el significado biológico de los parámetros del modelo

Impacto

Contribución Académica: Proporciona nuevo marco estadístico para análisis de conectividad funcional
Valor Práctico: Aplicable directamente a investigaciones clínicas y de neurociencia básica
Impacto Metodológico: Promueve desarrollo de métodos estadísticos en neurociencia computacional
Reproducibilidad: La descripción detallada del método facilita investigaciones posteriores

Escenarios de Aplicación

Análisis de Redes Cerebrales Individuales: Particularmente adecuado para investigaciones que requieren estimación precisa de conectividad individual
Aplicaciones Clínicas: Diagnóstico de enfermedades y evaluación de efectividad de tratamiento
Estudios Longitudinales: Investigaciones con altos requisitos de confiabilidad prueba-reprueba
Análisis de Datos a Gran Escala: Análisis de datos de neuroimagen con estructura espacio-temporal de alta dimensión

Referencias

El artículo cita 63 referencias relacionadas, incluyendo principalmente:

Achard et al. (2023): Análisis teórico de estimadores de correlación interregional
Vecchia (1988): Método de aproximación de verosimilitud para procesos espaciales
Bowman et al. (2008): Modelado jerárquico bayesiano de datos de fMRI
Kang et al. (2012, 2017): Modelos de efectos mixtos espacio-temporales
Castruccio et al. (2018): Modelos espacio-temporales de múltiples resoluciones

Este artículo, a través de modelado estadístico riguroso e innovación computacional, proporciona una contribución metodológica importante para el análisis de conectividad funcional de fMRI, con considerable valor académico y práctico.