2025-11-11T16:04:09.679573

A Mixed Model Approach for Estimating Regional Functional Connectivity from Voxel-level BOLD Signals

Liu, Zhang, Tran et al.
Resting-state brain functional connectivity quantifies the synchrony between activity patterns of different brain regions. In functional magnetic resonance imaging (fMRI), each region comprises a set of spatially contiguous voxels at which blood-oxygen-level-dependent signals are acquired. The ubiquitous Correlation of Averages (CA) estimator, and other similar metrics, are computed from spatially aggregated signals within each region, and remain the quantifications of inter-regional connectivity most used by neuroscientists despite their bias that stems from intra-regional correlation and measurement error. We leverage the framework of linear mixed-effects models to isolate different sources of variability in the voxel-level signals, including both inter-regional and intra-regional correlation and measurement error. A novel computational pipeline, focused on subject-level inter-regional correlation parameters of interest, is developed to address the challenges of applying maximum (or restricted maximum) likelihood estimation to such structured, high-dimensional spatiotemporal data. Simulation results demonstrate the reliability of correlation estimates and their large sample standard error approximations, and their superiority relative to CA. The proposed method is applied to two public fMRI data sets. First, we analyze scans of a dead rat to assess false positive performance when connectivity is absent. Second, individual human brain networks are constructed for subjects from a Human Connectome Project test-retest database. Concordance between inter-regional correlation estimates for test-retest scans of the same subject are shown to be higher for the proposed method relative to CA.
academic

Une Approche par Modèle Mixte pour l'Estimation de la Connectivité Fonctionnelle Régionale à partir de Signaux BOLD au Niveau des Voxels

Informations Fondamentales

  • ID de l'article: 2211.02192
  • Titre: A Mixed Model Approach for Estimating Regional Functional Connectivity from Voxel-level BOLD Signals
  • Auteurs: Ruobin Liu, Chao Zhang, Chau Tran, Sophie Achard, Wendy Meiring, Alexander Petersen
  • Classification: stat.ME (Statistiques - Méthodologie), stat.AP (Statistiques - Applications)
  • Date de publication: Novembre 2022 (prépublication arXiv, mise à jour novembre 2025)
  • Lien de l'article: https://arxiv.org/abs/2211.02192

Résumé

Cet article propose une nouvelle méthode basée sur un modèle linéaire à effets mixtes pour estimer la connectivité fonctionnelle cérébrale au repos à partir de l'imagerie par résonance magnétique fonctionnelle (IRMf). L'estimateur traditionnel de « corrélation des moyennes » (Correlation of Averages, CA), bien que largement utilisé, souffre de biais dus à la corrélation intra-régionale et aux erreurs de mesure. Par le biais du cadre des modèles à effets mixtes, cet article sépare les différentes sources de variabilité dans les signaux au niveau des voxels, notamment la corrélation inter-régionale et intra-régionale ainsi que les erreurs de mesure. L'étude développe un nouveau pipeline computationnel axé sur l'estimation des paramètres de corrélation inter-régionale au niveau individuel, en utilisant une approche d'estimation du maximum de vraisemblance pour traiter les défis des données spatio-temporelles de haute dimension. Les résultats de simulation démontrent la fiabilité de l'estimation de corrélation et sa supériorité par rapport à CA.

Contexte et Motivation de la Recherche

Définition du Problème

  1. Problème central: Comment estimer avec précision la connectivité fonctionnelle entre régions cérébrales à partir de signaux BOLD au niveau des voxels, en évitant les biais des méthodes traditionnelles
  2. Défis techniques:
    • Les données d'IRMf présentent des dépendances spatio-temporelles complexes
    • Le nombre de voxels dépasse largement la dimension temporelle, créant des défis computationnels
    • La corrélation spatiale intra-régionale et les erreurs de mesure affectent la précision de l'estimation de connectivité

Importance de la Recherche

  • La connectivité fonctionnelle est fondamentale pour l'étude des maladies neurodégénératives et des troubles de la conscience
  • L'estimation précise de la connectivité est cruciale pour les études neuroscientifiques au niveau individuel et populationnel
  • Les biais des méthodes existantes peuvent compromettre le diagnostic des maladies et les études de caractérisation individuelle

Limitations des Méthodes Existantes

Problèmes de l'estimateur CA traditionnel:

  1. Problème de biais: Contraint par la corrélation intra-régionale αⱼ et le ratio signal-bruit βⱼ, conduisant à une estimation biaisée vers 0
  2. Négligence des dépendances: Ne tient pas compte des dépendances spatio-temporelles des signaux au niveau des voxels
  3. Contraintes paramétriques: Les paramètres de connectivité sont affectés par le schéma d'échantillonnage et le bruit de la machine, manquant d'intrinsèque

Contributions Principales

  1. Proposition d'un nouveau modèle statistique: Cadre de modélisation des signaux BOLD au niveau des voxels basé sur un modèle linéaire à effets mixtes, distinguant explicitement la variabilité inter-régionale et intra-régionale
  2. Développement de méthodes d'estimation efficaces:
    • Stratégie d'estimation en deux étapes, combinant l'estimation du maximum de vraisemblance restreint (ReML)
    • Application pour la première fois de la méthode d'approximation de vraisemblance de Vecchia à la modélisation de connectivité fonctionnelle
  3. Garanties théoriques: Fourniture des propriétés asymptotiques de l'estimateur et de la théorie de l'inférence asymptotique
  4. Vérification empirique: Validation de la supériorité de la méthode sur données simulées et réelles (scans de rats morts, données test-retest HCP)

Détails de la Méthode

Définition de la Tâche

Entrée: Coefficients en ondelettes des signaux BOLD au niveau des voxels Xⱼₗₘ, où j=1,...,J pour les régions cérébrales, l=1,...,Lⱼ pour les voxels, m=1,...,M pour les coefficients en ondelettes Sortie: Paramètres de corrélation inter-régionale ρⱼⱼ', utilisés pour construire le réseau de connectivité fonctionnelle Contraintes: Assurer la faisabilité computationnelle pour les données spatio-temporelles de haute dimension

Architecture du Modèle

Modèle à Effets Mixtes BOLD

Le modèle central est:

X = Zμ + Uη + γ + ε

Où:

  • μⱼ: Effets fixes régionaux (moyenne régionale)
  • ηⱼₘ: Effets aléatoires régionaux (induisant la dépendance inter-régionale)
  • γⱼₗₘ: Effets aléatoires au niveau des voxels (induisant la dépendance intra-régionale)
  • εⱼₗₘ: Erreur de mesure

Paramétrisation de la Structure de Covariance

  1. Corrélation inter-régionale: Var(η) = (SRS) ⊗ A, où R = {ρⱼⱼ'} est la matrice de corrélation cible
  2. Structure intra-régionale: Λⱼ = Cⱼ ⊗ Bⱼ (covariance spatio-temporelle séparable)
  3. Définition des noyaux:
    • Noyau spatial: Noyau de Matérn K(d; ν, φ)
    • Noyau temporel: Noyau gaussien H(|m-m'|; τ)

Points d'Innovation Technique

Stratégie d'Estimation en Deux Étapes

Étape 1: Estimation des paramètres spécifiques à chaque région

  • Utilisation de ReML pour estimer les paramètres de chaque région θⱼ = kᵧⱼ, σ²ᵧⱼ, φᵧⱼ, τᵧⱼ
  • Élimination de l'influence des effets régionaux par vraisemblance restreinte

Étape 2: Estimation des paramètres globaux et inter-régionaux

  • Estimation des paramètres de corrélation inter-régionale θ = τη, kη, ρ₁₂, σ²η
  • Fixation des estimations de l'étape 1, concentration sur les paramètres de connectivité

Approximation de Vecchia

Pour résoudre le problème de complexité computationnelle (temps O(N³), mémoire O(N²)), l'approximation de vraisemblance de Vecchia est adoptée:

p(X) ≈ p(X_π(1)) ∏ᵢ₌₂ᴺ p(X_π(i) | X_π(j), j ∈ Jᵢ)

L'efficacité computationnelle est réalisée par des ensembles de conditionnement petits |Jᵢ|=100

Configuration Expérimentale

Ensembles de Données

  1. Données simulées:
    • J=3 régions cérébrales, M=60 coefficients en ondelettes
    • Utilisation de coordonnées spatiales d'expériences sur rats vivants (L₁=41, L₂=25, L₃=77 voxels)
    • Variation de l'intensité du signal δⱼ ∈ {0.1, 0.5, 0.7} et de la covariance spatiale ψⱼ ∈ {0.2, 0.5, 0.8}
  2. Données réelles:
    • Données de scans de rats morts (vérification du taux de faux positifs)
    • Base de données test-retest HCP (42 sujets, J=92 régions du réseau du mode par défaut)

Métriques d'Évaluation

  1. Simulation: Erreur quadratique moyenne (MSE), Écart absolu moyen (MAD)
  2. Données HCP: Coefficient de corrélation de concordance (CCC) pour évaluer la fiabilité test-retest
  3. Données de rats morts: Analyse du taux de faux positifs

Méthodes de Comparaison

  1. ρ̂CA: Estimateur traditionnel de corrélation des moyennes
  2. ρ̂EBLUE: Corrélation basée sur l'estimateur linéaire sans biais empiriquement optimal
  3. ρ̂ReML: Estimateur ReML complet
  4. ρ̂Vecchia: Estimateur d'approximation de Vecchia

Détails d'Implémentation

  • Noyaux: Noyau gaussien H(u;τ) = exp(-τ²u²/2), noyau de Matérn-5/2
  • Optimisation: Méthode quasi-newtonienne L-BFGS
  • Taille de l'ensemble de conditionnement de Vecchia: |Jᵢ| = 100
  • Test de significativité: Procédure de Benjamini-Yekutieli, FDR < 0.2

Résultats Expérimentaux

Résultats Principaux

Performance des Expériences de Simulation

  1. Précision: ρ̂ReML présente l'écart-type le plus petit dans tous les paramètres, avec la médiane la plus proche de la vraie valeur
  2. Analyse du biais:
    • Lorsque ρ=0.6, CA et EBLUE sont significativement biaisés vers 0
    • Avec une covariance spatiale élevée (ψ=0.8), le biais de CA et EBLUE s'aggrave
    • ρ̂ReML reste robuste dans tous les paramètres

Exemple de Résultats Numériques

Sous intensité de signal modérée (δ=0.5):

  • Covariance spatiale faible (ψ=0.2): MSE de ρ̂ReML de 0.008-0.025, significativement inférieur à CA de 0.016-0.033
  • Covariance spatiale élevée (ψ=0.8): L'écart est plus prononcé, MSE de ρ̂ReML de 0.012-0.028, CA de 0.056-0.194

Expériences d'Ablation

  1. Vérification de l'approximation de Vecchia: ρ̂Vecchia et ρ̂ReML présentent des performances quasi identiques, validant l'efficacité de la méthode d'approximation
  2. Robustesse de la spécification erronée du modèle: ρ̂ReML reste supérieur aux méthodes traditionnelles sous des structures de covariance alternatives
  3. Comparaison avec l'estimateur Oracle: La procédure en deux étapes présente une perte de performance minimale

Résultats sur Données Réelles

Analyse des Scans de Rats Morts

  • Contrôle des faux positifs: ρ̂Vecchia ne présente aucune arête significative au niveau de significativité de 5%, tandis que la méthode CA présente encore des arêtes significatives
  • Contrôle FDR: Les deux méthodes ne présentent aucune arête significative après ajustement BY (q<0.2), conforme aux attentes

Analyse Test-Retest HCP

  • Amélioration de la concordance: Dans toutes les stratégies de construction de graphe, la plupart des sujets présentent un CCC plus élevé avec la méthode du modèle mixte
  • Proportion d'arêtes: Parmi les sélections d'arêtes de 1%-20%, la méthode du modèle mixte surpasse continuellement CA
  • Significativité statistique: Parmi les 10% d'arêtes supérieures, environ 60-80% des sujets présentent une concordance test-retest plus élevée

Travaux Connexes

Principales Directions de Recherche

  1. Modélisation au niveau des voxels: Modèle à effets mixtes d'activation liée aux tâches de Woolrich et al. (2004)
  2. Connectivité au niveau populationnel: Modèle hiérarchique bayésien de Bowman et al. (2008)
  3. Méthodes dans le domaine fréquentiel: Modèle à effets mixtes dans le domaine fréquentiel de Kang et al. (2012)
  4. Modélisation spatio-temporelle: Approche par processus VAR de Castruccio et al. (2018)

Avantages de cet Article

  1. Spécifique à l'état de repos: Conçu pour les données au repos, se distinguant des études en tâche
  2. Niveau individuel: Concentration sur la construction de réseaux cérébraux individuels, plutôt que sur l'inférence populationnelle
  3. Priorité à la connectivité: Corrélation inter-régionale comme paramètre principal, plutôt que les effets de tâche
  4. Innovation computationnelle: Application pour la première fois de l'approximation de Vecchia à la connectivité fonctionnelle

Conclusions et Discussion

Conclusions Principales

  1. Validité de la méthode: Le modèle à effets mixtes améliore significativement la précision et la fiabilité de l'estimation de connectivité fonctionnelle
  2. Correction du biais: Résout avec succès le problème de biais systématique de l'estimateur CA
  3. Faisabilité computationnelle: L'approximation de Vecchia rend la méthode applicable aux données à grande échelle
  4. Valeur pratique: Démontre une meilleure concordance test-retest sur les données réelles

Limitations

  1. Complexité computationnelle: Malgré les méthodes d'approximation, reste plus gourmande en calcul que CA
  2. Hypothèses du modèle: Dépend de l'hypothèse gaussienne et de la structure de covariance séparable
  3. Estimation des paramètres: Certains paramètres de lissage doivent être prédéfinis plutôt qu'estimés
  4. Régions prédéfinies: Dépend de la segmentation cérébrale prédéfinie, plutôt que dirigée par les données

Directions Futures

  1. Régions spécifiques au sujet: Intégration de méthodes de découverte de régions dirigées par les données
  2. Modélisation multi-échelle: Extension à l'analyse conjointe de plusieurs échelles d'ondelettes
  3. Extension non-gaussienne: Considération de la robustesse aux distributions non-gaussiennes
  4. Applications en temps réel: Développement d'algorithmes d'estimation en ligne plus efficaces

Évaluation Approfondie

Points Forts

  1. Rigueur théorique: Fourniture d'un cadre statistique complet et de propriétés asymptotiques
  2. Innovation méthodologique: Combinaison ingénieuse de modèles à effets mixtes et de techniques d'approximation computationnelle
  3. Expérimentation complète: Couverture de simulations, d'expériences de contrôle et de validation sur données réelles
  4. Force pratique: Résolution de problèmes réels en neurosciences
  5. Reproductibilité: Fourniture de détails d'implémentation et de paramètres détaillés

Insuffisances

  1. Surcharge computationnelle: Charge computationnelle toujours importante comparée aux méthodes traditionnelles
  2. Ajustement des paramètres: Nécessite de nombreux choix de hyperparamètres et spécifications de modèle
  3. Extensibilité: L'applicabilité à des ensembles de données plus volumineux nécessite une vérification supplémentaire
  4. Interprétation biologique: Manque de discussion approfondie sur la signification biologique des paramètres du modèle

Impact

  1. Contribution académique: Fourniture d'un nouveau cadre statistique pour l'analyse de connectivité fonctionnelle
  2. Valeur pratique: Applicable directement à la recherche neuroscientifique clinique et fondamentale
  3. Impact méthodologique: Promotion du développement des méthodes statistiques en neurosciences computationnelles
  4. Reproductibilité: La description détaillée de la méthode facilite les recherches ultérieures

Scénarios d'Application

  1. Analyse de réseaux cérébraux individuels: Particulièrement adapté aux études nécessitant une estimation précise de la connectivité individuelle
  2. Applications cliniques: Diagnostic des maladies et évaluation de l'efficacité du traitement
  3. Études longitudinales: Études avec exigences élevées de fiabilité test-retest
  4. Analyse de données à grande échelle: Analyse de données de neuroimagerie avec structure spatio-temporelle complexe

Références

L'article cite 63 références connexes, incluant principalement:

  • Achard et al. (2023): Analyse théorique des estimateurs de corrélation inter-régionale
  • Vecchia (1988): Méthode d'approximation de vraisemblance pour processus spatiaux
  • Bowman et al. (2008): Modélisation hiérarchique bayésienne des données d'IRMf
  • Kang et al. (2012, 2017): Modèles à effets mixtes spatio-temporels
  • Castruccio et al. (2018): Modèles spatio-temporels multi-résolution

Cet article apporte une contribution méthodologique importante à l'analyse de connectivité fonctionnelle en IRMf par la modélisation statistique rigoureuse et l'innovation computationnelle, possédant une valeur académique et pratique considérable.