2025-11-11T16:04:09.679573

A Mixed Model Approach for Estimating Regional Functional Connectivity from Voxel-level BOLD Signals

Liu, Zhang, Tran et al.
Resting-state brain functional connectivity quantifies the synchrony between activity patterns of different brain regions. In functional magnetic resonance imaging (fMRI), each region comprises a set of spatially contiguous voxels at which blood-oxygen-level-dependent signals are acquired. The ubiquitous Correlation of Averages (CA) estimator, and other similar metrics, are computed from spatially aggregated signals within each region, and remain the quantifications of inter-regional connectivity most used by neuroscientists despite their bias that stems from intra-regional correlation and measurement error. We leverage the framework of linear mixed-effects models to isolate different sources of variability in the voxel-level signals, including both inter-regional and intra-regional correlation and measurement error. A novel computational pipeline, focused on subject-level inter-regional correlation parameters of interest, is developed to address the challenges of applying maximum (or restricted maximum) likelihood estimation to such structured, high-dimensional spatiotemporal data. Simulation results demonstrate the reliability of correlation estimates and their large sample standard error approximations, and their superiority relative to CA. The proposed method is applied to two public fMRI data sets. First, we analyze scans of a dead rat to assess false positive performance when connectivity is absent. Second, individual human brain networks are constructed for subjects from a Human Connectome Project test-retest database. Concordance between inter-regional correlation estimates for test-retest scans of the same subject are shown to be higher for the proposed method relative to CA.
academic

Un Approccio con Modelli Misti per la Stima della Connettività Funzionale Regionale da Segnali BOLD a Livello di Voxel

Informazioni Fondamentali

  • ID Articolo: 2211.02192
  • Titolo: A Mixed Model Approach for Estimating Regional Functional Connectivity from Voxel-level BOLD Signals
  • Autori: Ruobin Liu, Chao Zhang, Chau Tran, Sophie Achard, Wendy Meiring, Alexander Petersen
  • Classificazione: stat.ME (Statistica - Metodologia), stat.AP (Statistica - Applicazioni)
  • Data di Pubblicazione: Novembre 2022 (preprint arXiv, aggiornato novembre 2025)
  • Link Articolo: https://arxiv.org/abs/2211.02192

Riassunto

Questo articolo propone un nuovo metodo basato su modelli lineari ad effetti misti per affrontare il problema della stima della connettività funzionale cerebrale a riposo nella risonanza magnetica funzionale (fMRI). Lo stimatore tradizionale "Correlazione delle Medie" (Correlation of Averages, CA), sebbene ampiamente utilizzato, presenta problemi di distorsione dovuti alla correlazione intraregionale e agli errori di misurazione. Attraverso il quadro dei modelli ad effetti misti lineari, questo lavoro separa le diverse fonti di variabilità nei segnali a livello di voxel, inclusa la correlazione interregionale e intraregionale nonché gli errori di misurazione. Lo studio sviluppa una nuova pipeline computazionale focalizzata sulla stima dei parametri di correlazione interregionale a livello individuale, adottando il metodo della massima verosimiglianza per affrontare le sfide dei dati spaziotemporali ad alta dimensionalità. I risultati delle simulazioni dimostrano l'affidabilità della stima della correlazione e la sua superiorità rispetto al metodo CA.

Contesto di Ricerca e Motivazione

Definizione del Problema

  1. Problema Centrale: Come stimare accuratamente la connettività funzionale tra regioni cerebrali da segnali BOLD a livello di voxel, evitando i problemi di distorsione dei metodi tradizionali
  2. Sfide Tecniche:
    • I dati fMRI presentano complesse dipendenze spaziotemporali
    • Il numero di voxel supera di gran lunga la dimensione temporale, causando sfide computazionali
    • La correlazione spaziale intraregionale e gli errori di misurazione influenzano l'accuratezza della stima della connettività

Importanza della Ricerca

  • La connettività funzionale è fondamentale per lo studio della patologia delle malattie neurodegenerative e dei disturbi di coscienza
  • La stima accurata della connettività è critica per la ricerca neuroscientifica a livello individuale e di gruppo
  • La distorsione dei metodi esistenti potrebbe influenzare la diagnosi di malattie e gli studi di caratterizzazione individuale

Limitazioni dei Metodi Esistenti

Problemi dello stimatore CA tradizionale:

  1. Problema di Distorsione: Vincolato dalla correlazione intraregionale αⱼ e dal rapporto segnale-rumore βⱼ, causando una distorsione dello stimatore verso 0
  2. Ignoranza delle Dipendenze: Non considera le dipendenze spaziotemporali nei segnali a livello di voxel
  3. Vincoli Parametrici: I parametri di connettività sono influenzati dallo schema di campionamento e dal rumore della macchina, mancando di proprietà intrinseche

Contributi Principali

  1. Proposta di Nuovo Modello Statistico: Quadro di modellazione basato su modelli lineari ad effetti misti per segnali BOLD a livello di voxel, con chiara distinzione tra variabilità interregionale e intraregionale
  2. Sviluppo di Metodi di Stima Efficienti:
    • Strategia di stima in due fasi, combinata con stima della massima verosimiglianza ristretta (ReML)
    • Prima applicazione del metodo di approssimazione della verosimiglianza di Vecchia nella modellazione della connettività funzionale
  3. Garanzie Teoriche: Fornisce proprietà asintotiche dello stimatore e teoria dell'inferenza asintotica
  4. Verifica Empirica: Convalida la superiorità del metodo su dati simulati e reali (scansioni di topi morti, dati test-retest HCP)

Dettagli del Metodo

Definizione del Compito

Input: Coefficienti wavelet dei segnali BOLD a livello di voxel Xⱼₗₘ, dove j=1,...,J per regioni cerebrali, l=1,...,Lⱼ per voxel, m=1,...,M per coefficienti wavelet Output: Parametri di correlazione interregionale ρⱼⱼ', utilizzati per costruire la rete di connettività funzionale Vincoli: Gestione della fattibilità computazionale per dati spaziotemporali ad alta dimensionalità

Architettura del Modello

Modello ad Effetti Misti BOLD

Il modello centrale è:

X = Zμ + Uη + γ + ε

Dove:

  • μⱼ: Effetto fisso regionale (media regionale)
  • ηⱼₘ: Effetto casuale regionale (induce dipendenza interregionale)
  • γⱼₗₘ: Effetto casuale a livello di voxel (induce dipendenza intraregionale)
  • εⱼₗₘ: Errore di misurazione

Parametrizzazione della Struttura di Covarianza

  1. Correlazione Interregionale: Var(η) = (SRS) ⊗ A, dove R = {ρⱼⱼ'} è la matrice di correlazione target
  2. Struttura Intraregionale: Λⱼ = Cⱼ ⊗ Bⱼ (covarianza spazio-temporale separabile)
  3. Definizione dei Kernel:
    • Kernel spaziale: Kernel Matérn K(d; ν, φ)
    • Kernel temporale: Kernel gaussiano H(|m-m'|; τ)

Punti di Innovazione Tecnica

Strategia di Stima in Due Fasi

Fase 1: Stima dei parametri specifici della regione

  • Utilizzo di ReML per stimare i parametri di ogni regione θⱼ = kᵧⱼ, σ²ᵧⱼ, φᵧⱼ, τᵧⱼ
  • Eliminazione dell'influenza degli effetti regionali attraverso la verosimiglianza ristretta

Fase 2: Stima dei parametri globali e interregionali

  • Stima dei parametri di correlazione interregionale θ = τη, kη, ρ₁₂, σ²η
  • Fissaggio delle stime della Fase 1, focalizzazione sui parametri di connettività

Approssimazione di Vecchia

Per risolvere il problema della complessità computazionale (tempo O(N³), memoria O(N²)), viene adottata l'approssimazione della verosimiglianza di Vecchia:

p(X) ≈ p(X_π(1)) ∏ᵢ₌₂ᴺ p(X_π(i) | X_π(j), j ∈ Jᵢ)

Attraverso piccoli insiemi condizionali |Jᵢ|=100 si realizza un miglioramento dell'efficienza computazionale

Configurazione Sperimentale

Dataset

  1. Dati Simulati:
    • J=3 regioni cerebrali, M=60 coefficienti wavelet
    • Utilizzo di coordinate spaziali da esperimenti su topi vivi (L₁=41, L₂=25, L₃=77 voxel)
    • Variazione dell'intensità del segnale δⱼ ∈ {0.1, 0.5, 0.7} e covarianza spaziale ψⱼ ∈ {0.2, 0.5, 0.8}
  2. Dati Reali:
    • Dati di scansione di topi morti (verifica del tasso di falsi positivi)
    • Database test-retest HCP (42 soggetti, J=92 regioni della rete di modo predefinito)

Metriche di Valutazione

  1. Simulazione: Errore quadratico medio (MSE), Deviazione assoluta media (MAD)
  2. Dati HCP: Coefficiente di concordanza di correlazione (CCC) per valutare l'affidabilità test-retest
  3. Dati Topi Morti: Analisi del tasso di falsi positivi

Metodi di Confronto

  1. ρ̂CA: Stimatore tradizionale di correlazione delle medie
  2. ρ̂EBLUE: Correlazione basata su stimatore lineare imparziale ottimale empirico
  3. ρ̂ReML: Stimatore ReML completo
  4. ρ̂Vecchia: Stimatore con approssimazione di Vecchia

Dettagli di Implementazione

  • Kernel: Kernel gaussiano H(u;τ) = exp(-τ²u²/2), kernel Matérn-5/2
  • Ottimizzazione: Metodo quasi-Newton L-BFGS
  • Dimensione dell'insieme condizionale di Vecchia: |Jᵢ| = 100
  • Test di significatività: Procedura Benjamini-Yekutieli, FDR < 0.2

Risultati Sperimentali

Risultati Principali

Prestazioni degli Esperimenti di Simulazione

  1. Accuratezza: ρ̂ReML presenta la deviazione standard più piccola in tutti gli scenari, con mediana più vicina al valore vero
  2. Analisi della Distorsione:
    • Quando ρ=0.6, CA e EBLUE mostrano distorsione significativa verso 0
    • Con alta covarianza spaziale (ψ=0.8), la distorsione di CA e EBLUE si aggrava
    • ρ̂ReML mantiene robustezza in vari scenari

Esempio di Risultati Numerici

Con intensità di segnale moderata (δ=0.5):

  • Bassa covarianza spaziale (ψ=0.2): MSE di ρ̂ReML è 0.008-0.025, significativamente inferiore a CA di 0.016-0.033
  • Alta covarianza spaziale (ψ=0.8): Il divario è più evidente, MSE di ρ̂ReML è 0.012-0.028, CA è 0.056-0.194

Esperimenti di Ablazione

  1. Verifica dell'Approssimazione di Vecchia: ρ̂Vecchia ha prestazioni quasi identiche a ρ̂ReML, dimostrando l'efficacia del metodo di approssimazione
  2. Robustezza della Specifica Errata del Modello: ρ̂ReML rimane superiore ai metodi tradizionali anche con strutture di covarianza alternative
  3. Confronto con Stimatore Oracle: La procedura in due fasi ha perdita di prestazioni minima

Risultati su Dati Reali

Analisi di Scansione di Topi Morti

  • Controllo dei Falsi Positivi: ρ̂Vecchia non ha bordi significativi al livello di significatività del 5%, mentre il metodo CA ha ancora bordi significativi
  • Controllo FDR: Entrambi i metodi non hanno bordi significativi dopo l'aggiustamento BY (q<0.2), come previsto

Analisi Test-Retest HCP

  • Miglioramento della Concordanza: In tutte le strategie di costruzione del grafo, la maggior parte dei soggetti mostra CCC più elevato con il metodo del modello misto
  • Proporzione di Bordi: Dalla selezione di bordi dell'1%-20%, il metodo del modello misto supera costantemente CA
  • Significatività Statistica: Nei bordi superiori del 10%, circa il 60-80% dei soggetti mostra maggiore concordanza test-retest

Lavori Correlati

Principali Direzioni di Ricerca

  1. Modellazione a Livello di Voxel: Modello ad effetti misti per attivazione correlata a compito di Woolrich et al. (2004)
  2. Connettività a Livello di Gruppo: Modello gerarchico bayesiano di Bowman et al. (2008)
  3. Metodi nel Dominio della Frequenza: Modello ad effetti misti nel dominio della frequenza di Kang et al. (2012)
  4. Modellazione Spaziotemporale: Metodo del processo VAR di Castruccio et al. (2018)

Vantaggi di Questo Lavoro

  1. Specifico per Stato di Riposo: Progettato per dati a riposo, diverso dalla ricerca su compiti
  2. Livello Individuale: Focalizzato sulla costruzione di reti cerebrali individuali, non su inferenza di gruppo
  3. Priorità sulla Connettività: Parametro principale è la correlazione interregionale, non l'effetto del compito
  4. Innovazione Computazionale: Prima applicazione dell'approssimazione di Vecchia nella connettività funzionale

Conclusioni e Discussione

Conclusioni Principali

  1. Validità del Metodo: Il modello ad effetti misti migliora significativamente l'accuratezza e l'affidabilità della stima della connettività funzionale
  2. Correzione della Distorsione: Risolve con successo il problema della distorsione sistematica dello stimatore CA
  3. Fattibilità Computazionale: L'approssimazione di Vecchia rende il metodo applicabile a dati su larga scala
  4. Valore Pratico: Mostra migliore concordanza test-retest nei dati reali

Limitazioni

  1. Complessità Computazionale: Nonostante i metodi di approssimazione, rimane computazionalmente più intensivo di CA
  2. Ipotesi del Modello: Dipende dall'ipotesi gaussiana e dalla struttura di covarianza separabile
  3. Stima dei Parametri: Alcuni parametri di lisciatura devono essere preimpostati piuttosto che stimati
  4. Regioni Predefinite: Dipende dalla parcellizzazione cerebrale predefinita, non guidata dai dati

Direzioni Future

  1. Regioni Specifiche del Soggetto: Integrazione con metodi di scoperta di regioni guidati dai dati
  2. Modellazione Multiscala: Estensione all'analisi congiunta di più scale wavelet
  3. Estensione Non-Gaussiana: Considerazione della robustezza per distribuzioni non-gaussiane
  4. Applicazioni in Tempo Reale: Sviluppo di algoritmi di stima online più efficienti

Valutazione Approfondita

Punti di Forza

  1. Rigore Teorico: Fornisce un quadro statistico completo e proprietà asintotiche
  2. Innovazione Metodologica: Combina abilmente modelli ad effetti misti e tecniche di approssimazione computazionale
  3. Esperimenti Completi: Copre simulazioni, esperimenti di controllo e validazione su dati reali
  4. Forte Praticità: Risolve problemi pratici nella neuroscienza
  5. Riproducibilità: Fornisce dettagli di implementazione e impostazioni dei parametri

Carenze

  1. Carico Computazionale: Rimane un onere computazionale significativo rispetto ai metodi tradizionali
  2. Sintonizzazione dei Parametri: Richiede numerose scelte di iperparametri e specifiche del modello
  3. Scalabilità: L'applicabilità a dataset ancora più grandi richiede ulteriore verifica
  4. Interpretazione Biologica: Manca una discussione approfondita del significato biologico dei parametri del modello

Impatto

  1. Contributo Accademico: Fornisce un nuovo quadro statistico per l'analisi della connettività funzionale
  2. Valore Pratico: Applicabile direttamente alla ricerca neuroscientifica clinica e di base
  3. Impatto Metodologico: Promuove lo sviluppo di metodi statistici nella neuroscienza computazionale
  4. Riproducibilità: La descrizione dettagliata del metodo facilita la ricerca successiva

Scenari di Applicazione

  1. Analisi di Reti Cerebrali Individuali: Particolarmente adatto per studi che richiedono stima accurata della connettività individuale
  2. Applicazioni Cliniche: Diagnosi di malattie e valutazione dell'efficacia del trattamento
  3. Studi Longitudinali: Studi con elevati requisiti di affidabilità test-retest
  4. Analisi di Dati su Larga Scala: Analisi di dati neuroimaging con complessa struttura spaziotemporale

Bibliografia

L'articolo cita 63 riferimenti correlati, principalmente includenti:

  • Achard et al. (2023): Analisi teorica degli stimatori di correlazione interregionale
  • Vecchia (1988): Metodo di approssimazione della verosimiglianza per processi spaziali
  • Bowman et al. (2008): Modellazione gerarchica bayesiana per dati fMRI
  • Kang et al. (2012, 2017): Modelli ad effetti misti spaziotemporali
  • Castruccio et al. (2018): Modelli spaziotemporali a multirisoluzione

Questo articolo fornisce un importante contributo metodologico all'analisi della connettività funzionale fMRI attraverso una modellazione statistica rigorosa e innovazione computazionale, con elevato valore accademico e pratico.