2025-11-24T16:10:25.080119

Using Information Geometry to Characterize Higher-Order Interactions in EEG

Albers, Marriott, Tatsuno

In neuroscience, methods from information geometry (IG) have been successfully applied in the modelling of binary vectors from spike train data, using the orthogonal decomposition of the Kullback-Leibler divergence and mutual information to isolate different orders of interaction between neurons. While spike train data is well-approximated with a binary model, here we apply these IG methods to data from electroencephalography (EEG), a continuous signal requiring appropriate discretization strategies. We developed and compared three different binarization methods and used them to identify third-order interactions in an experiment involving imagined motor movements. The statistical significance of these interactions was assessed using phase-randomized surrogate data that eliminated higher-order dependencies while preserving the spectral characteristics of the original signals. We validated our approach by implementing known second- and third-order dependencies in a forward model and quantified information attenuation at different steps of the analysis. This revealed that the greatest loss in information occurred when going from the idealized binary case to enforcing these dependencies using oscillatory signals. When applied to the real EEG dataset, our analysis detected statistically significant third-order interactions during the task condition despite the relatively sparse data (45 trials per condition). This work demonstrates that IG methods can successfully extract genuine higher-order dependencies from continuous neural recordings when paired with appropriate binarization schemes.

academic

Utilizzo della Geometria dell'Informazione per Caratterizzare le Interazioni di Ordine Superiore nell'EEG

Informazioni Fondamentali

ID Articolo: 2510.14188
Titolo: Using Information Geometry to Characterize Higher-Order Interactions in EEG
Autori: Eric Albers, Paul Marriott, Masami Tatsuno
Classificazione: q-bio.NC (Neuroni e Cognizione), q-bio.QM (Metodi Quantitativi)
Data di Pubblicazione: 16 ottobre 2025 (preprint arXiv)
Link dell'Articolo: https://arxiv.org/abs/2510.14188

Riassunto

Questo studio estende i metodi della geometria dell'informazione (Information Geometry, IG) dai dati tradizionali di sequenze di spike binarie all'analisi di segnali EEG (elettroencefalogramma) continui. Attraverso la decomposizione ortogonale della divergenza di Kullback-Leibler e dell'informazione mutua, vengono identificate le interazioni di diverso ordine tra neuroni. Lo studio sviluppa tre metodi di binarizzazione per identificare le interazioni di terzo ordine negli esperimenti di immaginazione motoria e utilizza dati surrogati randomizzati in fase per valutare la significatività statistica. Mediante la validazione con modelli forward, viene quantificata la perdita di informazione in ogni fase dell'analisi. I risultati mostrano che, nonostante i dati relativamente scarsi (45 prove per condizione), il metodo è in grado di rilevare interazioni di terzo ordine statisticamente significative nelle condizioni di compito.

Contesto di Ricerca e Motivazione

Definizione del Problema

La ricerca neuroscientifica tradizionale si concentra principalmente sulle relazioni a coppie tra aree cerebrali (interazioni di secondo ordine), ma il cervello come sistema complesso potrebbe presentare interazioni di ordine superiore che vanno oltre le relazioni a coppie. Le reti di connettività funzionale esistenti costruite su correlazioni a coppie potrebbero non catturare completamente la complessità dell'elaborazione dell'informazione cerebrale.

Importanza

Significato Teorico: Comprendere se il cervello richiede interazioni di terzo ordine o superiori per svolgere funzioni cognitive
Significato Metodologico: Estendere i metodi della geometria dell'informazione dai dati discreti di spike ai segnali EEG continui
Valore Applicativo: Fornire nuovi strumenti analitici per le interfacce cervello-computer e la diagnosi di malattie neurologiche

Limitazioni dei Metodi Esistenti

Metodi della Geometria dell'Informazione: Principalmente applicati ai dati binari di spike, con strategie di discretizzazione inefficaci per i segnali continui
Analisi EEG Tradizionale: Basata principalmente su correlazioni a coppie, trascurando le relazioni di dipendenza di ordine superiore
Inferenza Statistica: In condizioni di dati scarsi, gli strumenti asintotici standard (come la distribuzione χ²) potrebbero non essere applicabili

Motivazione della Ricerca

Estendere i metodi della geometria dell'informazione, applicati con successo all'analisi di spike, ai dati EEG, sviluppando strategie di binarizzazione appropriate per catturare le vere dipendenze di ordine superiore nelle registrazioni neurali continue.

Contributi Principali

Innovazione Metodologica: Sviluppo di tre metodi di binarizzazione (Sign, Diff, Power) per convertire i segnali EEG continui in rappresentazioni binarie adatte all'analisi della geometria dell'informazione
Framework di Validazione: Istituzione di un metodo di test di significatività statistica basato su dati surrogati randomizzati in fase
Modellazione Forward: Implementazione di modelli forward con dipendenze di secondo e terzo ordine note, quantificando la perdita di informazione durante l'analisi
Risultati Empirici: Rilevamento di interazioni di terzo ordine statisticamente significative nei dati EEG di immaginazione motoria
Intuizioni Teoriche: Rivelazione della massima perdita di informazione che si verifica durante la transizione da casi binari idealizzati all'implementazione in segnali oscillatori

Dettagli Metodologici

Definizione del Compito

Input: Segnali EEG multicanale continui Output: Componenti di informazione mutua di primo, secondo e terzo ordine tra triplette di canali Vincoli: Gestione di dati scarsi (45 prove/condizione) e sfide di discretizzazione di segnali continui

Fondamenti Teorici della Geometria dell'Informazione

Per tre variabili binarie X₁, X₂, X₃, la distribuzione di probabilità congiunta può essere rappresentata come un vettore di otto probabilità:

p = (p₀₀₀, p₀₀₁, p₀₁₀, p₀₁₁, p₁₀₀, p₁₀₁, p₁₁₀, p₁₁₁)

Sistema di coordinate dei parametri di aspettativa η:

η₁, η₂, η₃: tassi di attivazione marginale
η₁₂, η₁₃, η₂₃: tassi di attivazione a coppie
η₁₂₃: tasso di attivazione ternaria

Sistema di coordinate dei parametri naturali θ definito attraverso rapporti logaritmici, come:

θ₁₂₃ = log(p₀₀₁p₀₁₀p₁₀₀p₁₁₁)/(p₁₁₀p₁₀₁p₀₁₁p₀₀₀)

Decomposizione Ortogonale della Divergenza KL

Utilizzando un sistema di coordinate miste, la divergenza KL può essere decomposta ortogonalmente come:

D[p : q] = D[p : p̄] + D[p̄ : p̃] + D[p̃ : q]

Dove:

Dp : p̄: informazione di interazione ternaria
Dp̄ : p̃: informazione di interazione a coppie
Dp̃ : q: informazione di modulazione del tasso di attivazione

Metodi di Binarizzazione

1. Metodo Sign

binary_signal = 1 if EEG_signal > 0 else 0

Cattura informazioni di fase grossolane, ignorando l'ampiezza.

2. Metodo Diff

diff_signal = diff(EEG_signal)
binary_signal = 1 if diff_signal > 0 else 0

Cattura i modelli di transizione di fase.

3. Metodo Power

power = EEG_signal²
envelope = moving_average(power, 30_samples)
z_scores = (envelope - mean) / std
binary_signal = 1 if z_scores > 1 else 0

Cattura i periodi di alta ampiezza, indipendentemente dalla fase.

Test di Significatività Statistica

Utilizzando la statistica di test:

λ = 2N·D[p : p̄] ~ χ²(1)

Poiché i dati sono scarsi, l'approssimazione χ² è inadeguata; viene adottato un test non parametrico basato su dati surrogati IAAFT (Iterative Amplitude Adjusted Fourier Transform).

Configurazione Sperimentale

Dataset

Dataset di Immaginazione Motoria OpenNeuro (Triana-Guzman et al., 2022):

Partecipanti: 32 soggetti sani (16 donne)
Elettrodi: 17 elettrodi, posizionati secondo il sistema internazionale 10-20
Frequenza di Campionamento: 250 Hz
Disegno Sperimentale:
- 6 blocchi (3 seduti, 3 in piedi)
- 30 prove per blocco (15 immaginazione motoria, 15 stato di riposo)
- Totale di 45 prove per condizione

Struttura della Prova:

Fissazione (4 secondi): fissare la croce sullo schermo
Osservazione (3 secondi): visualizzazione del compito da eseguire
Immaginazione (4 secondi): esecuzione del compito mentale (immaginazione motoria o stato di riposo)
Riposo (4 secondi): attività libera

Preprocessing dei Dati

Filtraggio: Filtro passa-alto a 0,5 Hz, filtro notch 58-62 Hz
Rimozione di Artefatti: Utilizzo del metodo ASR (Artifact Subspace Reconstruction)
Filtraggio per Bande di Frequenza: Suddivisione in Delta (0,5-4 Hz), Theta (4-8 Hz), Alpha (8-12 Hz), Beta (12-30 Hz), Gamma (30-60 Hz)
Estrazione di Epoche: Epoche di 11 secondi da 7 secondi prima dell'inizio del compito di immaginazione a 4 secondi dopo

Metriche di Valutazione

Informazione Mutua di Primo Ordine (I₁): Informazione di modulazione del tasso di attivazione
Informazione Mutua di Secondo Ordine (I₂): Informazione di interazione a coppie
Informazione Mutua di Terzo Ordine (I₃): Informazione di interazione ternaria
Significatività Statistica: p < 0,01 (basato su dati surrogati IAAFT)

Metodi di Confronto

Dati Surrogati di Rumore Bianco: Effetto della struttura puramente casuale
Dati Surrogati IAAFT: Mantenimento dello spettro di potenza e della distribuzione di ampiezza, randomizzazione della fase
Diversi Metodi di Binarizzazione: Confronto tra i metodi Sign vs Diff vs Power

Risultati Sperimentali

Risultati Principali

Validazione dei Dati Surrogati

I dati IAAFT producono valori di informazione più elevati rispetto al rumore bianco, come previsto, poiché IAAFT mantiene le differenze dello spettro di potenza tra le fasi di prova
Il metodo Power mostra una tendenza decrescente I₁ > I₂ > I₃ in tutte le bande di frequenza
I metodi Sign e Diff mostrano una distorsione verso I₂, particolarmente evidente nelle bande ad alta frequenza, limitando la loro capacità di catturare interazioni di terzo ordine

Risultati sui Dati di Immaginazione Motoria

Fallimento dell'approssimazione χ²: A causa della scarsità dei dati (45 prove), la distribuzione asintotica standard non è applicabile
Interazioni di Terzo Ordine Significative: Rilevamento di I₃ statisticamente significativo durante le fasi di osservazione e immaginazione
Controllo dei Falsi Positivi: Circa l'1% di triplette significative nella fase di fissazione, convalidando l'appropriatezza dell'ipotesi nulla
Dinamica Temporale: Dinamica temporale diversa dell'informazione di terzo ordine per diverse bande di frequenza e triplette

Risultati della Validazione del Modello Forward

Quantificazione della Perdita di Informazione

Massima Perdita di Informazione: Si verifica durante la transizione da segnali binari idealizzati a segnali oscillatori (circa il 50% di perdita di I₃)
Effetto del Volume Conduction Minore: La perdita di informazione dalla sorgente all'elettrodo dello scalpo è relativamente piccola
Sensibilità al Rumore: Sia I₂ che I₃ diminuiscono significativamente al di sotto di SNR moderato

Implementazione di Relazioni di Dipendenza

Implementazione riuscita di relazioni di secondo e terzo ordine note in segnali di sorgente oscillatori:

Caso di Secondo Ordine: Correlazione del segnale target, indipendente dallo stato del segnale di controllo
Caso di Terzo Ordine: Correlazione del segnale target quando il segnale di controllo è alto (1), anticorrelazione quando è basso (0)

Risultati Specifici per Banda di Frequenza

Delta e Theta: La distorsione verso I₂ nei metodi Sign e Diff è meno pronunciata
Alpha e Bande Superiori: I metodi Sign e Diff mostrano una significativa distorsione verso I₂, limitando il rilevamento di I₃
Tutte le Bande: Il metodo Power mantiene una ragionevole gerarchia I₁ > I₂ > I₃

Lavori Correlati

Applicazioni della Geometria dell'Informazione nelle Neuroscienze

Amari & Nagaoka (2000): Teoria fondamentale della geometria dell'informazione
Nakahara & Amari (2002): Misurazioni della geometria dell'informazione di spike neurali
Tatsuno et al. (2009): Stima robusta della forza di connessione e degli input esterni

Metodi di Analisi EEG

Metodi Tradizionali: Principalmente basati su analisi dello spettro di potenza e correlazioni a coppie
Connettività Funzionale: Relazioni tra regioni basate su dipendenza statistica come definito da Friston (1995)
Analisi di Rete: Analisi di reti cerebrali complesse secondo Bullmore & Sporns (2009)

Ricerca su Interazioni di Ordine Superiore

Battiston et al. (2020, 2021): Strutture di rete e dinamiche oltre le interazioni a coppie
Contributo di questo Articolo: Prima applicazione sistematica dei metodi della geometria dell'informazione all'analisi delle interazioni di ordine superiore nei dati EEG

Conclusioni e Discussione

Conclusioni Principali

Fattibilità del Metodo: I metodi della geometria dell'informazione possono essere estesi con successo all'analisi di segnali EEG continui
Importanza della Strategia di Binarizzazione: Il metodo Power è più adatto per il rilevamento di interazioni di ordine superiore
Vere Interazioni di Ordine Superiore: Rilevamento di interazioni di terzo ordine statisticamente significative nei compiti di immaginazione motoria
Meccanismo di Perdita di Informazione: La perdita di informazione principale si verifica durante la conversione da segnali binari a segnali oscillatori

Limitazioni

Complessità Computazionale: 17 canali sono già al limite della fattibilità; array ad alta densità (128-256 canali) potrebbero presentare difficoltà computazionali
Risoluzione Temporale: Finestre non sovrapposte di 1 secondo forniscono una dinamica temporale relativamente grossolana
Analisi Intra-banda: Considera solo le interazioni all'interno della stessa banda di frequenza, non coinvolge l'analisi cross-frequenza
Limitazioni della Binarizzazione: Potrebbe perdere modelli di interazione non lineare più complessi

Direzioni Future

Binarizzazione Ibrida: Combinazione di diversi metodi di binarizzazione per rilevare fenomeni come l'accoppiamento fase-ampiezza
Finestre Adattive: Utilizzo di finestre sovrapposte adattive alla frequenza per migliorare la risoluzione temporale
Analisi Cross-frequenza: Estensione alle interazioni di ordine superiore tra diverse bande di frequenza
Interazioni di Ordine Superiore: Esplorazione di modelli di interazione di quarto ordine e superiore

Valutazione Approfondita

Punti di Forza

Innovazione Metodologica: Estensione riuscita dei metodi della geometria dell'informazione dal dominio discreto a quello continuo
Validazione Rigorosa: Framework di validazione completo attraverso modelli forward e dati surrogati
Valore Pratico: Fornisce strumenti operativi per l'analisi di interazioni di ordine superiore nei dati EEG
Contributo Teorico: Quantificazione della perdita di informazione in ogni fase dell'analisi

Insufficienze

Limitazione della Dimensione Campionaria: 45 prove sono relativamente poche, potendo influenzare la potenza statistica
Semplificazione della Binarizzazione: La conversione di segnali complessi continui in binari potrebbe perdere informazioni importanti
Scalabilità Computazionale: Le sfide computazionali per array EEG ad alta densità non sono completamente risolte
Interpretazione Biologica: La discussione sul significato neurobiologico delle interazioni di terzo ordine rilevate è insufficiente

Impatto

Impatto Metodologico: Fornisce nuovi strumenti matematici per l'analisi di ordine superiore dei segnali neurali
Prospettive Applicative: Applicabile a interfacce cervello-computer, diagnosi di malattie neurologiche e altri campi
Valore Teorico: Promuove la comprensione dell'organizzazione di reti cerebrali complesse
Riproducibilità: Fornisce codice open-source e dataset pubblici, supportando la riproduzione dei risultati

Scenari di Applicazione

Ricerca Neuroscientifico di Base: Esplorazione dei principi di organizzazione di ordine superiore delle reti cerebrali
Applicazioni Cliniche: Analisi di modelli di connettività di ordine superiore in malattie neurologiche
Interfacce Cervello-Computer: Estrazione di caratteristiche neurali più ricche per il controllo
Neuroscienze Cognitive: Studio di interazioni neurali complesse nei compiti cognitivi

Bibliografia

Questo articolo cita 28 importanti riferimenti, principalmente includenti:

Fondamenti della Geometria dell'Informazione: Amari & Nagaoka (2000), Amari (2001)
Applicazioni nelle Neuroscienze: Nakahara & Amari (2002), Tatsuno et al. (2009)
Metodologia EEG: Delorme & Makeig (2004), Oostenveld et al. (2011)
Reti di Ordine Superiore: Battiston et al. (2020, 2021)
Fonte dei Dati: Triana-Guzman et al. (2022)

Valutazione Complessiva: Questo è un articolo metodologico di alta qualità che estende con successo la teoria della geometria dell'informazione al campo dell'analisi dei segnali EEG. Sebbene presenti alcune limitazioni in termini di scalabilità computazionale e interpretazione biologica, il suo framework di validazione rigoroso e le strategie innovative di binarizzazione forniscono importanti contributi teorici e pratici all'analisi delle interazioni di ordine superiore nei segnali neurali.