2025-11-24T16:10:25.080119

Using Information Geometry to Characterize Higher-Order Interactions in EEG

Albers, Marriott, Tatsuno
In neuroscience, methods from information geometry (IG) have been successfully applied in the modelling of binary vectors from spike train data, using the orthogonal decomposition of the Kullback-Leibler divergence and mutual information to isolate different orders of interaction between neurons. While spike train data is well-approximated with a binary model, here we apply these IG methods to data from electroencephalography (EEG), a continuous signal requiring appropriate discretization strategies. We developed and compared three different binarization methods and used them to identify third-order interactions in an experiment involving imagined motor movements. The statistical significance of these interactions was assessed using phase-randomized surrogate data that eliminated higher-order dependencies while preserving the spectral characteristics of the original signals. We validated our approach by implementing known second- and third-order dependencies in a forward model and quantified information attenuation at different steps of the analysis. This revealed that the greatest loss in information occurred when going from the idealized binary case to enforcing these dependencies using oscillatory signals. When applied to the real EEG dataset, our analysis detected statistically significant third-order interactions during the task condition despite the relatively sparse data (45 trials per condition). This work demonstrates that IG methods can successfully extract genuine higher-order dependencies from continuous neural recordings when paired with appropriate binarization schemes.
academic

Verwendung von Informationsgeometrie zur Charakterisierung höherwertiger Wechselwirkungen in EEG

Grundlegende Informationen

  • Papier-ID: 2510.14188
  • Titel: Using Information Geometry to Characterize Higher-Order Interactions in EEG
  • Autoren: Eric Albers, Paul Marriott, Masami Tatsuno
  • Klassifizierung: q-bio.NC (Neuronen und Kognition), q-bio.QM (Quantitative Methoden)
  • Veröffentlichungsdatum: 16. Oktober 2025 (arXiv-Preprint)
  • Papierlink: https://arxiv.org/abs/2510.14188

Zusammenfassung

Diese Studie erweitert die Methoden der Informationsgeometrie (IG) von traditionellen binären Rückenmarksdaten auf die Analyse kontinuierlicher Elektroenzephalogramm-(EEG-)Signale. Durch orthogonale Zerlegung der Kullback-Leibler-Divergenz und gegenseitiger Information werden unterschiedliche Ordnungen von Wechselwirkungen zwischen Neuronen identifiziert. Die Forschung entwickelt drei Binarisierungsmethoden zur Identifizierung von Wechselwirkungen dritter Ordnung in Motorvorstellungsexperimenten und nutzt phasenrandomisierte Surrogat-Daten zur Bewertung statistischer Signifikanz. Durch Vorwärtsmodellierung wird die Wirksamkeit der Methode validiert und der Informationsverlust in verschiedenen Analyseschritten quantifiziert. Die Ergebnisse zeigen, dass die Methode trotz relativ spärlicher Daten (45 Versuche pro Bedingung) statistisch signifikante Wechselwirkungen dritter Ordnung unter Aufgabenbedingungen erkennen kann.

Forschungshintergrund und Motivation

Problemdefinition

Die traditionelle neurowissenschaftliche Forschung konzentriert sich hauptsächlich auf paarweise Beziehungen zwischen Hirnregionen (Wechselwirkungen zweiter Ordnung), aber das Gehirn als komplexes System kann höherwertige Wechselwirkungen aufweisen, die über paarweise Beziehungen hinausgehen. Bestehende funktionelle Konnektivitätsnetzwerke basieren auf paarweisen Korrelationen und erfassen möglicherweise nicht vollständig die Komplexität der Informationsverarbeitung im Gehirn.

Bedeutung

  1. Theoretische Bedeutung: Verständnis dafür, ob das Gehirn Wechselwirkungen dritter oder höherer Ordnung zur Erfüllung kognitiver Funktionen benötigt
  2. Methodologische Bedeutung: Erweiterung der Informationsgeometrie-Methoden von diskreten Rückenmarksdaten auf kontinuierliche EEG-Signale
  3. Anwendungswert: Bereitstellung neuer Analysewerkzeuge für Gehirn-Computer-Schnittstellen und Diagnose neurologischer Erkrankungen

Einschränkungen bestehender Methoden

  1. Informationsgeometrie-Methoden: Hauptsächlich auf binäre Rückenmarksdaten angewendet, mangelnde effektive Diskretisierungsstrategien für kontinuierliche Signale
  2. Traditionelle EEG-Analyse: Hauptsächlich auf paarweisen Korrelationen basierend, ignoriert höherwertige Abhängigkeitsbeziehungen
  3. Statistische Inferenz: Bei spärlichen Daten können Standard-Asymptotik-Werkzeuge (wie χ²-Verteilung) unangemessen sein

Forschungsmotivation

Erweiterung der erfolgreich auf Rückenmarksdaten angewendeten Informationsgeometrie-Methoden auf EEG-Daten und Entwicklung angemessener Binarisierungsstrategien zur Erfassung echter höherwertiger Abhängigkeitsbeziehungen in kontinuierlichen Neuroaufzeichnungen.

Kernbeiträge

  1. Methodologische Innovation: Entwicklung von drei Binarisierungsmethoden (Sign, Diff, Power) zur Umwandlung kontinuierlicher EEG-Signale in binäre Darstellungen, die für die Informationsgeometrie-Analyse geeignet sind
  2. Validierungsrahmen: Etablierung einer Methode zur Überprüfung statistischer Signifikanz basierend auf phasenrandomisierten Surrogat-Daten
  3. Vorwärtsmodellierung: Implementierung von Vorwärtsmodellen mit bekannten Abhängigkeitsbeziehungen zweiter und dritter Ordnung, Quantifizierung des Informationsverlusts während der Analyse
  4. Empirische Befunde: Erkennung statistisch signifikanter Wechselwirkungen dritter Ordnung in Motorvorstellungs-EEG-Daten
  5. Theoretische Einsichten: Offenlegung, dass der maximale Informationsverlust bei der Umsetzung von Abhängigkeitsbeziehungen von idealisierten binären Fällen zu Oszillationssignalen auftritt

Methodische Details

Aufgabendefinition

Eingabe: Mehrkanaliges kontinuierliches EEG-Signal Ausgabe: Komponenten gegenseitiger Information erster, zweiter und dritter Ordnung zwischen Kanal-Tripeln Einschränkungen: Umgang mit spärlichen Daten (45 Versuche/Bedingung) und Diskretisierungsherausforderungen kontinuierlicher Signale

Theoretische Grundlagen der Informationsgeometrie

Für drei binäre Variablen X₁, X₂, X₃ kann die gemeinsame Wahrscheinlichkeitsverteilung als Vektor von acht Wahrscheinlichkeiten dargestellt werden:

p = (p₀₀₀, p₀₀₁, p₀₁₀, p₀₁₁, p₁₀₀, p₁₀₁, p₁₁₀, p₁₁₁)

Erwartungsparameter-Koordinatensystem η:

  • η₁, η₂, η₃: Grenzaktivierungsraten
  • η₁₂, η₁₃, η₂₃: Paarweise Aktivierungsraten
  • η₁₂₃: Ternäre Aktivierungsrate

Natürliches Parametersystem θ, definiert durch Logarithmusverhältnisse, wie:

θ₁₂₃ = log(p₀₀₁p₀₁₀p₁₀₀p₁₁₁)/(p₁₁₀p₁₀₁p₀₁₁p₀₀₀)

Orthogonale Zerlegung der KL-Divergenz

Mit einem gemischten Koordinatensystem kann die KL-Divergenz orthogonal zerlegt werden als:

D[p : q] = D[p : p̄] + D[p̄ : p̃] + D[p̃ : q]

Wobei:

  • Dp : p̄: Gegenseitige Information dritter Ordnung
  • Dp̄ : p̃: Gegenseitige Information zweiter Ordnung
  • Dp̃ : q: Aktivierungsraten-Modulationsinformation

Binarisierungsmethoden

1. Sign-Methode

binary_signal = 1 if EEG_signal > 0 else 0

Erfasst grobe Phaseninformation, ignoriert Amplitude.

2. Diff-Methode

diff_signal = diff(EEG_signal)
binary_signal = 1 if diff_signal > 0 else 0

Erfasst Phasenübergangsmuster.

3. Power-Methode

power = EEG_signal²
envelope = moving_average(power, 30_samples)
z_scores = (envelope - mean) / std
binary_signal = 1 if z_scores > 1 else 0

Erfasst Hochamplitudenphasen, phasenunabhängig.

Überprüfung der statistischen Signifikanz

Verwendung der Teststatistik:

λ = 2N·D[p : p̄] ~ χ²(1)

Aufgrund spärlicher Daten ist die χ²-Approximation schlecht; es wird ein nichtparametrischer Test basierend auf IAAFT-(Iterative Amplitude Adjusted Fourier Transform-)Surrogat-Daten verwendet.

Experimentelle Einrichtung

Datensatz

OpenNeuro Motorvorstellungs-Datensatz (Triana-Guzman et al., 2022):

  • Teilnehmer: 32 gesunde Probanden (16 weiblich)
  • Elektroden: 17 Elektroden nach internationalem 10-20-System platziert
  • Abtastrate: 250 Hz
  • Versuchsdesign:
    • 6 Blöcke (3 sitzend, 3 stehend)
    • 30 Versuche pro Block (15 Motorvorstellungen, 15 Ruhezustände)
    • Insgesamt 45 Versuche pro Bedingung

Versuchsstruktur:

  1. Fixation (4 Sekunden): Blick auf Bildschirmkreuz
  2. Beobachtung (3 Sekunden): Anzeige der auszuführenden Aufgabe
  3. Vorstellung (4 Sekunden): Ausführung der mentalen Aufgabe (Motorvorstellung oder Ruhezustand)
  4. Ruhe (4 Sekunden): Freie Aktivität

Datenvorverarbeitung

  1. Filterung: 0,5 Hz Hochpassfilter, 58-62 Hz Sperrfilter
  2. Artefaktentfernung: Verwendung der ASR-(Artifact Subspace Reconstruction-)Methode
  3. Frequenzbandfilterung: Unterteilt in Delta (0,5-4 Hz), Theta (4-8 Hz), Alpha (8-12 Hz), Beta (12-30 Hz), Gamma (30-60 Hz)
  4. Epochenextraktion: 11-Sekunden-Epochen von 7 Sekunden vor bis 4 Sekunden nach Beginn der Vorstellungsaufgabe

Bewertungsmetriken

  • Gegenseitige Information erster Ordnung (I₁): Aktivierungsraten-Modulationsinformation
  • Gegenseitige Information zweiter Ordnung (I₂): Paarweise Wechselwirkungsinformation
  • Gegenseitige Information dritter Ordnung (I₃): Ternäre Wechselwirkungsinformation
  • Statistische Signifikanz: p < 0,01 (basierend auf IAAFT-Surrogat-Daten)

Vergleichsmethoden

  1. Weißrausch-Surrogat-Daten: Auswirkungen rein zufälliger Struktur
  2. IAAFT-Surrogat-Daten: Beibehaltung von Leistungsspektrum und Amplitudenverteilung, Phasenrandomisierung
  3. Verschiedene Binarisierungsmethoden: Vergleich von Sign vs. Diff vs. Power-Methoden

Experimentelle Ergebnisse

Hauptergebnisse

Validierung von Surrogat-Daten

  1. IAAFT-Daten erzeugen höhere Informationswerte als Weißrauschen, was erwartet wird, da IAAFT Leistungsspektrumunterschiede zwischen Versuchsphasen beibehält
  2. Power-Methode zeigt I₁ > I₂ > I₃ abnehmenden Trend in allen Frequenzbändern
  3. Sign- und Diff-Methoden zeigen I₂-Verzerrung, besonders in hochfrequenten Bändern, was ihre Fähigkeit zur Erfassung von Wechselwirkungen dritter Ordnung einschränkt

Motorvorstellungs-EEG-Datenergebnisse

  1. χ²-Approximation schlägt fehl: Aufgrund spärlicher Daten (45 Versuche) ist die Standard-Asymptotik-Verteilung unangemessen
  2. Signifikante Wechselwirkungen dritter Ordnung: Statistisch signifikante I₃ in Beobachtungs- und Vorstellungsphasen erkannt
  3. Kontrolle falsch positiver Ergebnisse: Etwa 1% signifikante Tripel in der Fixationsphase, validiert Angemessenheit der Nullhypothese
  4. Zeitliche Dynamik: Unterschiedliche zeitliche Dynamik der Wechselwirkungsinformation dritter Ordnung über verschiedene Frequenzbänder und Tripel

Validierungsergebnisse des Vorwärtsmodells

Quantifizierung des Informationsverlusts

  1. Maximaler Informationsverlust: Tritt beim Übergang von idealisierten binären Signalen zu Oszillationssignalen auf (etwa 50% I₃-Verlust)
  2. Geringere Auswirkung der Volumenleitung: Informationsverlust von Quellsignalen zu Kopfhautelektroden ist relativ gering
  3. Rauschempfindlichkeit: Bei mittlerem SNR und darunter sinken I₂ und I₃ erheblich

Umsetzung von Abhängigkeitsbeziehungen

Erfolgreiche Umsetzung bekannter Abhängigkeitsbeziehungen zweiter und dritter Ordnung in Oszillationsquellsignalen:

  • Fall zweiter Ordnung: Zielsignale korreliert, unabhängig vom Kontrollsignalzustand
  • Fall dritter Ordnung: Zielsignale korreliert, wenn Kontrollsignal hoch (1) ist, antikorreliert, wenn niedrig (0)

Frequenzbandspezifische Befunde

  • Delta und Theta: I₂-Verzerrung bei Sign- und Diff-Methoden weniger ausgeprägt
  • Alpha und höhere Frequenzbänder: Sign- und Diff-Methoden zeigen signifikante I₂-Verzerrung, eingeschränkte I₃-Erkennung
  • Alle Frequenzbänder: Power-Methode behält angemessene Hierarchie I₁ > I₂ > I₃ bei

Verwandte Arbeiten

Anwendungen der Informationsgeometrie in der Neurowissenschaft

  • Amari & Nagaoka (2000): Grundlegende Theorie der Informationsgeometrie
  • Nakahara & Amari (2002): Informationsgeometrische Messungen von Nervenzellen
  • Tatsuno et al. (2009): Robuste Schätzung von Verbindungsstärke und externem Input

EEG-Analysemethoden

  • Traditionelle Methoden: Hauptsächlich auf Leistungsspektrumanalyse und paarweisen Korrelationen basierend
  • Funktionelle Konnektivität: Von Friston (1995) definierte regionale Beziehungen basierend auf statistischer Abhängigkeit
  • Netzwerkanalyse: Analyse komplexer Hirnnetze von Bullmore & Sporns (2009)

Forschung zu höherwertigen Wechselwirkungen

  • Battiston et al. (2020, 2021): Netzwerkstrukturen und Dynamik jenseits paarweiser Wechselwirkungen
  • Beitrag dieses Papiers: Erste systematische Anwendung der Informationsgeometrie-Methode auf die Analyse höherwertiger Wechselwirkungen in EEG-Daten

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Methodische Machbarkeit: Informationsgeometrie-Methoden können erfolgreich auf die Analyse kontinuierlicher EEG-Signale erweitert werden
  2. Bedeutung der Binarisierungsstrategie: Power-Methode ist am besten für die Erkennung höherwertiger Wechselwirkungen geeignet
  3. Echte höherwertige Wechselwirkungen: Statistisch signifikante Wechselwirkungen dritter Ordnung in Motorvorstellungsaufgaben erkannt
  4. Informationsverlustmechanismus: Hauptinformationsverlust tritt beim Übergang von binären zu Oszillationssignalen auf

Einschränkungen

  1. Rechenkomplexität: 17 Kanäle nähern sich bereits der Machbarkeitgrenze; hochdichte Arrays (128-256 Kanäle) könnten rechnerisch schwierig sein
  2. Zeitliche Auflösung: 1-Sekunden-Fenster ohne Überlappung bietet grobe zeitliche Dynamik
  3. Intra-Band-Analyse: Berücksichtigt nur Wechselwirkungen innerhalb desselben Frequenzbands, nicht über Frequenzbänder hinweg
  4. Binarisierungsbeschränkungen: Könnte komplexere nichtlineare Wechselwirkungsmuster übersehen

Zukünftige Richtungen

  1. Hybride Binarisierung: Kombination verschiedener Binarisierungsmethoden zur Erkennung von Phasen-Amplituden-Kopplung und ähnlichen Phänomenen
  2. Adaptive Fenster: Verwendung frequenzadaptiver überlappender Fenster zur Verbesserung der zeitlichen Auflösung
  3. Frequenzübergreifende Analyse: Erweiterung auf höherwertige Wechselwirkungen zwischen verschiedenen Frequenzbändern
  4. Höherwertige Wechselwirkungen: Erkundung von Wechselwirkungsmustern vierter Ordnung und höher

Tiefgreifende Bewertung

Stärken

  1. Methodologische Innovation: Erfolgreiche Erweiterung der Informationsgeometrie-Methode von diskreten auf kontinuierliche Signale
  2. Strenge Validierung: Vollständiger Validierungsrahmen durch Vorwärtsmodellierung und Surrogat-Daten
  3. Praktischer Wert: Bereitstellung praktischer Werkzeuge für die Analyse höherwertiger Wechselwirkungen in EEG-Daten
  4. Theoretischer Beitrag: Quantifizierung des Informationsverlusts in verschiedenen Analyseschritten

Mängel

  1. Stichprobengrößenbeschränkung: 45 Versuche sind relativ gering und könnten die statistische Aussagekraft beeinflussen
  2. Binarisierungsvereinfachung: Vereinfachung komplexer kontinuierlicher Signale zu binären Werten könnte wichtige Informationen verlieren
  3. Rechenskalierbarkeit: Rechnerische Herausforderungen für hochdichte EEG-Arrays nicht vollständig gelöst
  4. Biologische Interpretation: Unzureichende Diskussion der neurobiologischen Bedeutung erkannter Wechselwirkungen dritter Ordnung

Auswirkungen

  1. Methodologische Auswirkungen: Bereitstellung neuer mathematischer Werkzeuge für die höherwertige Analyse von Neuralsignalen
  2. Anwendungsperspektiven: Anwendbar auf Gehirn-Computer-Schnittstellen, Diagnose neurologischer Erkrankungen und andere Bereiche
  3. Theoretischer Wert: Förderung des Verständnisses der komplexen Netzwerkorganisation des Gehirns
  4. Reproduzierbarkeit: Bereitstellung von Open-Source-Code und öffentlichen Datensätzen zur Unterstützung der Ergebnisreplikation

Anwendungsszenarien

  1. Grundlegende neurowissenschaftliche Forschung: Erkundung der Organisationsprinzipien höherwertiger Hirnnetze
  2. Klinische Anwendungen: Analyse höherwertiger Konnektivitätsmuster neurologischer Erkrankungen
  3. Gehirn-Computer-Schnittstellen: Extraktion reichhaltigerer Neuralsignalmerkmale für die Steuerung
  4. Kognitive Neurowissenschaft: Untersuchung komplexer neuronaler Wechselwirkungen bei kognitiven Aufgaben

Literaturverzeichnis

Dieses Papier zitiert 28 wichtige Referenzen, hauptsächlich einschließlich:

  1. Grundlagen der Informationsgeometrie: Amari & Nagaoka (2000), Amari (2001)
  2. Neurowissenschaftliche Anwendungen: Nakahara & Amari (2002), Tatsuno et al. (2009)
  3. EEG-Methodologie: Delorme & Makeig (2004), Oostenveld et al. (2011)
  4. Höherwertige Netzwerke: Battiston et al. (2020, 2021)
  5. Datenquellen: Triana-Guzman et al. (2022)

Gesamtbewertung: Dies ist ein hochqualitatives methodologisches Papier, das die Informationsgeometrie-Theorie erfolgreich auf die EEG-Signalanalyse erweitert. Obwohl es einige Einschränkungen in Bezug auf Rechenskalierbarkeit und biologische Interpretation gibt, bietet sein strenger Validierungsrahmen und innovative Binarisierungsstrategien wichtige theoretische und praktische Beiträge zur Analyse höherwertiger Wechselwirkungen in Neuralsignalen.