2025-11-24T16:10:25.080119

Using Information Geometry to Characterize Higher-Order Interactions in EEG

Albers, Marriott, Tatsuno
In neuroscience, methods from information geometry (IG) have been successfully applied in the modelling of binary vectors from spike train data, using the orthogonal decomposition of the Kullback-Leibler divergence and mutual information to isolate different orders of interaction between neurons. While spike train data is well-approximated with a binary model, here we apply these IG methods to data from electroencephalography (EEG), a continuous signal requiring appropriate discretization strategies. We developed and compared three different binarization methods and used them to identify third-order interactions in an experiment involving imagined motor movements. The statistical significance of these interactions was assessed using phase-randomized surrogate data that eliminated higher-order dependencies while preserving the spectral characteristics of the original signals. We validated our approach by implementing known second- and third-order dependencies in a forward model and quantified information attenuation at different steps of the analysis. This revealed that the greatest loss in information occurred when going from the idealized binary case to enforcing these dependencies using oscillatory signals. When applied to the real EEG dataset, our analysis detected statistically significant third-order interactions during the task condition despite the relatively sparse data (45 trials per condition). This work demonstrates that IG methods can successfully extract genuine higher-order dependencies from continuous neural recordings when paired with appropriate binarization schemes.
academic

Utilisation de la Géométrie de l'Information pour Caractériser les Interactions d'Ordre Supérieur en EEG

Informations Fondamentales

  • ID de l'article: 2510.14188
  • Titre: Using Information Geometry to Characterize Higher-Order Interactions in EEG
  • Auteurs: Eric Albers, Paul Marriott, Masami Tatsuno
  • Classification: q-bio.NC (Neurones et Cognition), q-bio.QM (Méthodes Quantitatives)
  • Date de publication: 16 octobre 2025 (prépublication arXiv)
  • Lien de l'article: https://arxiv.org/abs/2510.14188

Résumé

Cette étude étend les méthodes de géométrie de l'information (GI) des données traditionnelles de séquences de potentiels d'action binaires à l'analyse de signaux d'électroencéphalographie (EEG) continus. Par la décomposition orthogonale de la divergence de Kullback-Leibler et de l'information mutuelle, nous identifions les interactions d'ordre différent entre neurones. L'étude développe trois méthodes de binarisation pour identifier les interactions d'ordre trois dans les expériences d'imagerie motrice, et utilise la randomisation de phase sur des données de substitution pour évaluer la signification statistique. La validité de la méthode est vérifiée par modélisation directe, quantifiant l'atténuation d'information à chaque étape de l'analyse. Les résultats montrent que, malgré la rareté relative des données (45 essais par condition), la méthode peut détecter des interactions d'ordre trois statistiquement significatives dans les conditions de tâche.

Contexte et Motivation de la Recherche

Définition du Problème

La recherche neuroscientifique traditionnelle se concentre principalement sur les relations par paires entre régions cérébrales (interactions d'ordre deux), mais le cerveau en tant que système complexe peut présenter des interactions d'ordre supérieur au-delà des relations par paires. Les réseaux de connectivité fonctionnelle existants, construits sur la base de corrélations par paires, peuvent ne pas capturer pleinement la complexité du traitement de l'information cérébrale.

Importance

  1. Signification théorique: Comprendre si le cerveau nécessite des interactions d'ordre trois ou supérieur pour accomplir des fonctions cognitives
  2. Signification méthodologique: Étendre les méthodes de géométrie de l'information des données de potentiels d'action discrets aux signaux EEG continus
  3. Valeur applicative: Fournir de nouveaux outils d'analyse pour les interfaces cerveau-machine et le diagnostic des maladies neurologiques

Limitations des Méthodes Existantes

  1. Méthodes de géométrie de l'information: Principalement appliquées aux données binaires de potentiels d'action, manquent de stratégies de discrétisation efficaces pour les signaux continus
  2. Analyse EEG traditionnelle: Basée principalement sur les corrélations par paires, négligeant les relations de dépendance d'ordre supérieur
  3. Inférence statistique: Dans les conditions de données rares, les outils asymptotiques standard (comme la distribution χ²) peuvent ne pas être applicables

Motivation de la Recherche

Étendre les méthodes de géométrie de l'information, appliquées avec succès à l'analyse des potentiels d'action, aux données EEG, en développant des stratégies de binarisation appropriées pour capturer les véritables dépendances d'ordre supérieur dans les enregistrements neuronaux continus.

Contributions Principales

  1. Innovation méthodologique: Développement de trois méthodes de binarisation (Sign, Diff, Power) pour convertir les signaux EEG continus en représentations binaires adaptées à l'analyse de géométrie de l'information
  2. Cadre de validation: Établissement d'une méthode de test de signification statistique basée sur les données de substitution avec randomisation de phase
  3. Modélisation directe: Implémentation de modèles directs avec dépendances d'ordre deux et trois connues, quantifiant l'atténuation d'information au cours du processus d'analyse
  4. Découvertes empiriques: Détection d'interactions d'ordre trois statistiquement significatives dans les données EEG d'imagerie motrice
  5. Perspectives théoriques: Révélation de la perte d'information maximale survenant lors de la transition du cas binaire idéalisé aux signaux oscillatoires

Détail des Méthodes

Définition de la Tâche

Entrée: Signaux EEG multi-canaux continus Sortie: Composantes d'information mutuelle d'ordre un, deux et trois entre triplets de canaux Contraintes: Traitement des données rares (45 essais/condition) et défis de discrétisation des signaux continus

Fondements Théoriques de la Géométrie de l'Information

Pour trois variables binaires X₁, X₂, X₃, la distribution de probabilité conjointe peut être représentée comme un vecteur de huit probabilités:

p = (p₀₀₀, p₀₀₁, p₀₁₀, p₀₁₁, p₁₀₀, p₁₀₁, p₁₁₀, p₁₁₁)

Système de coordonnées des paramètres d'espérance η:

  • η₁, η₂, η₃: Taux d'activation marginaux
  • η₁₂, η₁₃, η₂₃: Taux d'activation par paires
  • η₁₂₃: Taux d'activation ternaire

Système de coordonnées des paramètres naturels θ défini par les rapports logarithmiques, par exemple:

θ₁₂₃ = log(p₀₀₁p₀₁₀p₁₀₀p₁₁₁)/(p₁₁₀p₁₀₁p₀₁₁p₀₀₀)

Décomposition Orthogonale de la Divergence KL

Utilisant un système de coordonnées mixtes, la divergence KL peut être décomposée orthogonalement en:

D[p : q] = D[p : p̄] + D[p̄ : p̃] + D[p̃ : q]

Où:

  • Dp : p̄: Information d'interaction ternaire
  • Dp̄ : p̃: Information d'interaction par paires
  • Dp̃ : q: Information de modulation du taux d'activation

Méthodes de Binarisation

1. Méthode Sign

signal_binaire = 1 si signal_EEG > 0 sinon 0

Capture les informations de phase grossières, en ignorant l'amplitude.

2. Méthode Diff

signal_diff = diff(signal_EEG)
signal_binaire = 1 si signal_diff > 0 sinon 0

Capture les modèles de transition de phase.

3. Méthode Power

puissance = signal_EEG²
enveloppe = moyenne_mobile(puissance, 30_échantillons)
scores_z = (enveloppe - moyenne) / écart_type
signal_binaire = 1 si scores_z > 1 sinon 0

Capture les périodes de haute amplitude, indépendamment de la phase.

Test de Signification Statistique

Utilisant la statistique de test:

λ = 2N·D[p : p̄] ~ χ²(1)

En raison de la rareté des données, l'approximation χ² est inadéquate; un test non-paramétrique basé sur les données de substitution IAAFT (Transformée de Fourier avec Ajustement Itératif d'Amplitude) est adopté.

Configuration Expérimentale

Ensemble de Données

Ensemble de données d'imagerie motrice OpenNeuro (Triana-Guzman et al., 2022):

  • Participants: 32 sujets sains (16 femmes)
  • Électrodes: 17 électrodes, placées selon le système international 10-20
  • Fréquence d'échantillonnage: 250 Hz
  • Plan expérimental:
    • 6 blocs (3 assis, 3 debout)
    • 30 essais par bloc (15 imagerie motrice, 15 état de repos)
    • Total de 45 essais par condition

Structure de l'essai:

  1. Fixation (4 secondes): Fixation de la croix à l'écran
  2. Observation (3 secondes): Affichage de la tâche à exécuter
  3. Imagerie (4 secondes): Exécution de la tâche mentale (imagerie motrice ou état de repos)
  4. Repos (4 secondes): Activité libre

Prétraitement des Données

  1. Filtrage: Filtre passe-haut 0,5 Hz, filtre coupe-bande 58-62 Hz
  2. Suppression des artefacts: Utilisation de la méthode ASR (Artifact Subspace Reconstruction)
  3. Filtrage par bande de fréquence: Division en Delta (0,5-4 Hz), Theta (4-8 Hz), Alpha (8-12 Hz), Beta (12-30 Hz), Gamma (30-60 Hz)
  4. Extraction d'époque: Période de 11 secondes, de 7 secondes avant le début de la tâche d'imagerie à 4 secondes après

Indicateurs d'Évaluation

  • Information mutuelle d'ordre un (I₁): Information de modulation du taux d'activation
  • Information mutuelle d'ordre deux (I₂): Information d'interaction par paires
  • Information mutuelle d'ordre trois (I₃): Information d'interaction ternaire
  • Signification statistique: p < 0,01 (basée sur les données de substitution IAAFT)

Méthodes de Comparaison

  1. Données de substitution bruit blanc: Effets de la structure purement aléatoire
  2. Données de substitution IAAFT: Maintien du spectre de puissance et de la distribution d'amplitude, randomisation de phase
  3. Différentes méthodes de binarisation: Comparaison Sign vs Diff vs Power

Résultats Expérimentaux

Résultats Principaux

Validation des Données de Substitution

  1. Les données IAAFT produisent des valeurs d'information plus élevées que le bruit blanc, ce qui est attendu car IAAFT maintient les différences de spectre de puissance entre les phases d'essai
  2. La méthode Power affiche une tendance décroissante I₁ > I₂ > I₃ dans toutes les bandes de fréquence
  3. Les méthodes Sign et Diff affichent un biais vers I₂, particulièrement prononcé dans les bandes haute fréquence, limitant leur capacité à capturer les interactions d'ordre trois

Résultats des Données d'Imagerie Motrice

  1. Échec de l'approximation χ²: En raison de la rareté des données (45 essais), la distribution asymptotique standard ne s'applique pas
  2. Interactions d'ordre trois significatives: Détection de I₃ statistiquement significatif pendant les phases d'observation et d'imagerie
  3. Contrôle des faux positifs: Environ 1% de triplets significatifs pendant la phase de fixation, validant l'adéquation de l'hypothèse nulle
  4. Dynamique temporelle: Dynamique temporelle différente de l'information d'ordre trois pour différentes bandes de fréquence et triplets

Résultats de la Modélisation Directe

Quantification de l'Atténuation d'Information

  1. Perte d'information maximale: Survient lors de la transition du signal binaire idéalisé au signal oscillatoire (environ 50% de perte de I₃)
  2. Impact mineur du volume de conduction: La perte d'information du signal source à l'électrode du cuir chevelu est relativement faible
  3. Sensibilité au bruit: Sous un SNR modéré, I₂ et I₃ diminuent tous deux considérablement

Implémentation des Dépendances

Implémentation réussie des dépendances d'ordre deux et trois connues dans les signaux sources oscillatoires:

  • Cas d'ordre deux: Corrélation du signal cible, indépendant de l'état du signal de contrôle
  • Cas d'ordre trois: Corrélation du signal cible lorsque le signal de contrôle est élevé (1), anticorrélation lorsqu'il est bas (0)

Découvertes Spécifiques aux Bandes de Fréquence

  • Delta et Theta: Le biais I₂ des méthodes Sign et Diff est moins prononcé
  • Alpha et fréquences plus élevées: Les méthodes Sign et Diff affichent un biais significatif vers I₂, limitant la détection de I₃
  • Toutes les bandes: La méthode Power maintient une structure hiérarchique raisonnable I₁ > I₂ > I₃

Travaux Connexes

Applications de la Géométrie de l'Information en Neurosciences

  • Amari & Nagaoka (2000): Théorie fondamentale de la géométrie de l'information
  • Nakahara & Amari (2002): Mesures de géométrie de l'information des potentiels d'action neuronaux
  • Tatsuno et al. (2009): Estimation robuste de la force de connexion et des entrées externes

Méthodes d'Analyse EEG

  • Méthodes traditionnelles: Principalement basées sur l'analyse spectrale de puissance et les corrélations par paires
  • Connectivité fonctionnelle: Relations régionales basées sur la dépendance statistique définie par Friston (1995)
  • Analyse de réseau: Analyse de réseau cérébral complexe de Bullmore & Sporns (2009)

Recherche sur les Interactions d'Ordre Supérieur

  • Battiston et al. (2020, 2021): Structures de réseau et dynamiques au-delà des interactions par paires
  • Contribution de cet article: Première application systématique des méthodes de géométrie de l'information à l'analyse des interactions d'ordre supérieur dans les données EEG

Conclusions et Discussion

Conclusions Principales

  1. Faisabilité de la méthode: Les méthodes de géométrie de l'information peuvent être étendues avec succès à l'analyse des signaux EEG continus
  2. Importance de la stratégie de binarisation: La méthode Power est la plus appropriée pour détecter les interactions d'ordre supérieur
  3. Interactions d'ordre supérieur réelles: Détection d'interactions d'ordre trois statistiquement significatives dans les tâches d'imagerie motrice
  4. Mécanisme de perte d'information: La perte d'information principale survient lors de la conversion du binaire au signal oscillatoire

Limitations

  1. Complexité computationnelle: 17 canaux approchent déjà la limite de faisabilité; les réseaux haute densité (128-256 canaux) pourraient présenter des difficultés computationnelles
  2. Résolution temporelle: Les fenêtres non-chevauchantes d'1 seconde fournissent une dynamique temporelle relativement grossière
  3. Analyse intra-bande: Considère uniquement les interactions au sein de la même bande de fréquence, n'impliquant pas l'analyse inter-bande
  4. Limitations de la binarisation: Peut manquer des modèles d'interaction non-linéaires plus complexes

Directions Futures

  1. Binarisation hybride: Combinaison de différentes méthodes de binarisation pour détecter des phénomènes tels que le couplage phase-amplitude
  2. Fenêtres adaptatives: Utilisation de fenêtres chevauchantes adaptées à la fréquence pour améliorer la résolution temporelle
  3. Analyse inter-bande: Extension aux interactions d'ordre supérieur entre différentes bandes de fréquence
  4. Interactions d'ordre supérieur: Exploration des modèles d'interaction d'ordre quatre et supérieur

Évaluation Approfondie

Avantages

  1. Innovation méthodologique: Extension réussie des méthodes de géométrie de l'information du domaine discret au domaine des signaux continus
  2. Validation rigoureuse: Cadre de validation complet fourni par la modélisation directe et les données de substitution
  3. Valeur pratique: Fournit des outils opérationnels pour l'analyse des interactions d'ordre supérieur dans les données EEG
  4. Contribution théorique: Quantification de la perte d'information à chaque étape du processus d'analyse

Insuffisances

  1. Limitation de la taille d'échantillon: 45 essais sont relativement peu nombreux, pouvant affecter la puissance statistique
  2. Simplification de la binarisation: La simplification des signaux continus complexes en binaire peut perdre des informations importantes
  3. Scalabilité computationnelle: Les défis computationnels pour les réseaux EEG haute densité n'ont pas été suffisamment résolus
  4. Interprétation biologique: Discussion insuffisante de la signification neurobiologique des interactions d'ordre trois détectées

Impact

  1. Impact méthodologique: Fournit de nouveaux outils mathématiques pour l'analyse d'ordre supérieur des signaux neuronaux
  2. Perspectives d'application: Applicable aux interfaces cerveau-machine, au diagnostic des maladies neurologiques, etc.
  3. Valeur théorique: Fait progresser la compréhension de l'organisation des réseaux cérébraux complexes
  4. Reproductibilité: Fournit du code open-source et des ensembles de données publics, soutenant la reproduction des résultats

Scénarios d'Application

  1. Recherche neuroscientifique fondamentale: Exploration des principes d'organisation d'ordre supérieur des réseaux cérébraux
  2. Applications cliniques: Analyse des modèles de connectivité d'ordre supérieur dans les maladies neurologiques
  3. Interfaces cerveau-machine: Extraction de caractéristiques de signal neuronal plus riches pour le contrôle
  4. Neurosciences cognitives: Étude des interactions neuronales complexes dans les tâches cognitives

Références Bibliographiques

Cet article cite 28 références importantes, comprenant principalement:

  1. Fondements de la géométrie de l'information: Amari & Nagaoka (2000), Amari (2001)
  2. Applications neuroscientifiques: Nakahara & Amari (2002), Tatsuno et al. (2009)
  3. Méthodologie EEG: Delorme & Makeig (2004), Oostenveld et al. (2011)
  4. Réseaux d'ordre supérieur: Battiston et al. (2020, 2021)
  5. Source de données: Triana-Guzman et al. (2022)

Évaluation Générale: Cet article est un travail méthodologique de haute qualité qui étend avec succès la théorie de la géométrie de l'information au domaine de l'analyse des signaux EEG. Bien qu'il présente certaines limitations en termes de scalabilité computationnelle et d'interprétation biologique, son cadre de validation rigoureux et ses stratégies de binarisation innovantes apportent des contributions théoriques et pratiques importantes à l'analyse des interactions d'ordre supérieur dans les signaux neuronaux.