2025-11-24T16:10:25.080119

Using Information Geometry to Characterize Higher-Order Interactions in EEG

Albers, Marriott, Tatsuno

In neuroscience, methods from information geometry (IG) have been successfully applied in the modelling of binary vectors from spike train data, using the orthogonal decomposition of the Kullback-Leibler divergence and mutual information to isolate different orders of interaction between neurons. While spike train data is well-approximated with a binary model, here we apply these IG methods to data from electroencephalography (EEG), a continuous signal requiring appropriate discretization strategies. We developed and compared three different binarization methods and used them to identify third-order interactions in an experiment involving imagined motor movements. The statistical significance of these interactions was assessed using phase-randomized surrogate data that eliminated higher-order dependencies while preserving the spectral characteristics of the original signals. We validated our approach by implementing known second- and third-order dependencies in a forward model and quantified information attenuation at different steps of the analysis. This revealed that the greatest loss in information occurred when going from the idealized binary case to enforcing these dependencies using oscillatory signals. When applied to the real EEG dataset, our analysis detected statistically significant third-order interactions during the task condition despite the relatively sparse data (45 trials per condition). This work demonstrates that IG methods can successfully extract genuine higher-order dependencies from continuous neural recordings when paired with appropriate binarization schemes.

academic

Uso de la Geometría de la Información para Caracterizar Interacciones de Orden Superior en EEG

Información Básica

ID del Artículo: 2510.14188
Título: Using Information Geometry to Characterize Higher-Order Interactions in EEG
Autores: Eric Albers, Paul Marriott, Masami Tatsuno
Clasificación: q-bio.NC (Neuronas y Cognición), q-bio.QM (Métodos Cuantitativos)
Fecha de Publicación: 16 de octubre de 2025 (preimpresión en arXiv)
Enlace del Artículo: https://arxiv.org/abs/2510.14188

Resumen

Este estudio extiende los métodos de geometría de la información (IG) desde datos tradicionales de secuencias de picos neuronales binarios al análisis de señales continuas de electroencefalograma (EEG). Mediante la descomposición ortogonal de la divergencia de Kullback-Leibler e información mutua, se identifican interacciones de diferentes órdenes entre neuronas. El estudio desarrolla tres métodos de binarización para identificar interacciones de tercer orden en experimentos de imaginación motora, utilizando datos sustitutos aleatorizados en fase para evaluar la significancia estadística. Se valida la efectividad del método mediante modelado directo, cuantificando la atenuación de información en cada paso del análisis. Los resultados demuestran que, a pesar de la relativa escasez de datos (45 ensayos por condición), el método puede detectar interacciones de tercer orden estadísticamente significativas bajo condiciones de tarea.

Antecedentes de Investigación y Motivación

Definición del Problema

La investigación neurocientífica tradicional se enfoca principalmente en relaciones por pares entre regiones cerebrales (interacciones de segundo orden), pero el cerebro como sistema complejo puede exhibir interacciones de orden superior que van más allá de las relaciones por pares. Las redes de conectividad funcional existentes se construyen basándose en correlaciones por pares, lo que puede no capturar completamente la complejidad del procesamiento de información cerebral.

Importancia

Significancia Teórica: Comprender si el cerebro requiere interacciones de tercer orden o superior para realizar funciones cognitivas
Significancia Metodológica: Extender métodos de geometría de la información desde datos discretos de picos neuronales a señales continuas de EEG
Valor Aplicado: Proporcionar nuevas herramientas de análisis para interfaces cerebro-computadora y diagnóstico de enfermedades neurológicas

Limitaciones de Métodos Existentes

Métodos de Geometría de la Información: Aplicados principalmente a datos binarios de picos neuronales, con estrategias de discretización ineficaces para señales continuas
Análisis Tradicional de EEG: Basado principalmente en correlaciones por pares, ignorando relaciones de dependencia de orden superior
Inferencia Estadística: En condiciones de datos escasos, herramientas asintóticas estándar (como la distribución χ²) pueden no ser aplicables

Motivación de la Investigación

Extender métodos de geometría de la información, exitosamente aplicados al análisis de picos neuronales, al análisis de datos de EEG, desarrollando estrategias de binarización apropiadas para capturar verdaderas dependencias de orden superior en registros neuronales continuos.

Contribuciones Principales

Innovación Metodológica: Desarrollo de tres métodos de binarización (Sign, Diff, Power) para convertir señales continuas de EEG en representaciones binarias adecuadas para análisis de geometría de la información
Marco de Validación: Establecimiento de un método de prueba de significancia estadística basado en datos sustitutos aleatorizados en fase
Modelado Directo: Implementación de modelos directos con dependencias conocidas de segundo y tercer orden, cuantificando la atenuación de información durante el análisis
Hallazgos Empíricos: Detección de interacciones de tercer orden estadísticamente significativas en datos de EEG de imaginación motora
Perspectivas Teóricas: Revelación de que la máxima pérdida de información ocurre al pasar de casos binarios idealizados a la implementación en señales oscilantes

Explicación Detallada de Métodos

Definición de la Tarea

Entrada: Señales continuas de EEG multicanal Salida: Componentes de información mutua de primer, segundo y tercer orden entre tríadas de canales Restricciones: Manejo de datos escasos (45 ensayos/condición) y desafíos de discretización de señales continuas

Fundamentos Teóricos de Geometría de la Información

Para tres variables binarias X₁, X₂, X₃, la distribución de probabilidad conjunta puede representarse como un vector de ocho probabilidades:

p = (p₀₀₀, p₀₀₁, p₀₁₀, p₀₁₁, p₁₀₀, p₁₀₁, p₁₁₀, p₁₁₁)

Sistema de coordenadas de parámetros esperados η:

η₁, η₂, η₃: tasas de activación marginal
η₁₂, η₁₃, η₂₃: tasas de activación por pares
η₁₂₃: tasa de activación ternaria

Sistema de coordenadas de parámetros naturales θ definido mediante razones logarítmicas, como:

θ₁₂₃ = log(p₀₀₁p₀₁₀p₁₀₀p₁₁₁)/(p₁₁₀p₁₀₁p₀₁₁p₀₀₀)

Descomposición Ortogonal de la Divergencia KL

Utilizando un sistema de coordenadas mixtas, la divergencia KL puede descomponerse ortogonalmente como:

D[p : q] = D[p : p̄] + D[p̄ : p̃] + D[p̃ : q]

Donde:

Dp : p̄: información de interacción ternaria
Dp̄ : p̃: información de interacción por pares
Dp̃ : q: información de modulación de tasas de activación

Métodos de Binarización

1. Método Sign

señal_binaria = 1 si señal_EEG > 0 si no 0

Captura información de fase aproximada, ignorando amplitud.

2. Método Diff

señal_diff = diff(señal_EEG)
señal_binaria = 1 si señal_diff > 0 si no 0

Captura patrones de transición de fase.

3. Método Power

potencia = señal_EEG²
envolvente = media_móvil(potencia, 30_muestras)
puntuaciones_z = (envolvente - media) / desv_est
señal_binaria = 1 si puntuaciones_z > 1 si no 0

Captura períodos de alta amplitud, independiente de fase.

Prueba de Significancia Estadística

Utilizando el estadístico de prueba:

λ = 2N·D[p : p̄] ~ χ²(1)

Debido a la escasez de datos, la aproximación χ² es deficiente, adoptándose una prueba no paramétrica basada en datos sustitutos IAAFT (Transformada de Fourier con Ajuste Iterativo de Amplitud).

Configuración Experimental

Conjunto de Datos

Conjunto de Datos de Imaginación Motora de OpenNeuro (Triana-Guzman et al., 2022):

Participantes: 32 sujetos sanos (16 mujeres)
Electrodos: 17 electrodos, colocados según el sistema internacional 10-20
Frecuencia de Muestreo: 250 Hz
Diseño de Ensayos:
- 6 bloques (3 sentados, 3 de pie)
- 30 ensayos por bloque (15 imaginación motora, 15 estado de reposo)
- Total de 45 ensayos por condición

Estructura del Ensayo:

Fijación (4 segundos): Fijación de la cruz en pantalla
Observación (3 segundos): Visualización de la tarea a ejecutar
Imaginación (4 segundos): Ejecución de la tarea mental (imaginación motora o estado de reposo)
Descanso (4 segundos): Actividad libre

Preprocesamiento de Datos

Filtrado: Filtro paso-alto de 0,5 Hz, filtro de muesca 58-62 Hz
Eliminación de Artefactos: Método ASR (Reconstrucción de Subespacios de Artefactos)
Filtrado de Bandas de Frecuencia: División en Delta (0,5-4 Hz), Theta (4-8 Hz), Alpha (8-12 Hz), Beta (12-30 Hz), Gamma (30-60 Hz)
Extracción de Épocas: Período de 11 segundos desde 7 segundos antes del inicio de la tarea de imaginación hasta 4 segundos después

Métricas de Evaluación

Información Mutua de Primer Orden (I₁): Información de modulación de tasas de activación
Información Mutua de Segundo Orden (I₂): Información de interacción por pares
Información Mutua de Tercer Orden (I₃): Información de interacción ternaria
Significancia Estadística: p < 0,01 (basado en datos sustitutos IAAFT)

Métodos de Comparación

Datos Sustitutos de Ruido Blanco: Impacto de estructura puramente aleatoria
Datos Sustitutos IAAFT: Mantenimiento del espectro de potencia y distribución de amplitud, aleatorización de fase
Diferentes Métodos de Binarización: Comparación Sign vs Diff vs Power

Resultados Experimentales

Resultados Principales

Validación de Datos Sustitutos

Los datos IAAFT producen valores de información más altos que el ruido blanco, lo cual es esperado, ya que IAAFT mantiene diferencias en el espectro de potencia entre fases de ensayo
El método Power muestra una tendencia decreciente I₁ > I₂ > I₃ en todas las bandas de frecuencia
Los métodos Sign y Diff muestran sesgo hacia I₂, particularmente evidente en bandas de alta frecuencia, limitando su capacidad para capturar interacciones de tercer orden

Resultados de Datos de Imaginación Motora

Fallo de la aproximación χ²: Debido a la escasez de datos (45 ensayos), las distribuciones asintóticas estándar no son aplicables
Interacciones de Tercer Orden Significativas: Detección de I₃ estadísticamente significativa en fases de observación e imaginación
Control de Falsos Positivos: Aproximadamente 1% de tríadas significativas en la fase de fijación, validando la adecuación de la hipótesis nula
Dinámicas Temporales: Dinámicas temporales diferentes de información de tercer orden entre bandas de frecuencia y tríadas

Resultados de Validación del Modelo Directo

Cuantificación de Atenuación de Información

Máxima Pérdida de Información: Ocurre al pasar de señales binarios idealizados a señales oscilantes (aproximadamente 50% de pérdida de I₃)
Impacto Menor de Conducción de Volumen: La pérdida de información de señales de fuente a electrodos en cuero cabelludo es relativamente pequeña
Sensibilidad al Ruido: Tanto I₂ como I₃ disminuyen significativamente por debajo de SNR moderado

Implementación de Dependencias

Implementación exitosa de dependencias conocidas de segundo y tercer orden en señales de fuente oscilantes:

Caso de Segundo Orden: Correlación de señal objetivo, independiente del estado de señal de control
Caso de Tercer Orden: Correlación de señal objetivo cuando la señal de control es alta (1), anticorrelación cuando es baja (0)

Hallazgos Específicos de Banda de Frecuencia

Delta y Theta: Sesgo menos pronunciado de I₂ en métodos Sign y Diff
Alpha y Bandas Superiores: Sesgo significativo hacia I₂ en métodos Sign y Diff, limitando detección de I₃
Todas las Bandas: El método Power mantiene una estructura jerárquica razonable I₁ > I₂ > I₃

Trabajo Relacionado

Aplicaciones de Geometría de la Información en Neurociencia

Amari & Nagaoka (2000): Teoría fundamental de geometría de la información
Nakahara & Amari (2002): Medidas de geometría de la información en picos neuronales
Tatsuno et al. (2009): Estimación robusta de fortaleza de conexión e inputs externos

Métodos de Análisis de EEG

Métodos Tradicionales: Principalmente basados en análisis de espectro de potencia y correlaciones por pares
Conectividad Funcional: Relaciones de regiones basadas en dependencia estadística según Friston (1995)
Análisis de Redes: Análisis de redes cerebrales complejas según Bullmore & Sporns (2009)

Investigación de Interacciones de Orden Superior

Battiston et al. (2020, 2021): Estructuras de red y dinámicas más allá de interacciones por pares
Contribución de este Artículo: Primera aplicación sistemática de métodos de geometría de la información al análisis de interacciones de orden superior en datos de EEG

Conclusiones y Discusión

Conclusiones Principales

Viabilidad del Método: Los métodos de geometría de la información pueden extenderse exitosamente al análisis de señales continuas de EEG
Importancia de Estrategias de Binarización: El método Power es más adecuado para detectar interacciones de orden superior
Interacciones de Orden Superior Reales: Detección de interacciones de tercer orden estadísticamente significativas en tareas de imaginación motora
Mecanismos de Pérdida de Información: La principal pérdida de información ocurre durante la conversión de binario a señales oscilantes

Limitaciones

Complejidad Computacional: 17 canales ya se acercan al límite de viabilidad; arreglos de alta densidad (128-256 canales) pueden presentar dificultades computacionales
Resolución Temporal: Ventanas no superpuestas de 1 segundo proporcionan dinámicas temporales relativamente gruesas
Análisis Dentro de Banda: Solo considera interacciones dentro de la misma banda de frecuencia, sin análisis entre bandas
Limitaciones de Binarización: Puede perder patrones de interacción no lineal más complejos

Direcciones Futuras

Binarización Híbrida: Combinación de diferentes métodos de binarización para detectar fenómenos como acoplamiento fase-amplitud
Ventanas Adaptativas: Uso de ventanas superpuestas adaptadas a la frecuencia para mejorar resolución temporal
Análisis Entre Bandas: Extensión a interacciones de orden superior entre diferentes bandas de frecuencia
Interacciones de Orden Superior: Exploración de patrones de interacción de cuarto orden y superiores

Evaluación Profunda

Fortalezas

Innovación Metodológica: Extensión exitosa de métodos de geometría de la información de dominio discreto a continuo
Validación Rigurosa: Marco de validación completo mediante modelado directo y datos sustitutos
Valor Práctico: Proporciona herramientas operables para análisis de interacciones de orden superior en datos de EEG
Contribución Teórica: Cuantificación de pérdida de información en cada paso del análisis

Deficiencias

Limitación de Tamaño de Muestra: 45 ensayos son relativamente pocos, pudiendo afectar el poder estadístico
Simplificación de Binarización: La simplificación de señales continuas complejas a binarias puede perder información importante
Escalabilidad Computacional: Desafíos computacionales para arreglos de EEG de alta densidad no completamente resueltos
Interpretación Biológica: Discusión insuficiente del significado neurobiológico de las interacciones de tercer orden detectadas

Impacto

Impacto Metodológico: Proporciona nuevas herramientas matemáticas para análisis de orden superior de señales neurales
Perspectivas de Aplicación: Aplicable a interfaces cerebro-computadora, diagnóstico de enfermedades neurológicas, etc.
Valor Teórico: Avanza la comprensión de la organización de redes cerebrales complejas
Reproducibilidad: Proporciona código abierto y conjunto de datos públicos, apoyando la reproducción de resultados

Escenarios de Aplicación

Investigación Neurocientífica Básica: Exploración de principios de organización de orden superior de redes cerebrales
Aplicaciones Clínicas: Análisis de patrones de conectividad de orden superior en enfermedades neurológicas
Interfaces Cerebro-Computadora: Extracción de características de señal neural más ricas para control
Neurociencia Cognitiva: Investigación de interacciones neurales complejas en tareas cognitivas

Referencias Bibliográficas

Este artículo cita 28 referencias importantes, incluyendo principalmente:

Fundamentos de Geometría de la Información: Amari & Nagaoka (2000), Amari (2001)
Aplicaciones en Neurociencia: Nakahara & Amari (2002), Tatsuno et al. (2009)
Metodología de EEG: Delorme & Makeig (2004), Oostenveld et al. (2011)
Redes de Orden Superior: Battiston et al. (2020, 2021)
Fuente de Datos: Triana-Guzman et al. (2022)

Evaluación General: Este es un artículo de alta calidad en metodología que extiende exitosamente la teoría de geometría de la información al análisis de señales de EEG. Aunque presenta algunas limitaciones en escalabilidad computacional e interpretación biológica, su marco de validación riguroso y estrategias de binarización innovadoras proporcionan contribuciones teóricas y prácticas importantes al análisis de interacciones de orden superior en señales neurales.