2025-11-24T16:10:25.080119

Using Information Geometry to Characterize Higher-Order Interactions in EEG

Albers, Marriott, Tatsuno
In neuroscience, methods from information geometry (IG) have been successfully applied in the modelling of binary vectors from spike train data, using the orthogonal decomposition of the Kullback-Leibler divergence and mutual information to isolate different orders of interaction between neurons. While spike train data is well-approximated with a binary model, here we apply these IG methods to data from electroencephalography (EEG), a continuous signal requiring appropriate discretization strategies. We developed and compared three different binarization methods and used them to identify third-order interactions in an experiment involving imagined motor movements. The statistical significance of these interactions was assessed using phase-randomized surrogate data that eliminated higher-order dependencies while preserving the spectral characteristics of the original signals. We validated our approach by implementing known second- and third-order dependencies in a forward model and quantified information attenuation at different steps of the analysis. This revealed that the greatest loss in information occurred when going from the idealized binary case to enforcing these dependencies using oscillatory signals. When applied to the real EEG dataset, our analysis detected statistically significant third-order interactions during the task condition despite the relatively sparse data (45 trials per condition). This work demonstrates that IG methods can successfully extract genuine higher-order dependencies from continuous neural recordings when paired with appropriate binarization schemes.
academic

Использование информационной геометрии для характеристики взаимодействий высшего порядка в ЭЭГ

Основная информация

  • ID статьи: 2510.14188
  • Название: Using Information Geometry to Characterize Higher-Order Interactions in EEG
  • Авторы: Eric Albers, Paul Marriott, Masami Tatsuno
  • Классификация: q-bio.NC (Нейроны и познание), q-bio.QM (Количественные методы)
  • Дата публикации: 16 октября 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.14188

Резюме

В данном исследовании методы информационной геометрии (ИГ) расширены от традиционного анализа двоичных последовательностей спайков к анализу непрерывных сигналов электроэнцефалографии (ЭЭГ). Посредством ортогональной декомпозиции дивергенции Кульбака-Лейблера и взаимной информации идентифицируются взаимодействия различных порядков между нейронами. Разработаны три метода бинаризации для выявления трёхпорядковых взаимодействий в экспериментах с воображением движений, а статистическая значимость оценивается с использованием суррогатных данных с рандомизацией фазы. Валидность метода проверена посредством прямого моделирования, при этом количественно оценена потеря информации на каждом этапе анализа. Результаты показывают, что несмотря на относительно разреженные данные (45 испытаний на условие), метод способен выявлять статистически значимые трёхпорядковые взаимодействия в условиях задачи.

Исследовательский контекст и мотивация

Определение проблемы

Традиционные нейронаучные исследования сосредоточены на попарных отношениях между областями мозга (взаимодействия второго порядка), однако мозг как сложная система может демонстрировать взаимодействия, выходящие за рамки попарных отношений. Существующие сети функциональной связности строятся на основе попарных корреляций и могут не полностью отражать сложность обработки информации мозгом.

Значимость

  1. Теоретическое значение: Понимание того, требуются ли трёхпорядковые или более высокие взаимодействия для выполнения когнитивных функций мозгом
  2. Методологическое значение: Расширение методов информационной геометрии от дискретных данных спайков к непрерывным сигналам ЭЭГ
  3. Прикладная ценность: Предоставление новых инструментов анализа для интерфейсов мозг-компьютер и диагностики неврологических заболеваний

Ограничения существующих методов

  1. Методы информационной геометрии: Применяются главным образом к двоичным данным спайков, отсутствуют эффективные стратегии дискретизации для непрерывных сигналов
  2. Традиционный анализ ЭЭГ: Основан преимущественно на попарных корреляциях, игнорирует зависимости высшего порядка
  3. Статистический вывод: При разреженных данных стандартные асимптотические инструменты (например, распределение χ²) могут быть неприменимы

Исследовательская мотивация

Расширить методы информационной геометрии, успешно применённые к анализу спайков, на данные ЭЭГ и разработать надлежащие стратегии бинаризации для выявления истинных зависимостей высшего порядка в непрерывных нейронных записях.

Основные вклады

  1. Методологические инновации: Разработаны три метода бинаризации (Sign, Diff, Power) для преобразования непрерывных сигналов ЭЭГ в двоичные представления, пригодные для анализа информационной геометрией
  2. 框架валидации: Установлена методика проверки статистической значимости на основе суррогатных данных с рандомизацией фазы
  3. Прямое моделирование: Реализовано прямое моделирование с известными зависимостями второго и третьего порядков, количественно оценена потеря информации в процессе анализа
  4. Эмпирические находки: Выявлены статистически значимые трёхпорядковые взаимодействия в данных ЭЭГ воображения движений
  5. Теоретические выводы: Раскрыто, что максимальная потеря информации происходит при переходе от идеализированного двоичного случая к реализации зависимостей в колебательных сигналах

Подробное описание методов

Определение задачи

Входные данные: Многоканальные непрерывные сигналы ЭЭГ Выходные данные: Компоненты взаимной информации первого, второго и третьего порядков для триплетов каналов Ограничения: Обработка разреженных данных (45 испытаний/условие) и вызовы дискретизации непрерывных сигналов

Теоретические основы информационной геометрии

Для трёх двоичных переменных X₁, X₂, X₃ совместное распределение вероятностей может быть представлено как вектор восьми вероятностей:

p = (p₀₀₀, p₀₀₁, p₀₁₀, p₀₁₁, p₁₀₀, p₁₀₁, p₁₁₀, p₁₁₁)

Система координат ожидаемых параметров η:

  • η₁, η₂, η₃: предельные коэффициенты активации
  • η₁₂, η₁₃, η₂₃: попарные коэффициенты активации
  • η₁₂₃: тройной коэффициент активации

Система координат естественных параметров θ определяется через логарифмические отношения, например:

θ₁₂₃ = log(p₀₀₁p₀₁₀p₁₀₀p₁₁₁)/(p₁₁₀p₁₀₁p₀₁₁p₀₀₀)

Ортогональная декомпозиция дивергенции КЛ

Используя смешанную систему координат, дивергенция КЛ может быть ортогонально разложена как:

D[p : q] = D[p : p̄] + D[p̄ : p̃] + D[p̃ : q]

где:

  • Dp : p̄: информация о тройном взаимодействии
  • Dp̄ : p̃: информация о попарном взаимодействии
  • Dp̃ : q: информация о модуляции коэффициента активации

Методы бинаризации

1. Метод Sign

binary_signal = 1 if EEG_signal > 0 else 0

Захватывает грубую информацию о фазе, игнорирует амплитуду.

2. Метод Diff

diff_signal = diff(EEG_signal)
binary_signal = 1 if diff_signal > 0 else 0

Захватывает паттерны переходов фазы.

3. Метод Power

power = EEG_signal²
envelope = moving_average(power, 30_samples)
z_scores = (envelope - mean) / std
binary_signal = 1 if z_scores > 1 else 0

Захватывает периоды высокой амплитуды, независимо от фазы.

Проверка статистической значимости

Используется тестовая статистика:

λ = 2N·D[p : p̄] ~ χ²(1)

Поскольку данные разреженные, аппроксимация χ² неудовлетворительна, применяется непараметрическая проверка на основе суррогатных данных IAAFT (итеративное преобразование Фурье с коррекцией амплитуды).

Экспериментальная установка

Набор данных

Набор данных воображения движений OpenNeuro (Triana-Guzman et al., 2022):

  • Участники: 32 здоровых испытуемых (16 женщин)
  • Электроды: 17 электродов, расположены согласно международной системе 10-20
  • Частота дискретизации: 250 Гц
  • Дизайн испытания:
    • 6 блоков (3 сидя, 3 стоя)
    • 30 испытаний на блок (15 воображений движений, 15 состояний покоя)
    • Всего 45 испытаний на условие

Структура испытания:

  1. Фиксация (4 сек): Фиксация взгляда на крест на экране
  2. Наблюдение (3 сек): Отображение предстоящей задачи
  3. Воображение (4 сек): Выполнение ментальной задачи (воображение движения или состояние покоя)
  4. Отдых (4 сек): Свободная деятельность

Предварительная обработка данных

  1. Фильтрация: Высокочастотный фильтр 0,5 Гц, режекторный фильтр 58-62 Гц
  2. Удаление артефактов: Использование метода ASR (реконструкция подпространства артефактов)
  3. Полосовая фильтрация: Разделение на Delta (0,5-4 Гц), Theta (4-8 Гц), Alpha (8-12 Гц), Beta (12-30 Гц), Gamma (30-60 Гц)
  4. Извлечение эпох: 11-секундные эпохи от 7 секунд до начала задачи воображения до 4 секунд после начала

Показатели оценки

  • Взаимная информация первого порядка (I₁): Информация о модуляции коэффициента активации
  • Взаимная информация второго порядка (I₂): Информация о попарном взаимодействии
  • Взаимная информация третьего порядка (I₃): Информация о тройном взаимодействии
  • Статистическая значимость: p < 0,01 (на основе суррогатных данных IAAFT)

Методы сравнения

  1. Суррогатные данные белого шума: Влияние чистой случайной структуры
  2. Суррогатные данные IAAFT: Сохранение спектра мощности и распределения амплитуды, рандомизация фазы
  3. Различные методы бинаризации: Сравнение методов Sign vs Diff vs Power

Результаты экспериментов

Основные результаты

Валидация суррогатными данными

  1. Суррогатные данные IAAFT дают более высокие значения информации, чем белый шум, что ожидаемо, поскольку IAAFT сохраняет различия спектра мощности между фазами испытания
  2. Метод Power показывает убывающую тенденцию I₁ > I₂ > I₃ во всех полосах частот
  3. Методы Sign и Diff демонстрируют смещение в сторону I₂, особенно в высокочастотных полосах, что ограничивает их способность захватывать трёхпорядковые взаимодействия

Результаты на данных воображения движений

  1. Отказ аппроксимации χ²: Из-за разреженности данных (45 испытаний) стандартное асимптотическое распределение неприменимо
  2. Значимые трёхпорядковые взаимодействия: Выявлены статистически значимые I₃ на этапах наблюдения и воображения
  3. Контроль ложноположительных результатов: Значимые триплеты на этапе фиксации составляют примерно 1%, что подтверждает надлежащность нулевой гипотезы
  4. Временная динамика: Временная динамика информации третьего порядка различается для разных полос частот и триплетов

Результаты прямого моделирования

Количественная оценка потери информации

  1. Максимальная потеря информации: Происходит при переходе от идеализированного двоичного сигнала к колебательному сигналу (примерно 50% потери I₃)
  2. Относительно небольшое влияние объёмного проведения: Потеря информации при переходе от исходного сигнала к электродам на коже головы относительно невелика
  3. Чувствительность к шуму: При среднем и более низком отношении сигнал-шум как I₂, так и I₃ значительно снижаются

Реализация зависимостей

Успешно реализованы известные зависимости второго и третьего порядков в колебательных исходных сигналах:

  • Случай второго порядка: Целевой сигнал коррелирует, независимо от состояния контрольного сигнала
  • Случай третьего порядка: Целевой сигнал коррелирует, когда контрольный сигнал высокий (1), и антикоррелирует, когда низкий (0)

Находки, специфичные для полос частот

  • Delta и Theta: Смещение I₂ для методов Sign и Diff менее выражено
  • Alpha и более высокие полосы: Методы Sign и Diff значительно смещены в сторону I₂, что ограничивает обнаружение I₃
  • Все полосы частот: Метод Power сохраняет разумную иерархическую структуру I₁ > I₂ > I₃

Связанные работы

Применение информационной геометрии в нейронауке

  • Amari & Nagaoka (2000): Фундаментальная теория информационной геометрии
  • Nakahara & Amari (2002): Измерения информационной геометрии нейронных спайков
  • Tatsuno et al. (2009): Надёжная оценка силы связи и внешних входов

Методы анализа ЭЭГ

  • Традиционные методы: Главным образом основаны на анализе спектра мощности и попарных корреляциях
  • Функциональная связность: Отношения между областями, основанные на статистической зависимости, как определено Friston (1995)
  • Сетевой анализ: Анализ сложных сетей мозга Bullmore & Sporns (2009)

Исследования взаимодействий высшего порядка

  • Battiston et al. (2020, 2021): Сетевые структуры и динамика, выходящие за рамки попарных взаимодействий
  • Вклад данной работы: Первое систематическое применение методов информационной геометрии к анализу взаимодействий высшего порядка в данных ЭЭГ

Заключение и обсуждение

Основные выводы

  1. Осуществимость метода: Методы информационной геометрии могут быть успешно расширены на анализ непрерывных сигналов ЭЭГ
  2. Важность стратегии бинаризации: Метод Power наиболее подходит для обнаружения взаимодействий высшего порядка
  3. Истинные взаимодействия высшего порядка: Выявлены статистически значимые трёхпорядковые взаимодействия в задачах воображения движений
  4. Механизмы потери информации: Основная потеря информации происходит при преобразовании двоичного сигнала в колебательный сигнал

Ограничения

  1. Вычислительная сложность: 17 каналов уже близки к пределу осуществимости; высокоплотные массивы (128-256 каналов) могут быть вычислительно сложными
  2. Временное разрешение: Неперекрывающиеся окна в 1 секунду обеспечивают грубую временную динамику
  3. Анализ в пределах полосы: Рассматриваются только взаимодействия в пределах одной полосы частот, не охватывает анализ между полосами
  4. Ограничения бинаризации: Может пропустить более сложные нелинейные паттерны взаимодействия

Направления будущих исследований

  1. Гибридная бинаризация: Комбинирование различных методов бинаризации для выявления явлений, таких как связь фаза-амплитуда
  2. Адаптивные окна: Использование окон с адаптацией к частоте для повышения временного разрешения
  3. Анализ между полосами: Расширение на взаимодействия высшего порядка между различными полосами частот
  4. Взаимодействия более высокого порядка: Исследование паттернов взаимодействия четвёртого и более высокого порядков

Глубокая оценка

Преимущества

  1. Методологические инновации: Успешное расширение методов информационной геометрии от дискретного к непрерывному сигналу
  2. Строгая валидация: Полная структура валидации через прямое моделирование и суррогатные данные
  3. Практическая ценность: Предоставление применимых инструментов для анализа взаимодействий высшего порядка в данных ЭЭГ
  4. Теоретический вклад: Количественная оценка потери информации на каждом этапе анализа

Недостатки

  1. Ограничение размера выборки: 45 испытаний относительно невелико, может влиять на статистическую мощность
  2. Упрощение бинаризации: Преобразование сложного непрерывного сигнала в двоичный может привести к потере важной информации
  3. Масштабируемость вычислений: Вычислительные вызовы для высокоплотных массивов ЭЭГ не полностью решены
  4. Биологическая интерпретация: Недостаточное обсуждение нейробиологического значения выявленных трёхпорядковых взаимодействий

Влияние

  1. Методологическое влияние: Предоставление новых математических инструментов для анализа высшего порядка нейронных сигналов
  2. Перспективы применения: Применимо к интерфейсам мозг-компьютер, диагностике неврологических заболеваний и другим областям
  3. Теоретическая ценность: Продвижение понимания принципов организации высшего порядка сложных сетей мозга
  4. Воспроизводимость: Предоставление открытого исходного кода и общедоступных наборов данных, поддерживающих воспроизведение результатов

Применимые сценарии

  1. Фундаментальные нейронаучные исследования: Исследование принципов организации высшего порядка сетей мозга
  2. Клиническое применение: Анализ паттернов связности высшего порядка при неврологических заболеваниях
  3. Интерфейсы мозг-компьютер: Извлечение более богатых признаков нейронных сигналов для управления
  4. Когнитивная нейронаука: Исследование сложных нейронных взаимодействий при выполнении когнитивных задач

Библиография

Данная работа цитирует 28 важных справочных источников, включая:

  1. Основы информационной геометрии: Amari & Nagaoka (2000), Amari (2001)
  2. Применение в нейронауке: Nakahara & Amari (2002), Tatsuno et al. (2009)
  3. Методология ЭЭГ: Delorme & Makeig (2004), Oostenveld et al. (2011)
  4. Сети высшего порядка: Battiston et al. (2020, 2021)
  5. Источники данных: Triana-Guzman et al. (2022)

Общая оценка: Это высококачественная методологическая статья, которая успешно расширяет теорию информационной геометрии на область анализа сигналов ЭЭГ. Несмотря на некоторые ограничения в вычислительной масштабируемости и биологической интерпретации, её строгая структура валидации и инновационные стратегии бинаризации представляют важный теоретический и практический вклад в анализ взаимодействий высшего порядка нейронных сигналов.