We present a new method for causal discovery in linear structural vector autoregressive models. We adapt an idea designed for independent observations to the case of time series while retaining its favorable properties, i.e., explicit error control for false causal discovery, at least asymptotically. We apply our method to several real-world bivariate time series datasets and discuss its findings which mostly agree with common understanding. The arrow of time in a model can be interpreted as background knowledge on possible causal mechanisms. Hence, our ideas could be extended to incorporating different background knowledge, even for independent observations.
- ID статьи: 2403.03778
- Название: Ancestor regression in structural vector autoregressive models
- Авторы: Кристоф Шультайс, Маркус Ульмер, Петер Бюльманн (ETH Цюрих)
- Классификация: stat.ME (Статистика - Методология)
- Дата публикации: 3 января 2025 г. (версия arXiv)
- Ссылка на статью: https://arxiv.org/abs/2403.03778
В данной работе предложен новый метод причинного обнаружения в линейных структурных векторных авторегрессионных моделях. Авторы расширяют метод регрессии предков, первоначально разработанный для независимых наблюдений, на случай временных рядов, сохраняя его благоприятные свойства, а именно явный контроль ошибок над ложными причинными открытиями (по крайней мере в асимптотическом смысле). Метод применяется к нескольким реальным наборам данных двумерных временных рядов, результаты которых в основном согласуются с интуитивным пониманием. Временная стрелка может интерпретироваться как фоновое знание о возможных причинных механизмах, поэтому этот подход может быть расширен для интеграции различных видов фонового знания и даже применен к независимым наблюдениям.
- Решаемая проблема: Наборы данных из реальных приложений обычно имеют временную структуру, нарушающую предположение о независимости и одинаковом распределении, широко используемое в причинном обнаружении. Данная работа направлена на решение проблемы причинного обнаружения в моделях структурной векторной авторегрессии (SVAR).
- Важность проблемы: Данные временных рядов чрезвычайно распространены в практических приложениях, однако традиционные методы причинного обнаружения разработаны в основном для независимых наблюдений. Хотя временная зависимость создает трудности при оценивании, она также предоставляет преимущество — предикторы не могут оказывать причинное влияние на другие переменные в более ранние моменты времени.
- Ограничения существующих методов:
- Традиционные методы, такие как LiNGAM, разработаны в основном для независимых наблюдений
- Отсутствует явный контроль ошибок для причинного обнаружения во временных рядах
- Существующие расширения SVAR методов не имеют теоретических гарантий
- Исследовательская мотивация: Расширить метод регрессии предков Шультайса и Бюльманна (2023) на многомерные временные ряды, сохраняя асимптотические гарантии при работе с временной зависимостью.
- Расширение метода: Распространение регрессии предков с независимых наблюдений на линейные модели SVAR с обработкой мгновенных и запаздывающих причинных отношений
- Контроль ошибок: Предоставление асимптотических гарантий ошибок первого рода с явным контролем над ложными причинными открытиями
- Выбор множества корректировок: Демонстрация выбора правильного множества корректировок для различных временных запаздываний с целью получения контроля ошибок
- Сетевой вывод: Предложение алгоритмов для построения графов мгновенных эффектов и сводных временных графов
- Эмпирическая проверка: Проверка эффективности метода на наборах данных из реальных приложений
Дан многомерный временной ряд xt,j (t = 1,...,T; j = 1,...,d), целью является идентификация причинных отношений предков между переменными, включая мгновенные эффекты (τ=0) и запаздывающие эффекты (τ>0).
Модель SVAR:
xt=∑τ=0pBτxt−τ+ϵt
где:
- B0 соответствует мгновенным эффектам, предполагается ациклическая структура
- Bτ (τ>0) — матрицы запаздывающих эффектов
- ϵt — независимые инновационные члены
Эквивалентная форма:
xt=∑τ=1pB~τxt−τ+ξt
Основная идея регрессии предков:
Для нелинейной функции f(·) используется регрессия наименьших квадратов:
f(ξt,jτ) относительно ξt−τ
где ξt,jτ и ξt−τ — остатки после исключения вклада более ранних моментов времени.
Ключевая теорема 1: Для k ∉ AN_τ(j) (k не является τ-запаздывающим предком j):
βkf,j,τ=E[zt−τ,kf(ξt,jτ)]/E[zt−τ,k2]=0
- Конструкция остатков: Исключение влияния более ранних моментов времени через проектирование для повышения отношения сигнал-шум
- Корректировка запаздываний: Построение надлежащих множеств корректировок для различных запаздываний τ
- Асимптотическая теория: Асимптотическая нормальность, основанная на близкой периодической зависимости
- Сетевой вывод: Рекурсивное построение отношений предков с обработкой обнаружения циклов
Смоделированные данные:
- Количество переменных: d = 6, 10, 50
- Порядок SVAR: p = 1
- Размер выборки: 10² до 10⁶
- Распределение ошибок: смесь t₇, равномерного, Лапласа и нормального распределений
- Веса ребер: равномерное распределение с контролем отношения сигнал-шум
Реальные данные:
- Гейзер Old Faithful: время ожидания vs продолжительность извержения (299 наблюдений)
- Газовая печь: скорость входящего газа vs концентрация выходящего CO₂ (296 наблюдений)
- Цены на молочные продукты: цена масла vs цена чеддера (522 наблюдения)
- Family-wise error rate (FWER): семейная частота ошибок ложных открытий
- Мощность: частота обнаружения истинных причинных отношений
- p-значения: проверка гипотез на основе асимптотического нормального распределения
- Алгоритм LiNGAM (Hyvärinen et al., 2010)
- Сравнение производительности при различных размерах выборки и настройках скрытых переменных
- Нелинейная функция: f(x) = sign(x)|x|³
- Корректировка множественности: метод Бонферрони-Холма
- Уровень значимости: α = 0,05
Смоделированные эксперименты:
- Для непредковых переменных средние абсолютные z-статистики близки к среднему значению теоретического распределения нулевой гипотезы
- Ошибки первого рода контролируются при всех размерах выборки
- Мощность обнаружения увеличивается с ростом размера выборки
- Обнаружение запаздывающих предков проще, чем мгновенных предков (более сильный сигнал)
Сетевой вывод:
- Графы мгновенных эффектов и сводные временные графы достигают хорошего разделения предков и непредков
- Рекурсивное построение помогает обнаружить эффекты, которые трудно найти отдельно
- Почти идеальная производительность при больших выборках
Влияние скрытых переменных:
- Потеря контроля ошибок на предусмотренном уровне при нарушении предположений
- Но сохраняется разделение размеров эффектов между предками и непредками
- Ранжирование p-значений все еще указывает на истинных предков
Различные типы предков:
- Прямые запаздывающие эффекты (B~4,k=0): самый сильный сигнал
- Мгновенные предки: средний сигнал
- Запаздывающие предки, опосредованные мгновенными эффектами: самый слабый сигнал
Гейзер Old Faithful:
- Исходные данные: мгновенные эффекты не обнаружены
- После временной корректировки: обнаружен мгновенный эффект продолжительность извержения → время ожидания (p=5×10⁻⁴)
- Согласуется с знаниями в области
Газовая печь:
- Отсутствие мгновенных эффектов
- Обнаружен запаздывающий эффект скорость входящего газа → концентрация выходящего CO₂ (p=4×10⁻²⁰)
Цены на молочные продукты:
- Обнаружен запаздывающий эффект масло → чеддер (p=5×10⁻¹⁵)
- Обратный эффект не обнаружен, исключена гипотеза скрытого смешивания
- Метод показывает хорошую производительность при конечных выборках
- Априорное знание, предоставляемое временной структурой, способствует причинному выводу
- Рекурсивное построение значительно повышает производительность сетевого вывода
- Метод обладает определенной робастностью к нарушениям предположений модели
- Серия LiNGAM: Линейная негауссова ациклическая модель Shimizu et al. (2006) и ее расширения на временные ряды
- Структурные причинные модели: Ограниченные структурные уравнения Peters et al. (2013)
- Регрессия предков: Метод для независимых наблюдений Schultheiss & Bühlmann (2023)
- Расширение регрессии предков на установку временных рядов
- Сходство с расширениями LiNGAM на SVAR в отношении способности идентификации, но с предоставлением контроля ошибок
- Более высокая вычислительная эффективность по сравнению с традиционными методами
- vs LiNGAM: Предоставление интерпретируемого контроля ошибок, но немного более низкая мощность
- vs традиционные методы: Использование временной структуры, избежание некоторых проблем идентификации
- vs другие методы SVAR: Более сильные теоретические гарантии, более простая реализация
- Успешное расширение регрессии предков на модели SVAR
- Сохранение благоприятных свойств асимптотического контроля ошибок первого рода
- Проверка эффективности метода на смоделированных и реальных данных
- Предоставление новой теоретической базы для причинного обнаружения во временных рядах
- Предположения модели: Требуется линейность отношений и независимость инновационных членов
- Ацикличность мгновенных эффектов: Предположение об ациклической структуре мгновенных эффектов может быть нереалистичным
- Гауссовский шум: Чувствительность к гауссовскому шуму соседних переменных
- Скрытые переменные: Потеря контроля ошибок при наличии ненаблюдаемых переменных
- Интеграция фонового знания: Расширение на более общие установки фонового знания
- Нелинейные расширения: Обработка нелинейных причинных отношений
- Оптимизация для высоких размерностей: Улучшение вычислительной эффективности для высокомерных временных рядов
- Повышение робастности: Разработка методов, робастных к нарушениям предположений модели
- Теоретическая строгость: Полный асимптотический теоретический анализ и доказательства
- Методологическая инновация: Умелое использование временной структуры для причинного вывода
- Практическая применимость: Простые вычисления, легкая реализация
- Полная проверка: Всесторонняя проверка на смоделированных и реальных данных
- Ясное изложение: Четкая логика, точные математические выражения
- Строгие предположения: Предположения линейности и независимости ограничивают область применения
- Проблемы мощности: В некоторых случаях мощность ниже, чем у LiNGAM
- Ограниченные реальные данные: Проверка только на двумерных временных рядах
- Вызовы высокой размерности: Чрезмерно консервативная корректировка множественности для больших сетей
- Теоретический вклад: Предоставление новой теоретической базы для причинного обнаружения во временных рядах
- Методологическая ценность: Важное расширение регрессии предков
- Практическая ценность: Предоставление инструментов для анализа реальных временных рядов
- Воспроизводимость: Открытый код, воспроизводимые результаты
- Экономические временные ряды: Анализ причинных отношений между макроэкономическими переменными
- Биомедицина: Причинный вывод между физиологическими сигналами
- Инженерные системы: Идентификация причинных отношений в системах управления
- Социальные науки: Анализ динамических причинных отношений социальных явлений
- Schultheiss, C. and Bühlmann, P. (2023). Ancestor regression in linear structural equation models. Biometrika, 110(4):1117–1124.
- Shimizu, S., Hoyer, P. O., Hyvärinen, A., Kerminen, A., and Jordan, M. (2006). A linear non-gaussian acyclic model for causal discovery. Journal of Machine Learning Research, 7(10).
- Peters, J., Janzing, D., and Schölkopf, B. (2013). Causal inference on time series using restricted structural equation models. Advances in neural information processing systems, 26.
- Hyvärinen, A., Zhang, K., Shimizu, S., and Hoyer, P. O. (2010). Estimation of a structural vector autoregression model using non-gaussianity. Journal of Machine Learning Research, 11(5).
Общая оценка: Это высококачественная методологическая статья с важными вкладами как на теоретическом, так и на практическом уровнях. Авторы успешно расширили важный метод причинного обнаружения на установку временных рядов, сохраняя благоприятные свойства исходного метода. Несмотря на некоторые ограничения, работа предоставляет ценные инструменты и теоретическую базу для области причинного вывода во временных рядах.