Joint modeling and inference of multiple-subject high-dimensional sparse vector autoregressive models
Kim, Fisher, Pipiras
The multiple-subject vector autoregression (multi-VAR) model captures heterogeneous network Granger causality across subjects by decomposing individual sparse VAR transition matrices into commonly shared and subject-unique paths. The model has been applied to characterize hidden shared and unique paths among subjects and has demonstrated performance compared to methods commonly used in psychology and neuroscience. Despite this innovation, the model suffers from using a weighted median for identifying the common effects, leading to statistical inefficiency as the convergence rates of the common and unique paths are determined by the least sparse subject and the smallest sample size across all subjects. We propose a new identifiability condition for the multi-VAR model based on a communication-efficient data integration framework. We show that this approach achieves convergence rates tailored to each subject's sparsity level and sample size. Furthermore, we develop hypothesis tests to assess the nullity and homogeneity of individual paths, using Wald-type test statistics constructed from individual debiased estimators. A test for the significance of the common paths can also be derived through the framework. Simulation studies under various heterogeneity scenarios and a real data application demonstrate the performance of the proposed method compared to existing benchmark across standard evaluation metrics.
academic
Совместное моделирование и вывод множественных высокомерных разреженных векторных авторегрессионных моделей
Название: Joint modeling and inference of multiple-subject high-dimensional sparse vector autoregressive models
Авторы: Younghoon Kim (Корнеллский университет), Zachary F. Fisher (Университет Северной Каролины в Чапел-Хилл), Vladas Pipiras (Университет Северной Каролины в Чапел-Хилл)
Многосубъектные векторные авторегрессионные (multi-VAR) модели захватывают гетерогенные сетевые причинно-следственные связи Грейнджера между субъектами путём разложения индивидуальных разреженных матриц переходов VAR на общие общие пути и субъект-специфичные пути. Хотя эта модель применялась для характеристики скрытых общих и уникальных путей между субъектами и продемонстрировала превосходную производительность по сравнению с обычно используемыми методами в психологии и нейронауке, её использование взвешенной медианы для идентификации общих эффектов имеет проблемы статистической эффективности, поскольку скорости сходимости общих и уникальных путей определяются наименее разреженным субъектом и минимальным размером выборки среди всех субъектов. В данной работе на основе коммуникационно-эффективной структуры интеграции данных предлагаются новые условия идентифицируемости для модели multi-VAR, обеспечивающие адаптированные скорости сходимости для каждого уровня разреженности субъекта и размера выборки. Кроме того, разработана структура проверки гипотез для оценки нулевости и однородности индивидуальных путей с использованием статистик типа Вальда, построенных на основе индивидуальных несмещённых оценок, через которую можно вывести проверку значимости общих путей.
Основная проблема, которую решает данное исследование, касается статистической эффективности и вывода при многосубъектном высокомерном разреженном векторном авторегрессионном моделировании. Конкретно:
Проблема статистической эффективности: Существующие модели multi-VAR используют взвешенную медиану для идентификации общих эффектов, что приводит к скоростям сходимости, ограниченным наименее разреженным субъектом и минимальным размером выборки, что не позволяет полностью использовать гетерогенные характеристики каждого субъекта.
Отсутствие структуры вывода: Отсутствует формальная структура проверки гипотез для многосубъектных VAR моделей, что не позволяет оценить значимость, нулевость и однородность индивидуальных путей.
Предложены новые условия идентифицируемости: На основе коммуникационно-эффективной структуры интеграции данных, избегающие проблем статистической эффективности метода взвешенной медианы
Реализованы индивидуализированные скорости сходимости: Скорости сходимости теперь зависят от собственного уровня разреженности и размера выборки каждого субъекта, а не от глобального наихудшего случая
Построена полная структура вывода: Разработаны три класса проверок гипотез: тесты нулевости, тесты однородности и тесты значимости
Теоретические гарантии: Предоставлены теория скоростей сходимости оценок и асимптотического распределения статистик тестов
Повышение вычислительной эффективности: Применена стратегия отдельного оценивания с последующей агрегацией, значительно снижающая вычислительную сложность
Робастный M-оценитель: Идентификация общих эффектов рассматривается как проблема загрязнения измерений, использующая функцию потерь с переопределением для обработки выбросов
Индивидуализированные пороги: δₖ ~ √(log q/Nₖ), δ₀ ~ √(log q/(KN_)), полностью использующие информацию о выборке каждого субъекта
Коммуникационно-эффективная структура: Избегает глобальной оптимизации, каждый субъект может вычисляться независимо с последующей агрегацией
Низкомерный случай (d=10): Предложенный метод превосходит существующие методы по RMSE
Высокомерный случай (d=20): По мере увеличения размера выборки разница в производительности сокращается
Чувствительность и специфичность: Сопоставимы с адаптивным multi-VAR, что указывает на то, что индивидуализированные пороги действуют подобно адаптивным весам
Общие соединения: Идентифицированы соединения сетей мозга, связанные с обработкой эмоций, общие для всех испытуемых
Индивидуальные различия: По сравнению с базовыми методами, предложенный метод идентифицирует более разреженные, но более интерпретируемые паттерны соединений
Биологическое значение: Обнаруженные соединения соответствуют известным нейромеханизмам обработки эмоций
Статья цитирует обширную литературу по смежным вопросам, охватывающую высокомерную статистику, анализ временных рядов, робастное оценивание и другие области, обеспечивая прочную теоретическую основу для исследования.