Joint modeling and inference of multiple-subject high-dimensional sparse vector autoregressive models
Kim, Fisher, Pipiras
The multiple-subject vector autoregression (multi-VAR) model captures heterogeneous network Granger causality across subjects by decomposing individual sparse VAR transition matrices into commonly shared and subject-unique paths. The model has been applied to characterize hidden shared and unique paths among subjects and has demonstrated performance compared to methods commonly used in psychology and neuroscience. Despite this innovation, the model suffers from using a weighted median for identifying the common effects, leading to statistical inefficiency as the convergence rates of the common and unique paths are determined by the least sparse subject and the smallest sample size across all subjects. We propose a new identifiability condition for the multi-VAR model based on a communication-efficient data integration framework. We show that this approach achieves convergence rates tailored to each subject's sparsity level and sample size. Furthermore, we develop hypothesis tests to assess the nullity and homogeneity of individual paths, using Wald-type test statistics constructed from individual debiased estimators. A test for the significance of the common paths can also be derived through the framework. Simulation studies under various heterogeneity scenarios and a real data application demonstrate the performance of the proposed method compared to existing benchmark across standard evaluation metrics.
제목: Joint modeling and inference of multiple-subject high-dimensional sparse vector autoregressive models
저자: Younghoon Kim (Cornell University), Zachary F. Fisher (University of North Carolina at Chapel Hill), Vladas Pipiras (University of North Carolina at Chapel Hill)
다중 피험자 벡터 자기회귀(multi-VAR) 모델은 개별 희소 VAR 전이 행렬을 공통 공유 경로와 피험자 특이적 경로로 분해하여 피험자 간의 이질적 네트워크 Granger 인과관계를 포착한다. 이 모델이 피험자 간 숨겨진 공유 및 고유 경로를 특성화하고 심리학 및 신경과학에서 일반적인 방법보다 우수한 성능을 보였음에도 불구하고, 가중 중앙값을 사용하여 공통 효과를 식별하는 방식은 통계적 효율성 문제를 가지고 있다. 공통 경로와 고유 경로의 수렴률이 가장 희소하지 않은 피험자와 모든 피험자 중 최소 표본 크기에 의해 결정되기 때문이다. 본 논문은 통신 효율적 데이터 통합 프레임워크를 기반으로 multi-VAR 모델의 새로운 식별 가능성 조건을 제시하여 각 피험자의 희소 수준과 표본 크기에 맞춘 수렴률을 달성한다. 또한 개별 경로의 영성(nullity)과 동질성을 평가하기 위한 가설 검정 프레임워크를 개발하였으며, 개별 비편향 추정기를 기반으로 구성된 Wald형 검정 통계량을 사용하고, 이 프레임워크를 통해 공통 경로 유의성 검정을 도출할 수 있다.