2025-11-24T14:22:17.661777

Robust Causal Discovery in Real-World Time Series with Power-Laws

Tusoni, Masi, Coletta et al.

Exploring causal relationships in stochastic time series is a challenging yet crucial task with a vast range of applications, including finance, economics, neuroscience, and climate science. Many algorithms for Causal Discovery (CD) have been proposed, but they often exhibit a high sensitivity to noise, resulting in misleading causal inferences when applied to real data. In this paper, we observe that the frequency spectra of typical real-world time series follow a power-law distribution, notably due to an inherent self-organizing behavior. Leveraging this insight, we build a robust CD method based on the extraction of power -law spectral features that amplify genuine causal signals. Our method consistently outperforms state-of-the-art alternatives on both synthetic benchmarks and real-world datasets with known causal structures, demonstrating its robustness and practical relevance.

academic

Robust Causal Discovery in Real-World Time Series with Power-Laws

基本信息

论文ID: 2507.12257
标题: Robust Causal Discovery in Real-World Time Series with Power-Laws
作者: Matteo Tusoni, Giuseppe Masi, Andrea Coletta, Aldo Glielmo, Viviana Arrigoni, Novella Bartolini
分类: cs.LG physics.data-an stat.ML stat.OT
发表时间: 2025年10月12日 (arXiv v2)
论文链接: https://arxiv.org/abs/2507.12257

摘要

探索随机时间序列中的因果关系是一项具有挑战性但至关重要的任务，在金融、经济、神经科学和气候科学等领域有着广泛的应用。尽管已有许多因果发现(CD)算法被提出，但它们往往对噪声高度敏感，在应用于真实数据时容易产生误导性的因果推断。本文观察到典型真实世界时间序列的频谱遵循幂律分布，这主要由于其固有的自组织行为。基于这一洞察，我们构建了一种基于幂律谱特征提取的鲁棒因果发现方法，该方法能够放大真实的因果信号。我们的方法在合成基准和具有已知因果结构的真实世界数据集上始终优于最先进的替代方法，展现了其鲁棒性和实用相关性。

研究背景与动机

问题定义

本研究致力于解决时间序列数据中的因果发现问题，即从观测数据中识别变量间的因果关系。传统的因果发现方法，特别是基于Granger因果的方法，在面对真实世界的复杂数据时表现出以下局限性：

噪声敏感性：传统方法对非高斯噪声、非平稳性和非线性扰动高度敏感
假设限制：依赖于噪声平稳性和单一特征尺度等严格假设
虚假关系检测：容易将噪声相关性误认为因果关系

研究动机

作者观察到真实世界系统普遍展现出幂律频谱特性，这源于：

多个相互作用单元的自组织行为
缺乏外部协调器导致的尺度不变性
系统的分形特性和长程时间相关性

基于这一观察，本文提出利用幂律谱特征进行更鲁棒的因果发现。

核心贡献

提出PLaCy框架：一种新颖的基于幂律谱特征的因果发现方法
理论保证：证明了频域变换下因果图结构的不变性（定理1）
实验验证：在合成和真实数据集上全面评估，展现出优越的鲁棒性
方法通用性：展示了谱预处理对其他因果发现算法的改进效果

方法详解

任务定义

给定多变量时间序列 $x \in \mathbb{R}^{L \times d}$ ，目标是推断有向图 $G = (V, E)$ ，其中：

$V = \{1, 2, ..., d\}$ 表示系统变量
$E \subseteq V \times V$ 表示因果边集合
有向边 $(i,j)$ 存在当且仅当 $x_i$ 是 $x_j$ 的因果原因

模型架构

1. 滑动窗口分割

将每个时间序列分割为长度为 $l$ 的重叠窗口，步长为 $s$ ： $w_i^k = (x_i(k \cdot s), ..., x_i(k \cdot s + l - 1))$

2. 谱特征提取

对每个窗口应用离散傅里叶变换： $\phi(k) = \sum_{t=0}^{L-1} x(t) e^{-i2\pi k t/L}$

计算谱幅度： $A(f_k) = |\phi(k)|$

3. 幂律拟合

在对数-对数空间中拟合线性模型： $\log A(f) = a - \lambda \log f$

其中 $a$ 是截距参数， $\lambda > 0$ 是谱指数。

4. 因果分析

对提取的谱参数时间序列 $(a_i, \lambda_i)$ 应用多变量Granger因果测试，评估 $(\lambda_i, a_i)$ 对 $\lambda_j$ 的预测能力。

算法流程 (PLaCy)

输入: 时间序列 x = (x₁, ..., xₐ)，窗口大小 l，步长 s
输出: 因果图 G

1. 将每个 xᵢ 分割为 ⌊(L-l)/s⌋+1 个滑动窗口 wᵢᵏ
2. for each i ∈ {1, ..., d} do
3.   for each k ∈ {0, ..., ⌊(L-l)/s⌋} do
4.     对 wᵢᵏ 应用 DFT 得到 φᵢᵏ
5.     通过方程(2)的拟合得到 (aᵢᵏ, λᵢᵏ)
6.   连接 (aᵢᵏ, λᵢᵏ) 得到时间序列 (aᵢ, λᵢ)
7. for each i,j ∈ {1, ..., d}, i ≠ j do
8.   Gᵢ,ⱼ ← Granger因果测试，以(aᵢ,λᵢ)为原因，λⱼ为结果
9. return G

技术创新点

频域因果发现：首次系统性地利用幂律谱特征进行因果推断
自适应窗口选择：通过p值准则自动选择最优窗口长度
噪声鲁棒性：谱拟合作为天然的去噪步骤，提高对非高斯波动的鲁棒性
理论基础：提供了谱变换下因果图不变性的理论证明

实验设置

数据集

合成数据集

基于广义Ornstein-Uhlenbeck过程生成四种场景： $x(t+\Delta t) = x(t) + \frac{\Delta t}{\tau_c}(\mu - x(t)) + (\sigma_b \epsilon_b(t) + \sigma_g^a \epsilon_g^a(t) + \sigma_g^m \epsilon_g^m(t) \cdot x(t))\sqrt{\Delta t}$

OU( $\sigma_g^m = 0$ ): 无乘性噪声的平衡态
OU( $\sigma_g^m > 0$ ): 有乘性噪声的平衡态
ÔU( $\sigma_g^m = 0$ ): 无乘性噪声的非平衡态
ÔU( $\sigma_g^m > 0$ ): 有乘性噪声的非平衡态

真实数据集

Rivers数据集：德国南部三个水文站的河流水位和降水数据
AirQuality数据集：中国多个城市的PM2.5污染监测数据

评价指标

F1分数：衡量因果关系识别的整体性能
真负率(TNR)：评估算法排除虚假关联的能力

对比方法

传统方法：Granger Causality, PCMCI, PCMCIΩ
优化方法：DYNOTEARS, RCV-VarLiNGAM
深度学习：Rhino
非线性方法：CCM-Filtering
频域方法：BCGeweke, DTF, GewekeNP

实现细节

滑动窗口长度： $l = 50$ （通过p值准则选择）
步长： $s = 1$
滞后项：10个
统计显著性阈值： $p = 0.05$

实验结果

主要结果

在合成数据集上的表现（N=5, $\sigma_g^a = 1.0$ ）：

数据集	PLaCy F1	最佳基线 F1	PLaCy TNR	最佳基线 TNR
OU( $\sigma_g^m = 0$ )	0.77±0.17	0.61±0.18	0.94±0.05	0.99±0.02
OU( $\sigma_g^m > 0$ )	0.80±0.17	0.79±0.11	0.94±0.06	0.98±0.03
ÔU( $\sigma_g^m = 0$ )	0.70±0.17	0.58±0.18	0.88±0.09	0.99±0.02
ÔU( $\sigma_g^m > 0$ )	0.80±0.17	0.71±0.13	0.93±0.07	0.98±0.03