We present a new method for causal discovery in linear structural vector autoregressive models. We adapt an idea designed for independent observations to the case of time series while retaining its favorable properties, i.e., explicit error control for false causal discovery, at least asymptotically. We apply our method to several real-world bivariate time series datasets and discuss its findings which mostly agree with common understanding. The arrow of time in a model can be interpreted as background knowledge on possible causal mechanisms. Hence, our ideas could be extended to incorporating different background knowledge, even for independent observations.
- ID del Artículo: 2403.03778
- Título: Ancestor regression in structural vector autoregressive models
- Autores: Christoph Schultheiss, Markus Ulmer, Peter Bühlmann (ETH Zürich)
- Clasificación: stat.ME (Estadística - Metodología)
- Fecha de Publicación: 3 de enero de 2025 (versión arXiv)
- Enlace del Artículo: https://arxiv.org/abs/2403.03778
Este artículo propone un nuevo método para el descubrimiento causal en modelos lineales autorregresivos vectoriales estructurales. Los autores extienden el método de regresión de ancestros, originalmente diseñado para observaciones independientes, al caso de series temporales, manteniendo sus propiedades ventajosas, es decir, control explícito de errores en el descubrimiento causal espurio (al menos en sentido asintótico). El método se aplica a múltiples conjuntos de datos de series temporales bivariadas del mundo real, con resultados que en su mayoría son consistentes con la comprensión del sentido común. La flecha temporal puede interpretarse como conocimiento previo de posibles mecanismos causales, por lo que este enfoque puede extenderse para incorporar diferentes tipos de conocimiento previo, e incluso aplicarse a observaciones independientes.
- Problema a Resolver: Los conjuntos de datos del mundo real típicamente poseen estructura temporal, violando el supuesto de distribución idéntica e independiente ampliamente utilizado en descubrimiento causal. Este artículo aborda el problema del descubrimiento causal en modelos autorregresivos vectoriales estructurales (SVAR).
- Importancia del Problema: Los datos de series temporales son muy comunes en aplicaciones prácticas, pero los métodos tradicionales de descubrimiento causal se diseñan principalmente para observaciones independientes. Aunque la dependencia temporal introduce dificultades de estimación, también proporciona una ventaja: las variables predictoras no pueden causar efectos causales en otras variables en puntos temporales anteriores.
- Limitaciones de Métodos Existentes:
- Los métodos tradicionales como LiNGAM se orientan principalmente a observaciones independientes
- Falta control explícito de errores para descubrimiento causal en series temporales
- Los métodos de extensión SVAR existentes carecen de garantías teóricas
- Motivación de la Investigación: Extender el método de regresión de ancestros de Schultheiss y Bühlmann (2023) a series temporales multivariadas, manteniendo sus garantías asintóticas mientras se maneja la dependencia temporal.
- Extensión del Método: Extender la regresión de ancestros de observaciones independientes a modelos SVAR lineales, manejando relaciones causales instantáneas y rezagadas
- Control de Errores: Proporcionar garantías asintóticas de error tipo I, logrando control explícito del descubrimiento causal espurio
- Selección de Conjuntos de Ajuste: Demostrar cómo seleccionar conjuntos de ajuste apropiados para diferentes rezagos temporales para obtener control de errores
- Inferencia de Redes: Proponer algoritmos para construir gráficos de efectos instantáneos y gráficos temporales resumidos
- Validación Empírica: Verificar la efectividad del método en conjuntos de datos del mundo real
Dado una serie temporal multivariada xt,j (t = 1,...,T; j = 1,...,d), el objetivo es identificar relaciones causales de ancestros entre variables, incluyendo efectos instantáneos (τ=0) y efectos rezagados (τ>0).
Modelo SVAR:
xt=∑τ=0pBτxt−τ+ϵt
Donde:
- B0 corresponde a efectos instantáneos, asumido como estructura acíclica
- Bτ (τ>0) son matrices de efectos rezagados
- ϵt son términos de innovación independientes
Forma Equivalente:
xt=∑τ=1pB~τxt−τ+ξt
Idea Central de Regresión de Ancestros:
Para una función no lineal f(·), utilizar regresión de mínimos cuadrados:
f(ξt,jτ) versus ξt−τ
Donde ξt,jτ y ξt−τ son residuos después de proyectar las contribuciones de puntos temporales anteriores.
Teorema Clave 1: Para k ∉ AN_τ(j) (k no es un ancestro rezagado τ de j), se tiene:
βkf,j,τ=E[zt−τ,kf(ξt,jτ)]/E[zt−τ,k2]=0
- Construcción de Residuos: Eliminar influencias de puntos temporales anteriores mediante proyección, mejorando la relación señal-ruido
- Ajuste de Rezagos: Construir conjuntos de ajuste apropiados para diferentes rezagos τ
- Teoría Asintótica: Establecer normalidad asintótica basada en dependencia cercana a periódica
- Inferencia de Redes: Construcción recursiva de relaciones de ancestros, manejando detección de ciclos
Datos Simulados:
- Número de variables: d = 6, 10, 50
- Orden SVAR: p = 1
- Tamaño de muestra: 10² a 10⁶
- Distribuciones de error: mezcla de t₇, uniforme, Laplace y normal
- Pesos de aristas: distribución uniforme, controlando relación señal-ruido
Datos Reales:
- Géiser Old Faithful: tiempo de espera vs duración de erupción (299 observaciones)
- Horno de Gas: velocidad de gas de entrada vs concentración de CO₂ de salida (296 observaciones)
- Precios de Productos Lácteos: precio de mantequilla vs precio de queso cheddar (522 observaciones)
- Family-wise error rate (FWER): tasa de error familiar en descubrimientos espurios
- Potencia: tasa de detección de relaciones causales verdaderas
- Valor p: prueba de hipótesis basada en distribución normal asintótica
- Algoritmo LiNGAM (Hyvärinen et al., 2010)
- Comparación de rendimiento bajo diferentes tamaños de muestra y configuraciones de variables latentes
- Función no lineal: f(x) = sign(x)|x|³
- Corrección de multiplicidad: método Bonferroni-Holm
- Nivel de significancia: α = 0.05
Experimentos Simulados:
- Para variables no ancestrales, la magnitud absoluta promedio de estadísticas z se aproxima a la media de la distribución de hipótesis nula teórica
- El error tipo I se controla en todos los tamaños de muestra
- La potencia de detección aumenta con el tamaño de muestra
- La detección de ancestros rezagados es más fácil que la de ancestros instantáneos (señal más fuerte)
Inferencia de Redes:
- Tanto gráficos de efectos instantáneos como gráficos temporales resumidos logran buena separación ancestro-no ancestro
- La construcción recursiva ayuda a detectar efectos difíciles de encontrar individualmente
- Rendimiento casi perfecto en muestras grandes
Impacto de Variables Latentes:
- Se pierde el control de nivel predeterminado cuando se violan supuestos
- Pero aún se mantiene la separación de magnitudes de efectos entre ancestros y no ancestros
- El ordenamiento de valores p aún indica ancestros verdaderos
Diferentes Tipos de Ancestros:
- Efectos rezagados directos (B~4,k=0): señal más fuerte
- Ancestros instantáneos: señal moderada
- Ancestros rezagados mediados por efectos instantáneos: señal más débil
Géiser Old Faithful:
- Datos originales: sin efectos instantáneos significativos detectados
- Después de ajuste temporal: detección de efecto instantáneo duración de erupción → tiempo de espera (p=5×10⁻⁴)
- Consistente con conocimiento del dominio
Horno de Gas:
- Sin efectos instantáneos
- Detección de efecto rezagado velocidad de gas de entrada → concentración de CO₂ de salida (p=4×10⁻²⁰)
Precios de Productos Lácteos:
- Detección de efecto rezagado mantequilla → queso cheddar (p=5×10⁻¹⁵)
- Sin efecto inverso detectado, descartando hipótesis de confusión oculta
- El método muestra buen rendimiento en muestras finitas
- El conocimiento previo proporcionado por la estructura temporal ayuda en la inferencia causal
- La construcción recursiva mejora significativamente el rendimiento de inferencia de redes
- Cierta robustez ante violaciones de supuestos del modelo
- Serie LiNGAM: Modelo acíclico no gaussiano lineal de Shimizu et al. (2006) y sus extensiones a series temporales
- Modelos Causales Estructurales: Modelos de ecuaciones estructurales restringidas de Peters et al. (2013)
- Regresión de Ancestros: Método para observaciones independientes de Schultheiss & Bühlmann (2023)
- Extiende la regresión de ancestros al contexto de series temporales
- Capacidad de identificación similar a extensiones SVAR de LiNGAM, pero con control de errores
- Mayor eficiencia computacional comparada con métodos tradicionales
- vs LiNGAM: Proporciona control de errores interpretable, pero potencia ligeramente menor
- vs Métodos Tradicionales: Aprovecha estructura temporal, evita ciertos problemas de identificación
- vs Otros Métodos SVAR: Garantías teóricas más fuertes, implementación más simple
- Extensión exitosa de regresión de ancestros a modelos SVAR
- Mantiene las propiedades ventajosas de control asintótico de error tipo I
- Validación de efectividad del método en datos simulados y reales
- Proporciona nuevo marco teórico para descubrimiento causal en series temporales
- Supuestos del Modelo: Requiere relaciones lineales y términos de innovación independientes
- Aciclicidad Instantánea: Asume que efectos instantáneos son acíclicos, lo que puede no ser realista
- Ruido Gaussiano: Sensible al ruido gaussiano en variables adyacentes
- Variables Latentes: Pierde control de errores cuando existen variables no observadas
- Integración de Conocimiento Previo: Extensión a configuraciones de conocimiento previo más general
- Extensión No Lineal: Manejo de relaciones causales no lineales
- Optimización de Alta Dimensión: Mejora de eficiencia computacional para series temporales de alta dimensión
- Mejora de Robustez: Métodos robustos ante violaciones de supuestos del modelo
- Rigor Teórico: Análisis teórico asintótico completo y pruebas rigurosas
- Innovación Metodológica: Aprovechamiento ingenioso de la estructura temporal para inferencia causal
- Practicidad: Cálculo simple, fácil de implementar
- Validación Suficiente: Validación exhaustiva mediante simulaciones y datos reales
- Escritura Clara: Lógica clara, expresión matemática precisa
- Supuestos Estrictos: Supuestos de linealidad e independencia limitan el rango de aplicabilidad
- Problema de Potencia: Potencia menor que LiNGAM en algunos casos
- Datos Reales Limitados: Validación solo en series temporales bivariadas
- Desafío de Alta Dimensión: Corrección de multiplicidad demasiado conservadora para redes a gran escala
- Contribución Teórica: Proporciona nuevo marco teórico para descubrimiento causal en series temporales
- Valor Metodológico: Extensión importante de regresión de ancestros
- Valor Práctico: Proporciona herramientas para análisis de series temporales reales
- Reproducibilidad: Código público, resultados reproducibles
- Series Temporales Económicas: Análisis de relaciones causales entre variables macroeconómicas
- Biomedicina: Inferencia causal entre señales fisiológicas
- Sistemas de Ingeniería: Identificación de relaciones causales en sistemas de control
- Ciencias Sociales: Análisis causal dinámico de fenómenos sociales
- Schultheiss, C. and Bühlmann, P. (2023). Ancestor regression in linear structural equation models. Biometrika, 110(4):1117–1124.
- Shimizu, S., Hoyer, P. O., Hyvärinen, A., Kerminen, A., and Jordan, M. (2006). A linear non-gaussian acyclic model for causal discovery. Journal of Machine Learning Research, 7(10).
- Peters, J., Janzing, D., and Schölkopf, B. (2013). Causal inference on time series using restricted structural equation models. Advances in neural information processing systems, 26.
- Hyvärinen, A., Zhang, K., Shimizu, S., and Hoyer, P. O. (2010). Estimation of a structural vector autoregression model using non-gaussianity. Journal of Machine Learning Research, 11(5).
Evaluación General: Este es un artículo de metodología de alta calidad con contribuciones importantes tanto en teoría como en práctica. Los autores extienden exitosamente un método importante de descubrimiento causal al contexto de series temporales, manteniendo las propiedades ventajosas del método original. A pesar de algunas limitaciones, proporciona herramientas y bases teóricas valiosas para el campo de la inferencia causal en series temporales.