We present a new method for causal discovery in linear structural vector autoregressive models. We adapt an idea designed for independent observations to the case of time series while retaining its favorable properties, i.e., explicit error control for false causal discovery, at least asymptotically. We apply our method to several real-world bivariate time series datasets and discuss its findings which mostly agree with common understanding. The arrow of time in a model can be interpreted as background knowledge on possible causal mechanisms. Hence, our ideas could be extended to incorporating different background knowledge, even for independent observations.
- ID articolo: 2403.03778
- Titolo: Ancestor regression in structural vector autoregressive models
- Autori: Christoph Schultheiss, Markus Ulmer, Peter Bühlmann (ETH Zurigo)
- Classificazione: stat.ME (Statistica - Metodologia)
- Data di pubblicazione: 3 gennaio 2025 (versione arXiv)
- Link articolo: https://arxiv.org/abs/2403.03778
L'articolo propone un nuovo metodo per la scoperta causale nei modelli lineari vettoriali autoregressivi strutturali. Gli autori estendono il metodo di regressione degli antenati, originariamente progettato per osservazioni indipendenti, al caso delle serie temporali, mantenendo le sue proprietà favorevoli, ovvero il controllo esplicito degli errori nelle scoperte causali spurie (almeno in senso asintotico). Il metodo viene applicato a diversi dataset di serie temporali binarie del mondo reale, con risultati per lo più coerenti con la comprensione comune. La freccia temporale può essere interpretata come conoscenza di base di possibili meccanismi causali, pertanto questo approccio può essere esteso per incorporare diverse forme di conoscenza di base, anche per osservazioni indipendenti.
- Problema da risolvere: I dataset del mondo reale generalmente presentano strutture temporali che violano l'ipotesi di distribuzione identica indipendente ampiamente utilizzata nella scoperta causale. L'articolo mira ad affrontare il problema della scoperta causale nei modelli vettoriali autoregressivi strutturali (SVAR).
- Importanza del problema: I dati delle serie temporali sono molto comuni nelle applicazioni pratiche, ma i metodi tradizionali di scoperta causale sono principalmente progettati per osservazioni indipendenti. Sebbene la dipendenza temporale comporti difficoltà di stima, fornisce anche vantaggi: le variabili predittive non possono causalmente influenzare altre variabili in punti temporali precedenti.
- Limitazioni dei metodi esistenti:
- I metodi tradizionali come LiNGAM sono principalmente orientati alle osservazioni indipendenti
- Manca il controllo esplicito degli errori nella scoperta causale nelle serie temporali
- I metodi di estensione SVAR esistenti mancano di garanzie teoriche
- Motivazione della ricerca: Estendere il metodo di regressione degli antenati di Schultheiss e Bühlmann (2023) a serie temporali multivariate, mantenendo le garanzie asintotiche mentre si affronta la dipendenza temporale.
- Estensione del metodo: Estensione della regressione degli antenati da osservazioni indipendenti a modelli SVAR lineari, gestendo relazioni causali istantanee e ritardate
- Controllo degli errori: Fornitura di garanzie asintotiche di errore di tipo I, realizzando un controllo esplicito delle scoperte causali spurie
- Selezione dell'insieme di aggiustamento: Dimostrazione di come selezionare gli insiemi di aggiustamento corretti per diversi ritardi temporali al fine di ottenere il controllo degli errori
- Inferenza di rete: Proposizione di algoritmi per la costruzione di grafici di effetti istantanei e grafici temporali riassuntivi
- Verifica empirica: Validazione dell'efficacia del metodo su dataset del mondo reale
Data una serie temporale multivariata xt,j (t = 1,...,T; j = 1,...,d), l'obiettivo è identificare le relazioni causali ancestrali tra le variabili, inclusi gli effetti istantanei (τ=0) e gli effetti ritardati (τ>0).
Modello SVAR:
xt=∑τ=0pBτxt−τ+ϵt
Dove:
- B0 corrisponde agli effetti istantanei, assumendo una struttura aciclica
- Bτ (τ>0) sono le matrici degli effetti ritardati
- ϵt sono i termini di innovazione indipendenti
Forma equivalente:
xt=∑τ=1pB~τxt−τ+ξt
Idea centrale della regressione degli antenati:
Per una funzione non lineare f(·), utilizzare la regressione ai minimi quadrati:
f(ξt,jτ) versus ξt−τ
Dove ξt,jτ e ξt−τ sono i residui dopo aver proiettato i contributi dei punti temporali precedenti.
Teorema chiave 1: Per k ∉ AN_τ(j) (k non è un antenato ritardato di τ di j), si ha:
βkf,j,τ=E[zt−τ,kf(ξt,jτ)]/E[zt−τ,k2]=0
- Costruzione dei residui: Rimozione dell'influenza dei punti temporali precedenti attraverso la proiezione, migliorando il rapporto segnale-rumore
- Aggiustamento dei ritardi: Costruzione di insiemi di aggiustamento appropriati per diversi ritardi τ
- Teoria asintotica: Basata sulla dipendenza quasi-periodica per la normalità asintotica
- Inferenza di rete: Costruzione ricorsiva delle relazioni ancestrali, gestione del rilevamento di cicli
Dati simulati:
- Numero di variabili: d = 6, 10, 50
- Ordine SVAR: p = 1
- Dimensione del campione: 10² a 10⁶
- Distribuzioni degli errori: miscela di t₇, uniforme, Laplace, normale
- Pesi dei bordi: distribuzione uniforme, controllo del rapporto segnale-rumore
Dati reali:
- Geyser Old Faithful: tempo di attesa vs durata dell'eruzione (299 osservazioni)
- Forno a gas: velocità del gas di ingresso vs concentrazione di CO₂ in uscita (296 osservazioni)
- Prezzi dei latticini: prezzo del burro vs prezzo del formaggio cheddar (522 osservazioni)
- Family-wise error rate (FWER): tasso di errore familiare delle scoperte spurie
- Potenza: tasso di rilevamento delle relazioni causali vere
- Valore p: test di ipotesi basato sulla distribuzione normale asintotica
- Algoritmo LiNGAM (Hyvärinen et al., 2010)
- Confronto delle prestazioni con diverse dimensioni di campione e impostazioni di variabili latenti
- Funzione non lineare: f(x) = sign(x)|x|³
- Correzione della molteplicità: metodo Bonferroni-Holm
- Livello di significatività: α = 0,05
Esperimenti di simulazione:
- Per le variabili non ancestrali, la media della statistica z in valore assoluto è prossima alla media della distribuzione dell'ipotesi nulla teorica
- L'errore di tipo I è controllato per tutte le dimensioni di campione
- La potenza di rilevamento aumenta con l'aumento della dimensione del campione
- Il rilevamento degli antenati ritardati è più facile rispetto agli antenati istantanei (segnale più forte)
Inferenza di rete:
- Sia il grafico degli effetti istantanei che il grafico temporale riassuntivo realizzano una buona separazione tra ancestrale e non ancestrale
- La costruzione ricorsiva aiuta a rilevare gli effetti difficili da scoprire singolarmente
- Prestazioni quasi perfette con campioni di grandi dimensioni
Impatto delle variabili latenti:
- Perdita del controllo del livello predefinito degli errori quando le ipotesi vengono violate
- Tuttavia, mantiene comunque la separazione della dimensione dell'effetto tra ancestrale e non ancestrale
- L'ordinamento dei valori p può ancora indicare gli antenati veri
Diversi tipi di antenati:
- Effetti ritardati diretti (B~4,k=0): segnale più forte
- Antenati istantanei: segnale medio
- Antenati ritardati mediati attraverso effetti istantanei: segnale più debole
Geyser Old Faithful:
- Dati originali: nessun effetto istantaneo significativo rilevato
- Dopo l'aggiustamento temporale: rilevamento dell'effetto istantaneo durata dell'eruzione → tempo di attesa (p=5×10⁻⁴)
- Coerente con la conoscenza del dominio
Forno a gas:
- Nessun effetto istantaneo
- Rilevamento dell'effetto ritardato velocità del gas di ingresso → concentrazione di CO₂ in uscita (p=4×10⁻²⁰)
Prezzi dei latticini:
- Rilevamento dell'effetto ritardato burro → formaggio cheddar (p=5×10⁻¹⁵)
- Nessun effetto inverso rilevato, escludendo l'ipotesi di confondimento nascosto
- Il metodo mostra buone prestazioni con dimensioni di campione finite
- La conoscenza preliminare fornita dalla struttura temporale aiuta l'inferenza causale
- La costruzione ricorsiva migliora significativamente le prestazioni dell'inferenza di rete
- Presenta una certa robustezza alle violazioni delle ipotesi del modello
- Serie LiNGAM: Modello aciclico lineare non gaussiano di Shimizu et al. (2006) e sue estensioni a serie temporali
- Modelli causali strutturali: Modelli di equazioni strutturali ristretti di Peters et al. (2013)
- Regressione degli antenati: Metodo per osservazioni indipendenti di Schultheiss & Bühlmann (2023)
- Estende la regressione degli antenati all'impostazione delle serie temporali
- Capacità di identificazione simile alle estensioni SVAR di LiNGAM, ma con controllo degli errori
- Maggiore efficienza computazionale rispetto ai metodi tradizionali
- vs LiNGAM: Fornisce controllo degli errori interpretabile, ma potenza leggermente inferiore
- vs metodi tradizionali: Sfrutta la struttura temporale, evitando alcuni problemi di identificazione
- vs altri metodi SVAR: Garanzie teoriche più forti, implementazione più semplice
- Estensione riuscita della regressione degli antenati al modello SVAR
- Mantenimento delle eccellenti proprietà di controllo asintotico degli errori di tipo I
- Validazione dell'efficacia del metodo su dati simulati e reali
- Fornitura di un nuovo quadro teorico per la scoperta causale nelle serie temporali
- Ipotesi del modello: Richiede relazioni lineari e termini di innovazione indipendenti
- Aciclicità istantanea: Assume che gli effetti istantanei siano aciclici, il che potrebbe non essere realistico
- Rumore gaussiano: Sensibile al rumore gaussiano delle variabili adiacenti
- Variabili latenti: Perde il controllo degli errori in presenza di variabili non osservate
- Integrazione della conoscenza di base: Estensione a impostazioni di conoscenza di base più generali
- Estensione non lineare: Gestione di relazioni causali non lineari
- Ottimizzazione ad alta dimensionalità: Miglioramento dell'efficienza computazionale per serie temporali ad alta dimensionalità
- Aumento della robustezza: Metodi robusti alle violazioni delle ipotesi del modello
- Rigore teorico: Fornitura di analisi teorica asintotica completa e prove
- Innovazione metodologica: Sfruttamento intelligente della struttura temporale per l'inferenza causale
- Forte praticità: Calcolo semplice, facile da implementare
- Verifica sufficiente: Verifica completa su dati simulati e reali
- Scrittura chiara: Logica trasparente, espressione matematica accurata
- Ipotesi rigorose: Le ipotesi di linearità e indipendenza limitano l'ambito di applicazione
- Problema di potenza: In alcuni casi, la potenza è inferiore a LiNGAM
- Dati reali limitati: Validazione solo su serie temporali binarie
- Sfida ad alta dimensionalità: La correzione della molteplicità su larga scala è eccessivamente conservativa
- Contributo teorico: Fornitura di un nuovo quadro teorico per la scoperta causale nelle serie temporali
- Valore metodologico: Importante estensione della regressione degli antenati
- Valore pratico: Fornitura di strumenti per l'analisi pratica delle serie temporali
- Riproducibilità: Codice pubblico, risultati riproducibili
- Serie temporali economiche: Analisi delle relazioni causali tra variabili macroeconomiche
- Biomedica: Inferenza causale tra segnali fisiologici
- Ingegneria: Identificazione delle relazioni causali nei sistemi di controllo
- Scienze sociali: Analisi causale dinamica dei fenomeni sociali
- Schultheiss, C. and Bühlmann, P. (2023). Ancestor regression in linear structural equation models. Biometrika, 110(4):1117–1124.
- Shimizu, S., Hoyer, P. O., Hyvärinen, A., Kerminen, A., and Jordan, M. (2006). A linear non-gaussian acyclic model for causal discovery. Journal of Machine Learning Research, 7(10).
- Peters, J., Janzing, D., and Schölkopf, B. (2013). Causal inference on time series using restricted structural equation models. Advances in neural information processing systems, 26.
- Hyvärinen, A., Zhang, K., Shimizu, S., and Hoyer, P. O. (2010). Estimation of a structural vector autoregression model using non-gaussianity. Journal of Machine Learning Research, 11(5).
Valutazione complessiva: Questo è un articolo metodologico di alta qualità con importanti contributi sia a livello teorico che pratico. Gli autori hanno esteso con successo un importante metodo di scoperta causale all'impostazione delle serie temporali, mantenendo le eccellenti proprietà del metodo originale. Nonostante alcune limitazioni, fornisce strumenti e fondamenti teorici preziosi per il campo dell'inferenza causale nelle serie temporali.