Double Machine Learning for Static Panel Models with Fixed Effects
Clarke, Polselli
Recent advances in causal inference have seen the development of methods which make use of the predictive power of machine learning algorithms. In this paper, we develop novel double machine learning (DML) procedures for panel data in which these algorithms are used to approximate high-dimensional and nonlinear nuisance functions of the covariates. Our new procedures are extensions of the well-known correlated random effects, within-group and first-difference estimators from linear to nonlinear panel models, specifically, Robinson (1988)'s partially linear regression model with fixed effects and unspecified nonlinear confounding. Our simulation study assesses the performance of these procedures using different machine learning algorithms. We use our procedures to re-estimate the impact of minimum wage on voting behaviour in the UK. From our results, we recommend the use of first-differencing because it imposes the fewest constraints on the distribution of the fixed effects, and an ensemble learning strategy to ensure optimum estimator accuracy.
academic
Double Machine Learning per Modelli di Panel Statici con Effetti Fissi
Questo articolo sviluppa nuove procedure di Double Machine Learning (DML) per l'analisi di dati panel, utilizzando algoritmi di machine learning per approssimare funzioni di disturbo ad alta dimensionalità e non lineari delle covariate. Le nuove procedure estendono i noti stimatori di effetti casuali correlati, within-group e differenze prime dai modelli panel lineari a modelli panel non lineari, in particolare il modello di regressione parzialmente lineare con effetti fissi e confondimento non specificato di Robinson (1988). Studi di simulazione valutano le prestazioni di queste procedure utilizzando diversi algoritmi di machine learning. Gli autori riesaminano l'effetto del salario minimo britannico sul comportamento di voto utilizzando queste procedure. I risultati suggeriscono l'utilizzo del metodo delle differenze prime poiché impone i minori vincoli sulla distribuzione degli effetti fissi, e l'adozione di strategie di ensemble learning per garantire l'accuratezza ottimale dello stimatore.
L'analisi tradizionale di dati panel si basa principalmente su assunzioni di modelli lineari, ma i processi di generazione dei dati nel mondo reale spesso presentano caratteristiche non lineari complesse. I metodi DML esistenti sono principalmente orientati ai dati trasversali, con applicazioni relativamente limitate ai dati panel, in particolare nel trattamento di modelli panel non lineari con effetti fissi.
Esigenza Metodologica: I dati panel sono ampiamente utilizzati nella ricerca empirica, richiedendo metodi robusti in grado di gestire relazioni non lineari e covariate ad alta dimensionalità
Inferenza Causale: La stima accurata degli effetti causali in presenza di fattori confondenti invarianti nel tempo ha importanti implicazioni politiche
Integrazione del Machine Learning: Combinare la capacità predittiva del machine learning con il framework di inferenza causale dell'econometria tradizionale
Assunzione di Linearità: I metodi tradizionali di dati panel assumono relazioni lineari, che possono portare a errori di specificazione del modello
Dipendenza dalla Sparsità: I metodi DML panel esistenti (come Klosin & Vilgalys, 2023; Semenova et al., 2023) dipendono eccessivamente da assunzioni di funzioni sparse ad alta dimensionalità
Limitazioni Algoritmiche: Focalizzati principalmente su algoritmi specifici come LASSO, mancano di generalità
Innovazione Metodologica: Sviluppo di tre nuove procedure DML che estendono gli stimatori di effetti casuali correlati (CRE), within-group (WG) e differenze prime (FD) a contesti non lineari
Generalità Tecnica: Non dipendente da assunzioni di sparsità preliminari, supporta molteplici algoritmi di machine learning (LASSO, CART, Random Forest, Gradient Boosting)
Ottimizzazione Computazionale: Adozione del metodo di cross-fitting k-fold a blocchi per gestire l'autocorrelazione seriale nei dati panel
Applicazione Empirica: Fornisce una rianalissi dell'effetto della politica del salario minimo britannico, verificando l'applicabilità pratica del metodo
Funzione di Punteggio Ortogonale di Neyman: Costruzione di una funzione di punteggio ortogonale applicabile ai dati panel:
ψ⊥(Wi;θ0,η0)=Vi⊥Σ0−1(Xi)ri
Cross-Fitting k-Fold a Blocchi: Assegnazione dell'intera serie temporale individuale allo stesso fold, evitando problemi di autocorrelazione seriale
Strategie di Apprendimento delle Funzioni di Disturbo:
Metodo Approssimativo: Q(l1(Xit))≈l1(Q(Xit))
Metodo Esatto: Apprendimento diretto di Δl1(Xit−1,Xit)=l1(Xit)−l1(Xit−1)
Metodo Ibrido: Combinazione dei vantaggi di CRE e metodi di trasformazione
Raccomandazione Metodologica: Raccomandazione dell'utilizzo del metodo FD (esatto) poiché impone i minori vincoli sulla distribuzione degli effetti fissi
Strategia Algoritmica: Suggerimento dell'adozione di strategie di ensemble learning, combinando i vantaggi di molteplici algoritmi
Valore Pratico: Il metodo è applicabile a panel non bilanciati, con forte estensibilità
Assunzione di Omogeneità: Focalizzazione principale su effetti di trattamento omogenei, l'estensione all'eterogeneità richiede modellazione parametrica
Problemi dei Metodi Basati su Alberi: I metodi basati su alberi presentano difficoltà nell'ottimizzazione degli iperparametri e distribuzioni di campionamento non normali
Complessità Computazionale: I dizionari ad alta dimensionalità e il cross-fitting aumentano l'onere computazionale
Estensione dell'Eterogeneità: Sviluppo di metodi orientati all'effetto medio di trattamento (ATE) piuttosto che all'effetto medio di trattamento condizionato (CATE)
Panel Dinamici: Estensione a modelli di dati panel dinamici
Dati Mancanti: Gestione della non-casualità della mancanza nei dati panel
Limitazioni dei Metodi Basati su Alberi: L'analisi dei metodi basati su alberi non è sufficientemente approfondita, le strategie di ottimizzazione degli iperparametri necessitano di miglioramenti
Restrizioni sull'Eterogeneità: Il trattamento dell'eterogeneità degli effetti di trattamento è relativamente semplice, richiedendo un framework più flessibile
Portata Empirica: Le applicazioni empiriche sono limitate a un singolo caso, mancano validazioni più ampie
Chernozhukov, V., et al. (2018). Double/debiased machine learning for treatment and structural parameters. The Econometrics Journal.
Robinson, P. M. (1988). Root-n-consistent semiparametric regression. Econometrica.
Athey, S., & Imbens, G. (2016). Recursive partitioning for heterogeneous causal effects. PNAS.
Wooldridge, J. M. (2019). Correlated random effects models with unbalanced panels. Journal of Econometrics.
Valutazione Complessiva: Questo è un articolo metodologico di econometria di alta qualità che estende con successo il framework di Double Machine Learning ai dati panel. L'articolo dimostra eccellenza nello sviluppo teorico, nell'innovazione metodologica e nella verifica empirica, fornendo strumenti importanti per il trattamento di dati panel complessi. Sebbene vi sia spazio per miglioramenti in alcuni dettagli tecnici, il contributo del lavoro al campo è significativo.