Double Machine Learning for Static Panel Models with Fixed Effects
Clarke, Polselli
Recent advances in causal inference have seen the development of methods which make use of the predictive power of machine learning algorithms. In this paper, we develop novel double machine learning (DML) procedures for panel data in which these algorithms are used to approximate high-dimensional and nonlinear nuisance functions of the covariates. Our new procedures are extensions of the well-known correlated random effects, within-group and first-difference estimators from linear to nonlinear panel models, specifically, Robinson (1988)'s partially linear regression model with fixed effects and unspecified nonlinear confounding. Our simulation study assesses the performance of these procedures using different machine learning algorithms. We use our procedures to re-estimate the impact of minimum wage on voting behaviour in the UK. From our results, we recommend the use of first-differencing because it imposes the fewest constraints on the distribution of the fixed effects, and an ensemble learning strategy to ensure optimum estimator accuracy.
academic
Aprendizaje Automático Doble para Modelos de Panel Estático con Efectos Fijos
Este artículo desarrolla procedimientos novedosos de aprendizaje automático doble (DML) para análisis de datos de panel, utilizando algoritmos de aprendizaje automático para aproximar funciones de confusión de alta dimensionalidad y no lineales de covariables. Los nuevos procedimientos extienden los estimadores renombrados de efectos aleatorios correlacionados, intra-grupo y de primeras diferencias de modelos de panel lineales a modelos de panel no lineales, particularmente el modelo de regresión parcialmente lineal con efectos fijos y confusión no especificada de Robinson (1988). Estudios de simulación evalúan el desempeño de estos procedimientos utilizando diferentes algoritmos de aprendizaje automático. Los autores reestiman el impacto del salario mínimo del Reino Unido en el comportamiento electoral utilizando estos procedimientos. Los resultados sugieren utilizar el método de primeras diferencias, ya que impone las restricciones mínimas sobre la distribución de efectos fijos y adopta estrategias de aprendizaje conjunto para garantizar la precisión óptima del estimador.
El análisis tradicional de datos de panel se basa principalmente en supuestos de modelos lineales, pero los procesos de generación de datos en la realidad a menudo presentan características no lineales complejas. Los métodos DML existentes se orientan principalmente a datos transversales, con aplicaciones relativamente limitadas a datos de panel, particularmente en el manejo de modelos de panel no lineales con efectos fijos.
Necesidad Metodológica: Los datos de panel se utilizan ampliamente en investigación empírica, requiriendo métodos robustos que puedan manejar relaciones no lineales y covariables de alta dimensionalidad
Inferencia Causal: La estimación precisa de efectos causales en presencia de factores de confusión invariantes en el tiempo tiene importantes implicaciones políticas
Integración del Aprendizaje Automático: Combinar la capacidad predictiva del aprendizaje automático con el marco de inferencia causal de la econometría tradicional
Supuesto de Linealidad: Los métodos tradicionales de datos de panel asumen relaciones lineales, lo que puede conducir a especificación errónea del modelo
Dependencia de Escasez: Los métodos DML de panel existentes (como Klosin & Vilgalys, 2023; Semenova et al., 2023) dependen excesivamente de supuestos de funciones de alta dimensionalidad escasas
Limitaciones de Algoritmos: Se enfoca principalmente en algoritmos específicos como LASSO, careciendo de generalidad
Innovación Metodológica: Desarrollo de tres nuevos procedimientos DML que extienden los estimadores de efectos aleatorios correlacionados (CRE), intra-grupo (WG) y de primeras diferencias (FD) a configuraciones no lineales
Generalidad Técnica: No depende de supuestos previos de escasez, soporta múltiples algoritmos de aprendizaje automático (LASSO, CART, bosques aleatorios, impulso de gradiente)
Optimización Computacional: Adopta método de validación cruzada k-fold por bloques para manejar la autocorrelación serial en datos de panel
Aplicación Empírica: Proporciona reanálisis del efecto de la política de salario mínimo del Reino Unido, verificando la practicidad del método
Función de Puntuación Ortogonal de Neyman: Construcción de función de puntuación ortogonal aplicable a datos de panel:
ψ⊥(Wi;θ0,η0)=Vi⊥Σ0−1(Xi)ri
Validación Cruzada k-fold por Bloques: Asignación de series de tiempo completas de individuos al mismo pliegue, evitando problemas de autocorrelación serial
Estrategia de Aprendizaje de Funciones de Confusión:
Método de Aproximación: Q(l1(Xit))≈l1(Q(Xit))
Método Exacto: Aprendizaje directo de Δl1(Xit−1,Xit)=l1(Xit)−l1(Xit−1)
Método Híbrido: Combinación de ventajas de métodos CRE y de transformación
Supuesto de Homogeneidad: Enfoque principal en efectos de tratamiento homogéneo, extensión de heterogeneidad requiere modelado parametrizado
Problemas de Métodos Basados en Árboles: Métodos basados en árboles presentan dificultades en ajuste de hiperparámetros y distribución de muestreo no normal
Complejidad Computacional: Diccionario de alta dimensionalidad y validación cruzada aumentan carga computacional
Extensión de Heterogeneidad: Desarrollo de métodos enfocados en efectos promedio de tratamiento (ATE) en lugar de efectos promedio condicionales de tratamiento (CATE)
Panel Dinámico: Extensión a modelos de datos de panel dinámico
Datos Faltantes: Manejo de problemas de datos faltantes no aleatorios en datos de panel
Limitaciones de Métodos Basados en Árboles: Análisis insuficiente de métodos basados en árboles, estrategias de ajuste de hiperparámetros requieren mejora
Restricción de Heterogeneidad: Tratamiento relativamente simple de heterogeneidad de efectos de tratamiento, requiere marco más flexible
Alcance Empírico: Aplicación empírica limitada a caso único, carece de validación más amplia
Chernozhukov, V., et al. (2018). Double/debiased machine learning for treatment and structural parameters. The Econometrics Journal.
Robinson, P. M. (1988). Root-n-consistent semiparametric regression. Econometrica.
Athey, S., & Imbens, G. (2016). Recursive partitioning for heterogeneous causal effects. PNAS.
Wooldridge, J. M. (2019). Correlated random effects models with unbalanced panels. Journal of Econometrics.
Evaluación General: Este es un artículo de metodología econométrica de alta calidad que extiende exitosamente el marco de aprendizaje automático doble a configuraciones de datos de panel. El artículo demuestra excelencia en desarrollo teórico, innovación metodológica y verificación empírica, proporcionando herramientas importantes para el manejo de datos de panel complejos. Aunque hay espacio para mejora en ciertos detalles técnicos, su contribución al campo es significativa.