Double Machine Learning for Static Panel Models with Fixed Effects
Clarke, Polselli
Recent advances in causal inference have seen the development of methods which make use of the predictive power of machine learning algorithms. In this paper, we develop novel double machine learning (DML) procedures for panel data in which these algorithms are used to approximate high-dimensional and nonlinear nuisance functions of the covariates. Our new procedures are extensions of the well-known correlated random effects, within-group and first-difference estimators from linear to nonlinear panel models, specifically, Robinson (1988)'s partially linear regression model with fixed effects and unspecified nonlinear confounding. Our simulation study assesses the performance of these procedures using different machine learning algorithms. We use our procedures to re-estimate the impact of minimum wage on voting behaviour in the UK. From our results, we recommend the use of first-differencing because it imposes the fewest constraints on the distribution of the fixed effects, and an ensemble learning strategy to ensure optimum estimator accuracy.
본 논문은 패널 데이터 분석을 위한 새로운 이중 기계학습(DML) 절차를 개발하였으며, 기계학습 알고리즘을 활용하여 공변량의 고차원 및 비선형 간섭 함수를 근사합니다. 새로운 절차는 선형 패널 모형의 상관 랜덤 효과, 집단 내, 일계 차분 추정량을 비선형 패널 모형으로 확장하며, 특히 고정효과와 명시되지 않은 비선형 혼동을 포함한 Robinson(1988)의 부분 선형 회귀 모형을 다룹니다. 시뮬레이션 연구는 다양한 기계학습 알고리즘을 사용한 이러한 절차들의 성능을 평가합니다. 저자들은 이러한 절차를 사용하여 영국 최저임금이 투표 행동에 미치는 영향을 재추정합니다. 결과는 고정효과 분포에 최소한의 제약을 부과하는 일계 차분 방법의 사용을 권장하며, 추정량의 최적 정확성을 보장하기 위해 앙상블 학습 전략을 채택할 것을 제안합니다.
전통적인 패널 데이터 분석은 주로 선형 모형 가정에 의존하지만, 현실의 데이터 생성 과정은 종종 복잡한 비선형 특성을 가집니다. 기존의 이중 기계학습 방법은 주로 횡단면 데이터를 대상으로 하며, 패널 데이터 적용은 상대적으로 제한적이며, 특히 고정효과를 포함한 비선형 패널 모형 처리 측면에서 그러합니다.
Chernozhukov, V., et al. (2018). Double/debiased machine learning for treatment and structural parameters. The Econometrics Journal.
Robinson, P. M. (1988). Root-n-consistent semiparametric regression. Econometrica.
Athey, S., & Imbens, G. (2016). Recursive partitioning for heterogeneous causal effects. PNAS.
Wooldridge, J. M. (2019). Correlated random effects models with unbalanced panels. Journal of Econometrics.
종합 평가: 이는 높은 수준의 계량경제학 방법론 논문으로, 이중 기계학습 프레임워크를 패널 데이터 설정으로 성공적으로 확장했습니다. 논문은 이론 발전, 방법 혁신, 실증 검증 측면에서 모두 우수한 성능을 보이며, 복잡한 패널 데이터 처리를 위한 중요한 도구를 제공합니다. 일부 기술적 세부사항에서 개선의 여지가 있지만, 해당 분야에 대한 기여는 상당합니다.