Local Causal Discovery for Statistically Efficient Causal Inference
Schubert, Claassen, Magliacane
Causal discovery methods can identify valid adjustment sets for causal effect estimation for a pair of target variables, even when the underlying causal graph is unknown. Global causal discovery methods focus on learning the whole causal graph and therefore enable the recovery of optimal adjustment sets, i.e., sets with the lowest asymptotic variance, but they quickly become computationally prohibitive as the number of variables grows. Local causal discovery methods offer a more scalable alternative by focusing on the local neighborhood of the target variables, but are restricted to statistically suboptimal adjustment sets. In this work, we propose Local Optimal Adjustments Discovery (LOAD), a sound and complete causal discovery approach that combines the computational efficiency of local methods with the statistical optimality of global methods. First, LOAD identifies the causal relation between the targets and tests if the causal effect is identifiable by using only local information. If it is identifiable, it then finds the optimal adjustment set by leveraging local causal discovery to infer the mediators and their parents. Otherwise, it returns the locally valid parent adjustment sets based on the learned local structure. In our experiments on synthetic and realistic data LOAD outperforms global methods in scalability, while providing more accurate effect estimation than local methods.
인과 발견 방법은 잠재적 인과 그래프가 미지의 상태에서도 목표 변수 쌍의 인과 효과 추정을 위한 유효한 조정 집합을 식별할 수 있습니다. 전역 인과 발견 방법은 전체 인과 그래프 학습에 중점을 두므로 최적 조정 집합(즉, 가장 낮은 점근 분산을 가진 집합)을 복구할 수 있지만, 변수 수의 증가에 따라 계산상 빠르게 감당할 수 없게 됩니다. 국소 인과 발견 방법은 목표 변수의 국소 이웃에 중점을 두어 더 확장 가능한 대안을 제공하지만, 통계적으로 차선의 조정 집합에만 제한됩니다. 본 연구에서 저자들은 국소 방법의 계산 효율성과 전역 방법의 통계적 최적성을 결합한 신뢰할 수 있고 완전한 인과 발견 방법인 국소 최적 조정 발견(LOAD)을 제안합니다.