Local Learning for Covariate Selection in Nonparametric Causal Effect Estimation with Latent Variables
Li, Guo, Xie et al.
Estimating causal effects from nonexperimental data is a fundamental problem in many fields of science. A key component of this task is selecting an appropriate set of covariates for confounding adjustment to avoid bias. Most existing methods for covariate selection often assume the absence of latent variables and rely on learning the global network structure among variables. However, identifying the global structure can be unnecessary and inefficient, especially when our primary interest lies in estimating the effect of a treatment variable on an outcome variable. To address this limitation, we propose a novel local learning approach for covariate selection in nonparametric causal effect estimation, which accounts for the presence of latent variables. Our approach leverages testable independence and dependence relationships among observed variables to identify a valid adjustment set for a target causal relationship, ensuring both soundness and completeness under standard assumptions. We validate the effectiveness of our algorithm through extensive experiments on both synthetic and real-world data.
비실험 데이터로부터 인과효과를 추정하는 것은 많은 과학 분야의 기본 문제이다. 이 작업의 핵심 요소는 편향을 피하기 위해 혼동 조정(confounding adjustment)을 위한 적절한 공변량 집합을 선택하는 것이다. 기존의 공변량 선택 방법들은 일반적으로 잠재변수가 없다고 가정하며, 변수 간의 전역 네트워크 구조 학습에 의존한다. 그러나 처리변수에서 결과변수로의 효과 추정에 주로 관심이 있을 때, 전역 구조를 파악하는 것은 불필요하고 비효율적일 수 있다. 이러한 한계를 해결하기 위해, 본 논문은 잠재변수가 존재하는 비모수적 인과효과 추정에서 공변량 선택을 위한 새로운 국소 학습 방법을 제안한다. 이 방법은 관측변수 간의 검증 가능한 독립성 및 종속성 관계를 활용하여 표준 가정 하에서 완전성과 정확성을 보장하면서 목표 인과관계의 유효한 조정 집합을 식별한다.
알고리즘 1: 국소 탐색 조정 집합 (Local Search Adjustment Sets, LSAS)
입력: 관측 데이터셋 D, 처리변수 X, 결과변수 Y
1: MB(X), MB(Y) ← Markov Blanket Discovery(X,Y,D)
2: Θ ← ∅ // 인과효과 추정값 초기화
3: for each S ∈ MB(X)\{Y}, each Z ⊆ MB(Y)\{X} do
4: if S와 Z가 규칙 R1을 만족하면
5: X가 Y에 미치는 인과효과 θ 추정, Θ ← θ // S1 시나리오
6: end if
7: if S와 Z가 규칙 R2를 만족하면
8: return Θ ← 0 // 인과효과 없음, S2 시나리오
9: end if
10: end for
출력: 추정된 인과효과 Θ // ∅이면 S3 시나리오