Unbiased GNN Learning via Fairness-Aware Subgraph Diffusion
Alchihabi, Guo
Graph Neural Networks (GNNs) have demonstrated remarkable efficacy in tackling a wide array of graph-related tasks across diverse domains. However, a significant challenge lies in their propensity to generate biased predictions, particularly with respect to sensitive node attributes such as age and gender. These biases, inherent in many machine learning models, are amplified in GNNs due to the message-passing mechanism, which allows nodes to influence each other, rendering the task of making fair predictions notably challenging. This issue is particularly pertinent in critical domains where model fairness holds paramount importance. In this paper, we propose a novel generative Fairness-Aware Subgraph Diffusion (FASD) method for unbiased GNN learning. The method initiates by strategically sampling small subgraphs from the original large input graph, and then proceeds to conduct subgraph debiasing via generative fairness-aware graph diffusion processes based on stochastic differential equations (SDEs). To effectively diffuse unfairness in the input data, we introduce additional adversary bias perturbations to the subgraphs during the forward diffusion process, and train score-based models to predict these applied perturbations, enabling them to learn the underlying dynamics of the biases present in the data. Subsequently, the trained score-based models are utilized to further debias the original subgraph samples through the reverse diffusion process. Finally, FASD induces fair node predictions on the input graph by performing standard GNN learning on the debiased subgraphs. Experimental results demonstrate the superior performance of the proposed method over state-of-the-art Fair GNN baselines across multiple benchmark datasets.
그래프 신경망(GNNs)은 다양한 그래프 관련 작업 처리에서 우수한 성능을 보이지만, 나이, 성별 등 민감한 노드 속성과 관련된 편향된 예측을 생성하는 중요한 과제에 직면해 있습니다. 메시지 전달 메커니즘으로 인해 노드가 상호 영향을 미치므로, GNNs의 편향은 전통적인 머신러닝 모델보다 더욱 심각합니다. 본 논문은 편향 없는 GNN 학습을 달성하기 위해 새로운 생성형 공정성 인식 부분그래프 확산(FASD) 방법을 제안합니다. 이 방법은 먼저 원본 대규모 그래프에서 전략적으로 작은 부분그래프를 샘플링한 후, 확률 미분 방정식(SDEs) 기반의 생성형 공정성 인식 그래프 확산 과정을 통해 부분그래프를 편향 제거합니다. 전방 확산 과정에서 대립적 편향 섭동을 도입하여 점수 기반 모델을 훈련시켜 이러한 섭동을 예측함으로써 데이터의 편향에 대한 잠재 동역학을 학습합니다. 그 후, 훈련된 점수 모델을 활용하여 역방향 확산 과정을 통해 원본 부분그래프 샘플을 편향 제거합니다. 마지막으로, 편향 제거된 부분그래프에서 표준 GNN 학습을 수행하여 공정한 노드 예측을 생성합니다.
논문은 공정성 학습, 그래프 신경망, 확산 모델 등 여러 분야의 중요한 연구 61편을 인용하여 연구에 견고한 이론적 기초를 제공합니다.
종합 평가: 이는 공정성 GNN 학습 분야에서 혁신적인 연구로, 확산 모델을 그래프 데이터 편향 제거에 처음 적용했으며, 방법 설계가 합리적이고 실험 결과가 설득력 있습니다. 이론적 분석과 계산 효율성 측면에서 개선의 여지가 있지만, 해당 분야에 가치 있는 새로운 사고방식과 기술 방안을 제공합니다.