2025-11-23T14:13:16.164537

Unbiased GNN Learning via Fairness-Aware Subgraph Diffusion

Alchihabi, Guo
Graph Neural Networks (GNNs) have demonstrated remarkable efficacy in tackling a wide array of graph-related tasks across diverse domains. However, a significant challenge lies in their propensity to generate biased predictions, particularly with respect to sensitive node attributes such as age and gender. These biases, inherent in many machine learning models, are amplified in GNNs due to the message-passing mechanism, which allows nodes to influence each other, rendering the task of making fair predictions notably challenging. This issue is particularly pertinent in critical domains where model fairness holds paramount importance. In this paper, we propose a novel generative Fairness-Aware Subgraph Diffusion (FASD) method for unbiased GNN learning. The method initiates by strategically sampling small subgraphs from the original large input graph, and then proceeds to conduct subgraph debiasing via generative fairness-aware graph diffusion processes based on stochastic differential equations (SDEs). To effectively diffuse unfairness in the input data, we introduce additional adversary bias perturbations to the subgraphs during the forward diffusion process, and train score-based models to predict these applied perturbations, enabling them to learn the underlying dynamics of the biases present in the data. Subsequently, the trained score-based models are utilized to further debias the original subgraph samples through the reverse diffusion process. Finally, FASD induces fair node predictions on the input graph by performing standard GNN learning on the debiased subgraphs. Experimental results demonstrate the superior performance of the proposed method over state-of-the-art Fair GNN baselines across multiple benchmark datasets.
academic

Unverzerrtes GNN-Lernen durch Fairness-bewusste Subgraph-Diffusion

Grundinformationen

  • Papier-ID: 2501.00595
  • Titel: Unbiased GNN Learning via Fairness-Aware Subgraph Diffusion
  • Autoren: Abdullah Alchihabi, Yuhong Guo (Carleton University)
  • Klassifizierung: cs.LG cs.AI
  • Veröffentlichungsdatum: 31. Dezember 2024 (arXiv-Preprint)
  • Papierlink: https://arxiv.org/abs/2501.00595

Zusammenfassung

Graphische neuronale Netze (GNNs) zeigen hervorragende Leistungen bei der Verarbeitung verschiedener graphbezogener Aufgaben, sind jedoch mit einer wichtigen Herausforderung konfrontiert: Sie neigen zu verzerrten Vorhersagen bei sensiblen Knotenattributen (wie Alter, Geschlecht). Da der Nachrichtenweitergabemechanismus Knoten gegenseitig beeinflusst, ist die Verzerrung in GNNs schwerwiegender als in traditionellen Modellen des maschinellen Lernens. Dieses Papier schlägt eine neuartige generative Fairness-bewusste Subgraph-Diffusions-(FASD-)Methode vor, um unverzerrtes GNN-Lernen zu erreichen. Die Methode sampelt zunächst strategisch kleine Subgraphen aus dem ursprünglichen großen Graphen, dann werden die Subgraphen durch einen generativen Fairness-bewussten Graphdiffusionsprozess basierend auf stochastischen Differentialgleichungen (SDEs) entzerrt. Durch die Einführung adversarialer Verzerrungsstörungen im Vorwärtsdiffusionsprozess wird ein Score-basiertes Modell trainiert, um diese Störungen vorherzusagen und dadurch die latente Dynamik der Verzerrung in den Daten zu lernen. Anschließend wird das trainierte Score-Modell durch den Rückwärtsdiffusionsprozess genutzt, um die ursprünglichen Subgraphproben zu entzerren. Abschließend wird das standardmäßige GNN-Lernen auf den entzerrten Subgraphen durchgeführt, um faire Knotenvorhersagen zu erzeugen.

Forschungshintergrund und Motivation

Problemdefinition

  1. Kernproblem: GNNs neigen bei Knotenklassifizierungsaufgaben zu verzerrten Vorhersagen basierend auf sensiblen Attributen (Alter, Geschlecht, Rasse usw.)
  2. Verzerrungsverstärkungsmechanismus: Der Nachrichtenweitergabemechanismus von GNNs führt dazu, dass sich Verzerrungen im Graphen ausbreiten und verstärken, was schwerwiegender ist als bei traditionellen ML-Modellen
  3. Anwendungsrelevanz: In kritischen Bereichen wie Gesundheitswesen und Bewerbungsbewertung ist Modellfairness von entscheidender Bedeutung

Einschränkungen bestehender Methoden

  1. Traditionelle Fairness-Lernmethoden: Berücksichtigen nicht die Graphstruktur und die Wechselwirkungen der Nachrichtenweitergabe zwischen Knoten
  2. Bestehende Fair-GNN-Methoden:
    • Vorverarbeitungsmethoden mangelt es an Robustheit und sind für spezifische Verzerrungsformen konzipiert
    • Verarbeitungsmethoden erfordern sorgfältige Abwägung zwischen Fairness und Genauigkeit mit schlechter Stabilität
    • Nachverarbeitungsmethoden modifizieren nur Vorhersageergebnisse
  3. Graphdiffusionsmethoden: Bestehende Methoden erben leicht Verzerrungen aus den Eingabedaten

Forschungsmotivation

Entwicklung datengesteuerter Fairness-bewusster Graphverbesserungs- und Lernmethoden, die auf diverse Anwendungsbereiche von GNNs anwendbar sind.

Kernbeiträge

  1. Bahnbrechende Methode: Vorschlag der ersten Fairness-bewussten Graphdiffusionsmethode FASD, die Diffusionsprozesse zur Entzerrung von Subgraphinstanzen nutzt und Fairness bei nachgelagerten Aufgaben fördert
  2. Technische Innovation: Integration adversarialer Verzerrungsstörungen in den SDE-basierten Vorwärtsdiffusionsprozess, wobei ein Score-Modell die Verzerrungsdynamik lernt
  3. Experimentelle Validierung: Demonstration überlegener Leistung gegenüber modernsten Fair-GNN-Baselines auf mehreren Benchmark-Datensätzen
  4. Theoretischer Beitrag: Bereitstellung eines theoretischen Rahmens und einer Implementierungslösung für Fairness-bewusste Graphdiffusion

Methodische Details

Aufgabendefinition

  • Eingabe: Graph G=(V,E), Knotenfeaturematrix X∈R^(N×D), Vektor sensibler Attribute S, Labelmatrix Y^ℓ
  • Ziel: Lernen eines GNN-Modells, das Knotenlabels genau und fair vorhersagen kann
  • Fairness-Kriterium: Gruppenfairness, bewertet mit statistischer Parität und Chancengleichheit

Modellarchitektur

1. Subgraph-Level-Instanzsampling

G^(i) = Subgraph_Sampling(G, u, d, k)
  • Sampling von k Nachbarn pro Sprung mit Tiefe d ab Startknoten u
  • Generierung einer Subgraphsammlung G = {G^(i)}_^M

2. Fairness-bewusste Vorwärtsdiffusion

SDE-Modellierung:

dG_t^(i) = f_t(G_t^(i))dt + g_t(G_t^(i))dw

Vorhersagemodell für sensitive Attribute:

Ŝ^(i) = g_sen(X^(i), A^(i))

Fairness-bewusste Störung:

X_t^(i) = μ_t(X_0^(i)) + σ_t(X_0^(i)) × ε_X - γ_X∇_X L_sen(X_0^(i), A_0^(i))
A_t^(i) = μ_t(A_0^(i)) + σ_t(A_0^(i)) × ε_A - γ_A∇_A L_sen(X_0^(i), A_0^(i))

3. Score-basierte Störungsschätzung

Knotenfeature-Score-Modell:

s_{θ,t}(G_t^(i)) = MLP_X([{H_j}_{j=0}^L])
H_{j+1} = GNN_X(H_j, A_t^(i)), H_0 = X_t^(i)

Graphstruktur-Score-Modell:

s_{φ,t}(G_t^(i)) = MLP_A([{GMH(H_j, (A_t^(i))^p)}_{j=0,p=1}^{K,P}])

Verlustfunktion:

L_θ = E_t{E_{G_0^(i)} E_{G_t^(i)|G_0^(i)} ||s_{θ,t}(G_t^(i)) - ε_X + (γ_X/σ_t(X_0^(i)))∇_X L_sen||_2^2}

4. Rückwärtsdiffusion-Entzerrung

Rückwärts-SDE:

dX_t^(i) = [f_{1,t}(X_t^(i)) - g_{1,t}^2 s_{θ,t}(G_t^(i))]dt̄ + g_{1,t}dw̄_1
dA_t^(i) = [f_{2,t}(A_t^(i)) - g_{2,t}^2 s_{φ,t}(G_t^(i))]dt̄ + g_{2,t}dw̄_2

Näherungslösung mit Predictor-Corrector-Sampler.

5. Faire Knotenklassifizierung

Training eines Standard-GNN auf entzerrten Subgraphen G̃:

P^(i) = f(X̃^(i), Ã^(i))
L = Σ_{G̃^(i)∈G̃} Σ_{u∈V_ℓ^(i)} ℓ_ce(P_u^(i), Y_u^ℓ)

Technische Innovationspunkte

  1. Fairness-bewusste Störungsgestaltung: Gradient der Verlustfunktion der sensiblen Attributvorhersage als adversariale Störung, direkte Modellierung von Verzerrungen
  2. Duales Score-Modell: Separate Modellierung von Störungen bei Knotenfeatures und Graphstruktur, erfasst komplexe Verzerrungsmuster
  3. Subgraph-Level-Verarbeitung: Subgraph-Sampling löst Rechenkomplexitätsprobleme großer Graphen
  4. Generative Entzerrung: Nutzt generative Fähigkeiten von Diffusionsmodellen für Datenebenen-Entzerrung

Experimentelle Einrichtung

Datensätze

  1. NBA: NBA-Spielerdaten, sensibles Attribut ist Nationalität, Label ist, ob Gehalt über Median liegt
  2. Pokec-z/Pokec-n: Slowakisches Soziales-Netzwerk-Daten, sensibles Attribut ist Region, Label ist Arbeitsbereich
  3. Datenteilung: NBA(20%/35%/45%), Pokec-z(10%/10%/80%), Pokec-n(10%/10%/80%)

Bewertungsmetriken

  1. Genauigkeit (Acc.): Klassifizierungsgenauigkeit
  2. Statistische Parität (ΔDP): |P(Ŷ=1|S=0) - P(Ŷ=1|S=1)|
  3. Chancengleichheit (ΔEO): |P(Ŷ=1|S=0,Y=1) - P(Ŷ=1|S=1,Y=1)|

Anmerkung: Kleinere ΔDP- und ΔEO-Werte zeigen bessere Fairness an

Vergleichsmethoden

  • Fair-GNN-Methoden: FairWalk, FairDrop, NIFTY, FairAug, Graphair
  • Graphkontrast-Lernmethoden: GRACE, GCA

Implementierungsdetails

  • Subgraph-Sampling: d=2(NBA), d=3(Pokec), k=10
  • Prädiktor für sensitive Attribute: 2-schichtiges GCN + 2-schichtige vollständig verbundene Schicht, verborgene Dimensionen (64,32,16)
  • Score-Modell: Verborgene Dimension 32, Training für 1000 Epochen
  • Rückwärtsdiffusionsschritte: N_steps=5(NBA), 4(Pokec-z), 2(Pokec-n)

Experimentelle Ergebnisse

Hauptergebnisse

DatensatzMethodeAcc.%ΔDP%ΔEO%
NBAFASD69.220.924.47
Graphair69.362.564.64
Pokec-zFASD66.152.281.96
Graphair68.172.102.76
Pokec-nFASD66.340.790.91
Graphair67.432.021.62

Wichtigste Erkenntnisse:

  1. Signifikante Fairness-Verbesserung: Bei Chancengleichheit werden auf Pokec-z und Pokec-n Verbesserungen von 29% bzw. 43% gegenüber dem zweiten Platz erreicht
  2. Führend bei statistischer Parität: Übertrifft den zweiten Platz auf NBA und Pokec-n um 64% bzw. 60%
  3. Genauigkeit bleibt erhalten: Während die Fairness signifikant verbessert wird, ist der Genauigkeitsverlust minimal

Ablationsstudie

VarianteNBA ΔDP%Pokec-z ΔDP%Pokec-n ΔDP%
FASD0.922.280.79
w/o Diffusion3.293.852.74
w/o Fairness3.104.811.74

Schlussfolgerungen der Ablationsstudie:

  1. Notwendigkeit des Diffusionsprozesses: Entfernen des Diffusionsprozesses führt zu signifikantem Fairness-Rückgang
  2. Wichtigkeit der Fairness-bewussten Störung: Verwendung nur zufälliger Störungen zeigt schlechte Ergebnisse

Sensitivitätsanalyse der Hyperparameter

  1. Rückwärtsdiffusionsschritte: Optimale Werte sind 2-5 Schritte, zu viele Schritte verschlechtern die Leistung
  2. Fairness-Störungsgewicht: λX, λA zeigen beste Ergebnisse im Bereich 0.1, 10.0

Verwandte Arbeiten

Fair-GNN-Lernen

  1. Vorverarbeitungsmethoden: FairWalk, FairDrop, Graphair usw., aber mangelnde Robustheit
  2. Verarbeitungsmethoden: NIFTY, FairAug usw., erfordern sorgfältige Abwägung zwischen Fairness und Genauigkeit
  3. Nachverarbeitungsmethoden: Direkte Modifizierung von GNN-Vorhersageergebnissen

Graphdiffusionsmethoden

  1. Kontinuierliche Diffusion: GDSS usw. basierend auf SDE-Modellierung
  2. Diskrete Diffusion: DiGress usw. mit Markov-Rauschprozessen
  3. Einschränkungen: Bestehende Methoden erben leicht Verzerrungen aus Eingabedaten

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. FASD wendet erfolgreich Diffusionsmodelle auf Fair-GNN-Lernen an und erreicht Datenebenen-Entzerrung
  2. Durch Fairness-bewusste Störungen und Score-Modelle werden Verzerrungsmuster effektiv gelernt und eliminiert
  3. Erreicht beste Fairness-Leistung auf mehreren Benchmark-Datensätzen, während wettbewerbsfähige Genauigkeit erhalten bleibt

Einschränkungen

  1. Rechenkomplexität: Erfordert Training mehrerer Modelle (Prädiktor für sensitive Attribute, Score-Modell, Klassifizierer)
  2. Hyperparameter-Sensitivität: Erfordert sorgfältige Anpassung von λX, λA und anderen Hyperparametern
  3. Binäre sensitive Attribute: Behandelt derzeit nur binäre sensitive Attribute, Erweiterung auf mehrere Kategorien erfordert weitere Forschung
  4. Subgraph-Repräsentation: Subgraph-Sampling kann globale Informationen verlieren

Zukünftige Richtungen

  1. Erweiterung auf mehrklassige sensitive Attribute und Multi-Label-Klassifizierung
  2. Verbesserung der Recheneffizienz und Reduzierung der Trainingskomplexität
  3. Erkundung der Anwendbarkeit anderer Fairness-Kriterien
  4. Theoretische Analyse der Konvergenz und Fairness-Garantien der Methode

Tiefgreifende Bewertung

Stärken

  1. Starke Methodennovation: Erste Anwendung von Diffusionsmodellen auf Fair-GNN-Lernen mit neuartigen Ideen
  2. Vernünftige technische Gestaltung: Fairness-bewusste Störungsgestaltung ist intuitiv und effektiv, Score-Modell-Architektur passt zu Graphdaten
  3. Umfangreiche Experimente: Multi-Datensatz-Validierung, vollständige Ablationsstudien und Hyperparameter-Analyse
  4. Überzeugende Ergebnisse: Signifikante Verbesserung der Fairness-Metriken mit klarer statistischer Signifikanz

Mängel

  1. Mangel an theoretischer Analyse: Keine Konvergenzbeweise oder theoretische Fairness-Garantien
  2. Recheneffizienzprobleme: Mehrstufiges Training erhöht Rechenkosten, Effizienzanalyse fehlt
  3. Anwendbarkeitsbeschränkungen: Validierung nur auf relativ kleinen Graphen, Skalierbarkeit auf großen Graphen unbekannt
  4. Unvollständige Vergleiche: Fehlende Vergleiche mit neuesten Fair-Learning-Methoden

Auswirkungen

  1. Akademischer Beitrag: Bietet neuen technischen Weg für Fair-GNN-Lernen
  2. Praktischer Wert: Wichtig in kritischen Anwendungsbereichen
  3. Reproduzierbarkeit: Detaillierte Implementierungsdetails fördern Reproduktion und Erweiterung

Anwendungsszenarien

  1. Mittelgroße bis kleine Graphen: Aktuelle Methode eignet sich für Graphen mit zehntausenden Knoten
  2. Hochanforderungs-Fairness-Bereiche: Medizin, Einstellung, Kreditvergabe und andere sensible Anwendungen
  3. Binäre Klassifizierungsaufgaben: Besonders bei Szenarien mit binären sensiblen Attributen

Literaturverzeichnis

Das Papier zitiert 61 verwandte Arbeiten, die wichtige Werke in mehreren Bereichen wie Fair Learning, Graphische neuronale Netze und Diffusionsmodelle abdecken und eine solide theoretische Grundlage für die Forschung bieten.


Gesamtbewertung: Dies ist eine innovative Arbeit im Bereich Fair-GNN-Lernen, die erstmals Diffusionsmodelle auf Graphdaten-Entzerrung anwendet. Die Methodengestaltung ist vernünftig und die experimentellen Ergebnisse überzeugend. Obwohl Verbesserungen in theoretischer Analyse und Recheneffizienz erforderlich sind, bietet die Arbeit wertvolle neue Ideen und technische Lösungen für das Feld.