Multi-View Graph Feature Propagation for Privacy Preservation and Feature Sparsity
Harari, Unger
Graph Neural Networks (GNNs) have demonstrated remarkable success in node classification tasks over relational data, yet their effectiveness often depends on the availability of complete node features. In many real-world scenarios, however, feature matrices are highly sparse or contain sensitive information, leading to degraded performance and increased privacy risks. Furthermore, direct exposure of information can result in unintended data leakage, enabling adversaries to infer sensitive information. To address these challenges, we propose a novel Multi-view Feature Propagation (MFP) framework that enhances node classification under feature sparsity while promoting privacy preservation. MFP extends traditional Feature Propagation (FP) by dividing the available features into multiple Gaussian-noised views, each propagating information independently through the graph topology. The aggregated representations yield expressive and robust node embeddings. This framework is novel in two respects: it introduces a mechanism that improves robustness under extreme sparsity, and it provides a principled way to balance utility with privacy. Extensive experiments conducted on graph datasets demonstrate that MFP outperforms state-of-the-art baselines in node classification while substantially reducing privacy leakage. Moreover, our analysis demonstrates that propagated outputs serve as alternative imputations rather than reconstructions of the original features, preserving utility without compromising privacy. A comprehensive sensitivity analysis further confirms the stability and practical applicability of MFP across diverse scenarios. Overall, MFP provides an effective and privacy-aware framework for graph learning in domains characterized by missing or sensitive features.
academic
نشر الميزات متعددة الآراء في الرسوم البيانية لحماية الخصوصية وندرة الميزات
حققت شبكات الأعصاب الرسومية (GNNs) نجاحاً ملحوظاً في مهام تصنيف العقد في البيانات العلائقية، لكن فعاليتها غالباً ما تعتمد على توفر ميزات العقد الكاملة. ومع ذلك، في العديد من السيناريوهات الواقعية، تكون مصفوفة الميزات نادرة جداً أو تحتوي على معلومات حساسة، مما يؤدي إلى تدهور الأداء وزيادة مخاطر الخصوصية. لمعالجة هذه التحديات، تقترح هذه الورقة إطار عمل جديد لنشر الميزات متعددة الآراء (MFP) يعزز أداء تصنيف العقد في ظروف ندرة الميزات مع تعزيز حماية الخصوصية. يوسع MFP نشر الميزات التقليدي (FP) بتقسيم الميزات المتاحة إلى عدة آراء مع ضوضاء غاوسية، حيث ينتشر كل رأي المعلومات بشكل مستقل عبر طوبولوجيا الرسم البياني. ينتج عن تجميع التمثيلات تضمينات عقدة غنية وقوية.
يعالج هذا البحث مشكلتين أساسيتين في شبكات الأعصاب الرسومية:
مشكلة ندرة الميزات: في التطبيقات العملية، غالباً ما تكون مصفوفة ميزات عقد البيانات الرسومية نادرة جداً أو غير مكتملة، مما يؤدي إلى انخفاض حاد في أداء GNN
مشكلة حماية الخصوصية: غالباً ما تحتوي ميزات العقد على معلومات شخصية حساسة (مثل البيانات الديموغرافية وأنماط السلوك)، وقد يؤدي الاستخدام المباشر إلى تسرب الخصوصية
نشر الميزات التقليدي (FP): على الرغم من أنه يمكن تخفيف ندرة الميزات، إلا أن الأداء لا تزال أقل بكثير من النماذج المدربة على ميزات كاملة، وقد تعيد بناء المعلومات الحساسة
طرق الخصوصية التفاضلية: تحمي الخصوصية بإضافة ضوضاء، لكنها غالباً ما تضحي بأداء النموذج
إخفاء الهوية الرسومي: قد يدمر البنية الرسومية بشكل مفرط، مما يؤثر على فعالية التعلم
الإدخال: رسم بياني نسبي G = {X, E}، حيث E هي مجموعة الحواف، X ∈ R^{|V|×d} هي مصفوفة ميزات العقد التي قد تحتوي على سمات حساسة
الإخراج: تنبؤات تصنيف العقد Ŷ ∈ R^{|V|}
الهدف: تحقيق تصنيف عقد عالي الأداء مع حماية الميزات الحساسة
تحليل مسافة الميزات: توزيع RMSE لـ MFP و FP متشابه جداً مع الضوضاء العشوائية، مما يشير إلى عدم إعادة بناء الميزات الأصلية
تحليل الارتباط: تتركز قيم PCC لـ MFP بشكل أساسي في الفترة -0.1, 0.1، أقل بكثير من FP، مما يشير إلى حماية خصوصية أفضل
التعميم عبر التمثيلات: انخفاض حاد في أداء النموذج بين التمثيلات المختلفة (مثل مجموعة بيانات Cora من 0.87 إلى 0.56)، مما يثبت أن مخرجات النشر هي تمثيل بديل وليس إعادة بناء
Yang et al. (2016): مجموعات بيانات معيار Planetoid
Zhu et al. (2020): التجانس في شبكات الأعصاب الرسومية
التقييم الشامل: تقترح هذه الورقة إطار عمل نشر ميزات متعدد الآراء مبتكر لمعالجة التحديات المزدوجة لندرة الميزات وحماية الخصوصية في شبكات الأعصاب الرسومية. تم تصميم الطريقة بشكل معقول، والتحقق التجريبي شامل، وتعزز البحث الحدودي لحماية الخصوصية في التعلم الرسومي مع الحفاظ على الجدوى العملية. على الرغم من وجود مجال للتحسين في التحليل النظري وضمانات الخصوصية، إلا أنها بشكل عام عمل بحثي عالي الجودة.