Multi-View Graph Feature Propagation for Privacy Preservation and Feature Sparsity
Harari, Unger
Graph Neural Networks (GNNs) have demonstrated remarkable success in node classification tasks over relational data, yet their effectiveness often depends on the availability of complete node features. In many real-world scenarios, however, feature matrices are highly sparse or contain sensitive information, leading to degraded performance and increased privacy risks. Furthermore, direct exposure of information can result in unintended data leakage, enabling adversaries to infer sensitive information. To address these challenges, we propose a novel Multi-view Feature Propagation (MFP) framework that enhances node classification under feature sparsity while promoting privacy preservation. MFP extends traditional Feature Propagation (FP) by dividing the available features into multiple Gaussian-noised views, each propagating information independently through the graph topology. The aggregated representations yield expressive and robust node embeddings. This framework is novel in two respects: it introduces a mechanism that improves robustness under extreme sparsity, and it provides a principled way to balance utility with privacy. Extensive experiments conducted on graph datasets demonstrate that MFP outperforms state-of-the-art baselines in node classification while substantially reducing privacy leakage. Moreover, our analysis demonstrates that propagated outputs serve as alternative imputations rather than reconstructions of the original features, preserving utility without compromising privacy. A comprehensive sensitivity analysis further confirms the stability and practical applicability of MFP across diverse scenarios. Overall, MFP provides an effective and privacy-aware framework for graph learning in domains characterized by missing or sensitive features.
academic
बहु-दृश्य ग्राफ विशेषता प्रसार गोपनीयता संरक्षण और विशेषता विरलता के लिए
ग्राफ न्यूरल नेटवर्क (GNNs) संबंधपरक डेटा में नोड वर्गीकरण कार्यों में उल्लेखनीय सफलता प्राप्त कर चुके हैं, लेकिन इनकी प्रभावशीलता अक्सर पूर्ण नोड विशेषताओं की उपलब्धता पर निर्भर करती है। हालांकि, कई वास्तविक परिदृश्यों में, विशेषता मैट्रिक्स अत्यधिक विरल होता है या संवेदनशील जानकारी रखता है, जिससे प्रदर्शन में गिरावट और गोपनीयता जोखिम बढ़ता है। इन चुनौतियों को हल करने के लिए, यह पेपर एक नोवल बहु-दृश्य विशेषता प्रसार (MFP) ढांचा प्रस्तावित करता है जो विशेषता विरलता की स्थितियों में नोड वर्गीकरण प्रदर्शन को बढ़ाता है और साथ ही गोपनीयता संरक्षण को बढ़ावा देता है। MFP पारंपरिक विशेषता प्रसार (FP) को उपलब्ध विशेषताओं को कई गाऊसी शोर दृश्यों में विभाजित करके विस्तारित करता है, जहां प्रत्येक दृश्य ग्राफ टोपोलॉजी के माध्यम से स्वतंत्र रूप से जानकारी का प्रसार करता है। एकत्रित प्रतिनिधित्व समृद्ध और मजबूत नोड एम्बेडिंग का उत्पादन करता है।
यह अनुसंधान ग्राफ न्यूरल नेटवर्क में दो मुख्य समस्याओं को संबोधित करता है:
विशेषता विरलता समस्या: व्यावहारिक अनुप्रयोगों में, ग्राफ डेटा की नोड विशेषता मैट्रिक्स अक्सर अत्यधिक विरल या अधूरी होती है, जिससे GNN प्रदर्शन में गंभीर गिरावट आती है
गोपनीयता संरक्षण समस्या: नोड विशेषताएं अक्सर संवेदनशील व्यक्तिगत जानकारी (जैसे जनसांख्यिकीय डेटा, व्यवहार पैटर्न आदि) रखती हैं, जिनका सीधा उपयोग गोपनीयता रिसाव का कारण बन सकता है
पारंपरिक विशेषता प्रसार (FP): हालांकि विशेषता विरलता को कम कर सकता है, लेकिन प्रदर्शन पूर्ण विशेषताओं के साथ प्रशिक्षित मॉडल से काफी कम है, और संवेदनशील जानकारी को पुनर्निर्माण कर सकता है
विभेदक गोपनीयता विधि: शोर जोड़कर गोपनीयता की रक्षा करते हैं, लेकिन अक्सर मॉडल प्रदर्शन का त्याग करते हैं
ग्राफ गुमनामीकरण: ग्राफ संरचना को अत्यधिक नुकसान पहुंचा सकता है, जिससे सीखने की प्रभावशीलता प्रभावित होती है
MFP ढांचा प्रस्तावित करना: विशेषता विरलता और गोपनीयता संरक्षण दोनों को संबोधित करने वाला पहला ग्राफ लर्निंग ढांचा
बहु-दृश्य प्रसार तंत्र: कई आंशिक शोर दृश्यों के स्वतंत्र प्रसार और एकत्रीकरण के माध्यम से प्रतिनिधित्व सीखने की क्षमता में वृद्धि
गोपनीयता संरक्षण सत्यापन: यह साबित करना कि प्रसार आउटपुट मूल विशेषताओं का प्रतिस्थापन प्रक्षेप है, पुनर्निर्माण नहीं, जिससे गोपनीयता रिसाव से बचाव होता है
व्यापक प्रायोगिक मूल्यांकन: कई बेंचमार्क डेटासेट पर MFP की प्रभावशीलता और मजबूती का सत्यापन
संवेदनशीलता विश्लेषण: ग्राफ समरूपता, प्रसार गहराई, दृश्य संख्या आदि मुख्य कारकों के प्रभाव का व्यवस्थित विश्लेषण
इनपुट: विशेषता ग्राफ G = {X, E}, जहां E किनारों का समुच्चय है, X ∈ R^{|V|×d} संभवतः संवेदनशील विशेषताओं वाली नोड विशेषता मैट्रिक्स है
आउटपुट: नोड वर्गीकरण भविष्यवाणी Ŷ ∈ R^{|V|}
उद्देश्य: संवेदनशील विशेषताओं की गोपनीयता की रक्षा करते हुए उच्च-प्रदर्शन नोड वर्गीकरण प्राप्त करना
विशेषता दूरी विश्लेषण: MFP और FP का RMSE वितरण यादृच्छिक शोर के समान है, जो दर्शाता है कि मूल विशेषताओं का पुनर्निर्माण नहीं हुआ है
सहसंबंध विश्लेषण: MFP का PCC मान मुख्य रूप से -0.1, 0.1 अंतराल में केंद्रित है, FP से काफी कम है, जो बेहतर गोपनीयता संरक्षण दर्शाता है
क्रॉस-प्रतिनिधित्व सामान्यीकरण: विभिन्न प्रतिनिधित्वों के बीच मॉडल प्रदर्शन में भारी गिरावट (जैसे Cora डेटासेट में 0.87 से 0.56 तक), जो साबित करता है कि प्रसार आउटपुट प्रतिस्थापन प्रतिनिधित्व है, पुनर्निर्माण नहीं
Rossi et al. (2022): Feature Propagation effectiveness
Yang et al. (2016): Planetoid benchmark datasets
Zhu et al. (2020): Homophily in graph neural networks
समग्र मूल्यांकन: यह पेपर ग्राफ न्यूरल नेटवर्क में विशेषता विरलता और गोपनीयता संरक्षण की दोहरी चुनौतियों के लिए एक नवाचारी बहु-दृश्य विशेषता प्रसार ढांचा प्रस्तावित करता है। विधि डिजाइन उचित है, प्रायोगिक सत्यापन व्यापक है, व्यावहारिकता बनाए रखते हुए गोपनीयता-संरक्षण ग्राफ लर्निंग अनुसंधान के अग्रभाग को आगे बढ़ाता है। हालांकि सैद्धांतिक विश्लेषण और गोपनीयता गारंटी के पहलुओं में सुधार की गुंजाइश है, लेकिन समग्र रूप से यह उच्च-गुणवत्ता का अनुसंधान कार्य है।