Graph unlearning emerges as a crucial advancement in the pursuit of responsible AI, providing the means to remove sensitive data traces from trained models, thereby upholding the \textit{right to be forgotten}. It is evident that graph machine learning exhibits sensitivity to data privacy and adversarial attacks, necessitating the application of graph unlearning techniques to address these concerns effectively. In this comprehensive survey paper, we present the first systematic review of graph unlearning approaches, encompassing a diverse array of methodologies and offering a detailed taxonomy and up-to-date literature overview to facilitate the understanding of researchers new to this field. To ensure clarity, we provide lucid explanations of the fundamental concepts and evaluation measures used in graph unlearning, catering to a broader audience with varying levels of expertise. Delving into potential applications, we explore the versatility of graph unlearning across various domains, including but not limited to social networks, adversarial settings, recommender systems, and resource-constrained environments like the Internet of Things, illustrating its potential impact in safeguarding data privacy and enhancing AI systems' robustness. Finally, we shed light on promising research directions, encouraging further progress and innovation within the domain of graph unlearning. By laying a solid foundation and fostering continued progress, this survey seeks to inspire researchers to further advance the field of graph unlearning, thereby instilling confidence in the ethical growth of AI systems and reinforcing the responsible application of machine learning techniques in various domains.
L'oubli de graphes en apprentissage automatique (Graph Unlearning) constitue une technologie clé dans le développement d'une IA responsable, offrant les moyens de supprimer les traces de données sensibles des modèles entraînés, préservant ainsi le « droit à l'oubli ». Étant donné la sensibilité de l'apprentissage automatique sur graphes aux problèmes de confidentialité des données et aux attaques adversariales, l'application de techniques d'oubli de graphes pour résoudre efficacement ces problèmes devient particulièrement nécessaire. Cet article de synthèse procède à un examen systématique des méthodes d'oubli de graphes, couvrant des méthodologies diversifiées et fournissant une taxonomie détaillée ainsi qu'un aperçu de la littérature actuelle, facilitant ainsi les nouveaux chercheurs dans ce domaine. Pour assurer la clarté, l'article fournit des explications claires des concepts fondamentaux et des métriques d'évaluation en oubli de graphes, s'adressant à un large public de niveaux d'expertise variés.
Besoins de protection de la vie privée : Avec la mise en œuvre de réglementations sur la confidentialité des données (telles que le RGPD, la CCPA), les individus ont le droit de demander la suppression de leurs données des modèles d'apprentissage automatique
Complexité des données graphiques : L'interconnexion des nœuds et des arêtes dans les données structurées en graphes rend la simple suppression de données difficile, car les informations se propagent vers les nœuds distants via les mécanismes de passage de messages
Protection contre les attaques adversariales : Nécessité de supprimer les données malveillantes injectées du modèle pour maintenir l'intégrité du système
Insuffisance des méthodes existantes : Les méthodes traditionnelles d'oubli en apprentissage automatique ne peuvent pas être directement appliquées aux données structurées en graphes
Première synthèse systématique : Fournit le premier examen systématique et complet du domaine de l'oubli de graphes
Taxonomie détaillée : Classe les méthodes d'oubli de graphes en deux catégories principales : l'oubli exact (Exact Unlearning) et l'oubli approximatif (Approximate Unlearning)
Analyse d'application complète : Explore les applications de l'oubli de graphes dans plusieurs domaines, notamment les réseaux sociaux, les systèmes de recommandation et les réseaux médicaux
Cadre d'évaluation : Fournit des méthodes d'évaluation de l'intégrité de l'oubli, de l'efficacité et de l'utilité du modèle
Directions futures : Identifie plusieurs directions de recherche prometteuses
Définition du graphe : G = (V, E, X, Xe), où V est l'ensemble des nœuds, E est l'ensemble des arêtes, X est la matrice des caractéristiques des nœuds, et Xe est la matrice des caractéristiques des arêtes
Ensemble d'oubli : S ⊆ D, représentant le sous-ensemble de données à oublier
Objectif : Mettre à jour les paramètres du modèle θ de sorte que l'effet soit équivalent à un réentraînement sur D\S
Pour un ensemble de données fixe D, un ensemble d'oubli S et un algorithme d'apprentissage aléatoire A, un algorithme d'oubli U est (ε, δ)-oubli si et seulement si pour tout R ⊆ R :
Complexité temporelle : La plupart des méthodes ont une complexité linéaire par rapport au nombre de couches et quadratique par rapport à la dimension des caractéristiques
Temps d'exécution empirique : Temps réel requis pour les opérations d'oubli
L'article cite 113 références connexes, couvrant des travaux importants dans plusieurs domaines connexes incluant l'oubli en apprentissage automatique, les réseaux de neurones graphiques et la protection de la vie privée, fournissant aux lecteurs une base de littérature complète.
Évaluation Générale : Ceci est un article de synthèse de haute qualité qui examine systématiquement l'état actuel de la recherche dans le domaine émergent de l'oubli de graphes, posant les fondations importantes pour le développement du domaine. L'article est bien organisé, complet en contenu et revêt une importance significative pour promouvoir le développement d'une IA responsable.