Graph unlearning emerges as a crucial advancement in the pursuit of responsible AI, providing the means to remove sensitive data traces from trained models, thereby upholding the \textit{right to be forgotten}. It is evident that graph machine learning exhibits sensitivity to data privacy and adversarial attacks, necessitating the application of graph unlearning techniques to address these concerns effectively. In this comprehensive survey paper, we present the first systematic review of graph unlearning approaches, encompassing a diverse array of methodologies and offering a detailed taxonomy and up-to-date literature overview to facilitate the understanding of researchers new to this field. To ensure clarity, we provide lucid explanations of the fundamental concepts and evaluation measures used in graph unlearning, catering to a broader audience with varying levels of expertise. Delving into potential applications, we explore the versatility of graph unlearning across various domains, including but not limited to social networks, adversarial settings, recommender systems, and resource-constrained environments like the Internet of Things, illustrating its potential impact in safeguarding data privacy and enhancing AI systems' robustness. Finally, we shed light on promising research directions, encouraging further progress and innovation within the domain of graph unlearning. By laying a solid foundation and fostering continued progress, this survey seeks to inspire researchers to further advance the field of graph unlearning, thereby instilling confidence in the ethical growth of AI systems and reinforcing the responsible application of machine learning techniques in various domains.
L'oblio nei grafi (Graph Unlearning) rappresenta una tecnologia cruciale nello sviluppo dell'IA responsabile, fornendo i mezzi per rimuovere le tracce di dati sensibili dai modelli già addestrati, preservando così il "diritto all'oblio". Data la sensibilità dell'apprendimento automatico su grafi rispetto alla privacy dei dati e agli attacchi avversariali, l'applicazione di tecniche di oblio nei grafi diventa particolarmente necessaria per affrontare efficacemente questi problemi. Questo articolo di sondaggio fornisce la prima revisione sistematica dei metodi di oblio nei grafi, coprendo metodologie diversificate e fornendo una tassonomia dettagliata e una panoramica della letteratura più recente, facilitando i nuovi ricercatori in questo campo. Per garantire chiarezza, l'articolo fornisce spiegazioni esplicite dei concetti fondamentali e delle metriche di valutazione nell'oblio nei grafi, rivolgendosi a un pubblico ampio con diversi livelli di competenza.
Esigenze di Protezione della Privacy: Con l'implementazione di normative sulla privacy dei dati (come GDPR, CCPA), gli individui hanno il diritto di richiedere la cancellazione dei loro dati dai modelli di machine learning
Complessità dei Dati Grafici: L'interconnessione tra nodi e archi nei dati strutturati a grafo rende difficile la semplice cancellazione dei dati, poiché le informazioni si propagano ai nodi remoti attraverso meccanismi di message passing
Protezione dagli Attacchi Avversariali: Necessità di rimuovere i dati iniettati malevolmente dal modello per mantenere l'integrità del sistema
Insufficienza dei Metodi Esistenti: I metodi tradizionali di machine unlearning non possono essere direttamente applicati ai dati strutturati a grafo
Primo Sondaggio Sistematico: Fornisce la prima revisione sistematica e completa del campo dell'oblio nei grafi
Tassonomia Dettagliata: Classifica i metodi di oblio nei grafi in due categorie principali: Oblio Esatto (Exact Unlearning) e Oblio Approssimato (Approximate Unlearning)
Analisi Applicativa Completa: Esplora le applicazioni dell'oblio nei grafi in molteplici domini, inclusi reti sociali, sistemi di raccomandazione e reti mediche
Framework di Valutazione: Fornisce metodi per valutare la completezza dell'oblio, l'efficienza e l'utilità del modello
Direzioni Future: Identifica molteplici direzioni di ricerca promettenti
Definizione di Grafo: G = (V, E, X, Xe), dove V è l'insieme dei nodi, E è l'insieme degli archi, X è la matrice delle caratteristiche dei nodi, Xe è la matrice delle caratteristiche degli archi
Insieme di Oblio: S ⊆ D, rappresenta il sottoinsieme di dati che deve essere dimenticato
Obiettivo: Aggiornare i parametri del modello θ in modo che l'effetto sia equivalente al riaddestrare su D\S
Per un insieme di dati fisso D, un insieme di oblio S e un algoritmo di apprendimento casuale A, un algoritmo di oblio U è (ε, δ)-oblio se e solo se per tutti R ⊆ R:
Complessità Temporale: La maggior parte dei metodi ha complessità lineare rispetto al numero di strati e quadratica rispetto alla dimensione delle caratteristiche
Tempo di Esecuzione Empirico: Tempo effettivo richiesto per l'operazione di oblio
L'articolo cita 113 riferimenti correlati, coprendo importanti lavori in molteplici domini correlati inclusi machine unlearning, reti neurali grafiche e protezione della privacy, fornendo ai lettori una base bibliografica completa.
Valutazione Complessiva: Questo è un articolo di sondaggio di alta qualità che sistematicamente esamina lo stato della ricerca nel campo emergente dell'oblio nei grafi, ponendo importanti fondamenta per lo sviluppo del campo. L'articolo è ben organizzato, completo nei contenuti e ha un significato importante nel promuovere lo sviluppo dell'IA responsabile.