Graph unlearning emerges as a crucial advancement in the pursuit of responsible AI, providing the means to remove sensitive data traces from trained models, thereby upholding the \textit{right to be forgotten}. It is evident that graph machine learning exhibits sensitivity to data privacy and adversarial attacks, necessitating the application of graph unlearning techniques to address these concerns effectively. In this comprehensive survey paper, we present the first systematic review of graph unlearning approaches, encompassing a diverse array of methodologies and offering a detailed taxonomy and up-to-date literature overview to facilitate the understanding of researchers new to this field. To ensure clarity, we provide lucid explanations of the fundamental concepts and evaluation measures used in graph unlearning, catering to a broader audience with varying levels of expertise. Delving into potential applications, we explore the versatility of graph unlearning across various domains, including but not limited to social networks, adversarial settings, recommender systems, and resource-constrained environments like the Internet of Things, illustrating its potential impact in safeguarding data privacy and enhancing AI systems' robustness. Finally, we shed light on promising research directions, encouraging further progress and innovation within the domain of graph unlearning. By laying a solid foundation and fostering continued progress, this survey seeks to inspire researchers to further advance the field of graph unlearning, thereby instilling confidence in the ethical growth of AI systems and reinforcing the responsible application of machine learning techniques in various domains.
Машинное разучивание на графах (Graph Unlearning) служит ключевой технологией в развитии ответственного искусственного интеллекта, предоставляя средства для удаления следов конфиденциальных данных из обученных моделей, тем самым обеспечивая реализацию "права на забвение". Учитывая чувствительность машинного обучения на графах к вопросам конфиденциальности данных и уязвимость перед состязательными атаками, применение методов разучивания на графах становится особенно необходимым для эффективного решения этих проблем. Данный обзорный труд впервые систематически рассматривает методы разучивания на графах, охватывая разнообразные методологические подходы и предоставляя детальную классификацию и обзор современной литературы, что облегчает работу новых исследователей в этой области. Для обеспечения ясности изложения статья предоставляет четкие объяснения фундаментальных концепций и метрик оценки в контексте разучивания на графах, ориентируясь на широкую аудиторию с различным уровнем подготовки.
Требования защиты конфиденциальности: С введением нормативных актов по защите данных (таких как GDPR, CCPA) люди имеют право требовать удаления своих данных из моделей машинного обучения
Сложность графовых данных: Взаимосвязь узлов и ребер в структурированных графовых данных делает простое удаление данных затруднительным, поскольку информация распространяется на удаленные узлы через механизмы передачи сообщений
Защита от состязательных атак: Необходимость удаления вредоносно внедренных данных из модели для сохранения целостности системы
Недостаточность существующих методов: Традиционные методы машинного разучивания не могут быть непосредственно применены к графовым структурированным данным
Первый систематический обзор: Предоставляет первый всеобъемлющий систематический обзор области разучивания на графах
Детальная классификация: Классифицирует методы разучивания на графах на две основные категории: точное разучивание (Exact Unlearning) и приблизительное разучивание (Approximate Unlearning)
Комплексный анализ приложений: Исследует применение разучивания на графах в социальных сетях, системах рекомендаций, медицинских сетях и других областях
Структура оценки: Предоставляет методы оценки полноты разучивания, эффективности и полезности модели
Направления будущих исследований: Указывает на несколько перспективных направлений исследований
Для фиксированного набора данных D, множества разучивания S и случайного алгоритма обучения A, алгоритм разучивания U является (ε, δ)-разучиванием тогда и только тогда, когда для всех R ⊆ R:
Статья цитирует 113 связанных работ, охватывающих важные исследования в области машинного разучивания, графовых нейронных сетей, защиты конфиденциальности и других смежных областей, предоставляя читателям всеобъемлющую литературную базу.
Общая оценка: Это высококачественная обзорная статья, которая систематически рассматривает текущее состояние исследований в развивающейся области разучивания на графах, закладывая важную основу для развития этой области. Статья хорошо организована, содержательна и имеет важное значение для содействия развитию ответственного искусственного интеллекта.