2025-11-12T07:37:09.358830

Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification

Malialis, Li, Panayiotou et al.
Data stream mining aims at extracting meaningful knowledge from continually evolving data streams, addressing the challenges posed by nonstationary environments, particularly, concept drift which refers to a change in the underlying data distribution over time. Graph structures offer a powerful modelling tool to represent complex systems, such as, critical infrastructure systems and social networks. Learning from graph streams becomes a necessity to understand the dynamics of graph structures and to facilitate informed decision-making. This work introduces a novel method for graph stream classification which operates under the general setting where a data generating process produces graphs with varying nodes and edges over time. The method uses incremental learning for continual model adaptation, selecting representative graphs (prototypes) for each class, and creating graph embeddings. Additionally, it incorporates a loss-based concept drift detection mechanism to recalculate graph prototypes when drift is detected.
academic

Инкрементальное обучение с обнаружением дрейфа концепции и прототипными встраиваниями для классификации потоков графов

Основная информация

  • ID статьи: 2404.02572
  • Название: Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification
  • Авторы: Kleanthis Malialis, Jin Li, Christos G. Panayiotou, Marios M. Polycarpou
  • Категория: cs.LG
  • Дата публикации: 12 апреля 2024 г. (arXiv v2)
  • Принадлежность: Центр исследований и инноваций KIOS Кипрского университета, Факультет электротехники и вычислительной техники
  • Ссылка на статью: https://arxiv.org/abs/2404.02572

Аннотация

Интеллектуальный анализ потоков данных направлен на извлечение значимых знаний из постоянно развивающихся потоков данных, решая проблемы нестационарной среды, в частности дрейф концепции (concept drift) — изменение базового распределения данных во времени. Структуры графов предоставляют мощный инструмент моделирования для представления сложных систем, таких как критическая инфраструктура и социальные сети. Обучение на потоках графов становится необходимым условием для понимания динамики структур графов и принятия обоснованных решений. В данной работе предлагается новый метод классификации потоков графов, применимый к общему случаю, когда процесс генерации данных создает графы с изменяющимися во времени узлами и ребрами. Метод использует инкрементальное обучение для непрерывной адаптации модели, выбирает репрезентативные графы (прототипы) для каждого класса и создает встраивания графов. Кроме того, он интегрирует механизм обнаружения дрейфа концепции на основе потерь, пересчитывая прототипы графов при обнаружении дрейфа.

Исследовательский контекст и мотивация

1. Основная проблема

Основная проблема, которую решает данное исследование, — это задача классификации в динамической среде потоков графов, где количество узлов и ребер графов изменяется во времени и присутствует явление дрейфа концепции.

2. Важность проблемы

  • Практическая необходимость: Многие реальные системы (такие как критическая инфраструктура, социальные сети, системы рекомендаций) могут быть представлены динамическими структурами графов
  • Характеристики данных: Данные, генерируемые этими системами, обладают высокой скоростью, большим объемом и разнообразием
  • Вызовы окружающей среды: Дрейф концепции в нестационарной среде приводит к снижению производительности модели

3. Ограничения существующих методов

  • Традиционные методы классификации графов: Ориентированы в основном на статические графы и не могут обрабатывать потоки динамических графов
  • Существующие методы для потоков графов: Большинство сосредоточены на обнаружении аномалий, а не на многоклассовой классификации; отсутствуют эффективные механизмы обработки дрейфа концепции
  • Извлечение признаков: Существующие методы используют простые признаки графов (такие как плотность ребер, спектральный разрыв) с ограниченной выразительной способностью

4. Исследовательская мотивация

Необходимо разработать методы, которые могут:

  • Обрабатывать потоки динамических графов с переменным количеством узлов и ребер
  • Выполнять многоклассовую классификацию, а не только обнаружение аномалий
  • Эффективно обнаруживать и адаптироваться к дрейфу концепции
  • Использовать более богатые методы представления графов

Основные вклады

  1. Предложена новая структура классификации потоков графов: Применима к общему случаю потоков графов с переменным количеством узлов и ребер, поддерживает задачи многоклассовой классификации
  2. Разработан метод встраивания графов на основе прототипов: Путем выбора репрезентативных графов каждого класса в качестве прототипов графы преобразуются в векторные представления фиксированной размерности
  3. Интегрирован гибридный механизм обнаружения дрейфа концепции: Сочетание инкрементального обучения и обнаружения дрейфа на основе потерь реализует стратегию активно-пассивной гибридной адаптации
  4. Предоставлена полная экспериментальная проверка: Метод проверен на нескольких эталонных наборах данных с подробными исследованиями абляции

Подробное описание метода

Определение задачи

Дан поток графов D={(gt,yt)}t=1D = \{(g_t, y_t)\}_{t=1}^{\infty}, где:

  • gt=(V,E)g_t = (V, E) — атрибутированный граф на временном шаге tt
  • yt{1,...,K}y_t \in \{1, ..., K\} — метка класса графа
  • Графы могут иметь переменное количество узлов и ребер
  • Данные поступают из потенциально нестационарного распределения вероятностей pt(g,y)p_t(g, y)

Цель — обучить классификатор h:GYh: G \rightarrow Y, который может:

  1. Точно классифицировать вновь поступающие графы
  2. Непрерывно адаптироваться посредством инкрементального обучения
  3. Обнаруживать и обрабатывать дрейф концепции

Архитектура модели

1. Управление памятью графов

Поддерживаются несколько очередей для хранения недавних графов: q={qc}c=1Kq = \{q_c\}_{c=1}^Kqc={gi}i=1Lq_c = \{g_i\}_{i=1}^L где LL — размер очереди для каждого класса.

2. Выбор прототипов графов

Используется алгоритм Centers для выбора RR прототипных графов для каждого класса: pc=argming1qcg2qcδ(g1,g2)p_c = \arg\min_{g_1 \in q_c} \sum_{g_2 \in q_c} \delta(g_1, g_2) где δ(,)\delta(\cdot, \cdot) — расстояние редактирования графа.

3. Генерация встраивания графов

Встраивание графов вычисляется на основе прототипов: eg={δ(g,pi)}i=1R×Ke_g = \{\delta(g, p_i)\}_{i=1}^{R \times K} Граф преобразуется в вектор размерности R×KR \times K.

4. Инкрементальное обучение

Используется нейросетевой классификатор с функцией стоимости: C=1L×Ki=1L×Kl(yi,h(egi))C = \frac{1}{L \times K} \sum_{i=1}^{L \times K} l(y_i, h(e_{g_i})) Классификатор обновляется посредством инкрементального обучения: ht=ht1.train()h_t = h_{t-1}.train(\cdot)

5. Обнаружение дрейфа концепции

Поддерживаются две очереди оценок точности предсказания:

  • Эталонная очередь qrefq_{ref}: хранит исторические оценки предсказания
  • Скользящая очередь qmovq_{mov}: хранит недавние оценки предсказания

Используется биномиальное распределение для моделирования, условие обнаружения: μmovμrefβσref\mu_{mov} \leq \mu_{ref} - \beta\sigma_{ref} где β\beta — параметр чувствительности.

Технические инновации

  1. Стратегия выбора прототипов: Использование расстояния редактирования графа и медианного метода для выбора наиболее репрезентативных графов в качестве прототипов
  2. Гибридная адаптация к дрейфу: Сочетание пассивного инкрементального обучения и активного обнаружения дрейфа с пересчетом прототипов при обнаружении дрейфа
  3. Обработка графов переменного размера: Обработка графов с переменным количеством узлов и ребер посредством метода встраивания на основе расстояния
  4. Обнаружение, управляемое потерями: Использование производительности предсказания вместо изменения распределения данных для обнаружения дрейфа концепции

Экспериментальная установка

Наборы данных

  1. Набор данных Letter:
    • Содержит графовые представления букв "A", "I", "Z"
    • Две варианты: Letter high (высокое возмущение), Letter med high (среднее-высокое возмущение)
    • Используется для тестирования способности адаптации к дрейфу концепции
  2. Набор данных GREC:
    • Графовые представления символов архитектурных и электронных чертежей
    • Пять уровней возмущения
    • Три класса, графы равномерно распределены
  3. Набор данных Fingerprint:
    • Графовые представления изображений отпечатков пальцев
    • Два класса: "arch" и "left"
    • Из базы данных отпечатков пальцев NIST-4

Метрики оценки

Используется геометрическое среднее (G-mean): G-mean=c=1KrcKG\text{-mean} = \sqrt[K]{\prod_{c=1}^K r_c} где rcr_c — полнота класса cc.

Применяется метод предварительной оценки (prequential evaluation) с коэффициентом затухания 0,99.

Методы сравнения

  • Предложенный метод: Полный метод с встраиванием прототипов
  • Метод признаков: Базовый метод с использованием двух простых признаков: плотности ребер и спектрального разрыва

Детали реализации

  • Расстояние графа: расстояние редактирования графа
  • Классификатор: полносвязная нейронная сеть
  • Оптимизатор: Adam
  • Скорость обучения: 0,001-0,01 (зависит от набора данных)
  • Размер памяти: L=10L = 10
  • Количество прототипов: R=1R = 1 или R=3R = 3

Результаты экспериментов

Основные результаты

  1. Роль памяти графов: Использование памяти графов значительно улучшает скорость обучения и финальную производительность, особенно на начальных этапах обучения.
  2. Влияние количества прототипов:
    • При отсутствии дрейфа или легком дрейфе 3 прототипа превосходят 1 прототип
    • После серьезного дрейфа концепции меньшее количество прототипов показывает лучшие результаты
    • На наборах данных GREC и Fingerprint 3 прототипа последовательно показывают лучшие результаты
  3. Эффективность обнаружения дрейфа концепции:
    • До возникновения дрейфа концепции производительность с детектором дрейфа и без него схожа
    • После дрейфа методы с детектором дрейфа показывают значительное улучшение производительности
    • Подтверждена эффективность пересчета прототипов
  4. Сравнение методов: Предложенный метод на основе встраивания значительно превосходит метод на основе простых признаков на всех наборах данных.

Исследования абляции

  1. Размер памяти: Подтверждена критическая роль памяти графов для производительности
  2. Количество прототипов: Проанализирована производительность различного количества прототипов в разных сценариях дрейфа
  3. Обнаружение дрейфа: Доказана необходимость механизма обнаружения дрейфа

Экспериментальные находки

  1. Кривые обучения: Все методы имеют фазу обучения на начальном этапе, но предложенный метод сходится быстрее
  2. Адаптация к дрейфу: Стратегия адаптации к дрейфу на основе пересчета прототипов эффективна
  3. Выразительная способность: Встраивание на основе прототипов обладает большей выразительной способностью, чем простые признаки графов

Связанные работы

Адаптация к дрейфу концепции

  • Активные методы: Используют статистические тесты или методы на основе порогов для явного обнаружения дрейфа
  • Пассивные методы: Используют инкрементальное обучение для неявной адаптации к дрейфу
  • Гибридные методы: Сочетают преимущества активного обнаружения и пассивной адаптации

Классификация потоков графов

  • Традиционная классификация графов: Ориентирована в основном на статические графы, методы богаты, но не применимы к потоковым сценариям
  • Существующие методы для потоков графов: Сосредоточены в основном на обнаружении аномалий, исследования многоклассовой классификации ограничены
  • Встраивание графов: Использование автокодировщиков и других методов для обучения представлениям графов

Инновация данной работы заключается в сочетании встраивания прототипов, инкрементального обучения и обнаружения дрейфа концепции, специально ориентированном на задачу многоклассовой классификации потоков графов.

Заключение и обсуждение

Основные выводы

  1. Эффективность метода: Предложенный гибридный метод показывает отличные результаты на задачах классификации потоков графов, особенно в сценариях с дрейфом концепции
  2. Важность компонентов: Память графов, выбор прототипов и механизм обнаружения дрейфа все вносят важный вклад в финальную производительность
  3. Адаптивность: Метод эффективно обрабатывает потоки динамических графов с переменным количеством узлов и ребер

Ограничения

  1. Вычислительная сложность: Вычисление расстояния редактирования графа имеет высокую сложность, что может ограничить крупномасштабные приложения
  2. Чувствительность параметров: Параметр чувствительности обнаружения дрейфа требует настройки в зависимости от задачи
  3. Доступность меток: Предполагается, что истинные метки доступны на каждом шаге, что может быть нереалистично в практических приложениях

Направления будущих исследований

Статья явно предлагает два важных направления будущих исследований:

  1. Обучение встраиванию графов: Исследование методов обучения встраиванию графов end-to-end для применения к крупномасштабным проблемам потоков графов
  2. Обучение с ограниченными метками: Рассмотрение парадигм без учителя, полусупервизированного обучения, активного обучения, а также методов обучения с малым количеством примеров и увеличения данных

Глубокая оценка

Преимущества

  1. Важность проблемы: Классификация потоков графов — это практическая и важная проблема с широким спектром приложений
  2. Инновационность метода: Органичное сочетание выбора прототипов, инкрементального обучения и обнаружения дрейфа концепции формирует полное решение
  3. Полнота экспериментов: Проведена комплексная экспериментальная проверка, включая исследования абляции и анализ параметров
  4. Ясность изложения: Структура статьи четкая, описание метода подробное, легко понять и воспроизвести

Недостатки

  1. Масштаб наборов данных: Используемые наборы данных относительно небольшие, эффективность на крупномасштабных потоках графов неизвестна
  2. Вычислительная эффективность: Высокая сложность вычисления расстояния редактирования графа может стать узким местом в практических приложениях
  3. Теоретический анализ: Отсутствует теоретический анализ и гарантии сходимости
  4. Типы дрейфа: Основное внимание уделяется внезапному дрейфу, эффективность обработки постепенного дрейфа не ясна

Влияние

  1. Академический вклад: Предоставляет новый подход к решению проблемы классификации потоков графов, заполняя пробел в этой области
  2. Практическая ценность: Метод имеет потенциал практического применения, особенно в области мониторинга критической инфраструктуры
  3. Воспроизводимость: Предоставлены подробные детали реализации и параметры, что способствует воспроизведению

Применимые сценарии

Этот метод особенно подходит для:

  • Мониторинга систем критической инфраструктуры
  • Анализа динамики социальных сетей
  • Открытия лекарств на основе молекулярных графов
  • Анализа поведения пользователей в системах рекомендаций
  • Любых сценариев, требующих обработки динамических структур графов с дрейфом концепции

Библиография

Статья цитирует 37 связанных работ, охватывающих несколько смежных областей, включая обнаружение дрейфа концепции, графовые нейронные сети, инкрементальное обучение и другие важные работы, обеспечивая прочную теоретическую основу для исследования.


Общая оценка: Это высококачественная статья с важным вкладом в область классификации потоков графов. Метод разработан рационально, экспериментальная проверка полна, изложение ясно, работа предоставляет ценные insights и решения для развития этой области. Несмотря на некоторые ограничения, её инновационность и практическая применимость придают ей значительную академическую и прикладную ценность.