2025-11-12T07:37:09.358830

Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification

Malialis, Li, Panayiotou et al.
Data stream mining aims at extracting meaningful knowledge from continually evolving data streams, addressing the challenges posed by nonstationary environments, particularly, concept drift which refers to a change in the underlying data distribution over time. Graph structures offer a powerful modelling tool to represent complex systems, such as, critical infrastructure systems and social networks. Learning from graph streams becomes a necessity to understand the dynamics of graph structures and to facilitate informed decision-making. This work introduces a novel method for graph stream classification which operates under the general setting where a data generating process produces graphs with varying nodes and edges over time. The method uses incremental learning for continual model adaptation, selecting representative graphs (prototypes) for each class, and creating graph embeddings. Additionally, it incorporates a loss-based concept drift detection mechanism to recalculate graph prototypes when drift is detected.
academic

Aprendizaje Incremental con Detección de Cambio de Concepto e Incrustaciones Basadas en Prototipos para Clasificación de Flujos de Grafos

Información Básica

  • ID del Artículo: 2404.02572
  • Título: Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification
  • Autores: Kleanthis Malialis, Jin Li, Christos G. Panayiotou, Marios M. Polycarpou
  • Clasificación: cs.LG
  • Fecha de Publicación: 12 de abril de 2024 (arXiv v2)
  • Institución Afiliada: Centro de Excelencia en Investigación e Innovación KIOS de la Universidad de Chipre, Departamento de Ingeniería Eléctrica y Computacional
  • Enlace del Artículo: https://arxiv.org/abs/2404.02572

Resumen

La minería de flujos de datos tiene como objetivo extraer conocimiento significativo de flujos de datos en continua evolución, abordando los desafíos presentados por entornos no estacionarios, particularmente el cambio de concepto (concept drift), es decir, la variación de la distribución de datos subyacente a lo largo del tiempo. Las estructuras de grafos proporcionan herramientas de modelado potentes para representar sistemas complejos, como sistemas de infraestructura crítica y redes sociales. El aprendizaje a partir de flujos de grafos se ha convertido en una necesidad para comprender la dinámica de estructuras de grafos y facilitar la toma de decisiones informadas. Este trabajo propone un nuevo método de clasificación de flujos de grafos aplicable a configuraciones generales donde el proceso generador de datos produce grafos con nodos y aristas que varían en el tiempo. El método utiliza aprendizaje incremental para la adaptación continua del modelo, selecciona grafos representativos (prototipos) para cada clase y crea incrustaciones de grafos. Además, integra un mecanismo de detección de cambio de concepto basado en pérdida, que recalcula los prototipos de grafos cuando se detecta un cambio.

Contexto de Investigación y Motivación

1. Problema Central

El problema central que aborda esta investigación es la tarea de clasificación en entornos dinámicos de flujos de grafos, donde el número de nodos y aristas de los grafos varía en el tiempo y existe el fenómeno de cambio de concepto.

2. Importancia del Problema

  • Necesidad Práctica: Muchos sistemas del mundo real (como infraestructura crítica, redes sociales, sistemas de recomendación) pueden representarse mediante estructuras de grafos dinámicos
  • Características de Datos: Los datos generados por estos sistemas poseen características de alta velocidad, gran volumen y diversidad
  • Desafíos Ambientales: El cambio de concepto en entornos no estacionarios puede causar degradación del rendimiento del modelo

3. Limitaciones de Métodos Existentes

  • Métodos Tradicionales de Clasificación de Grafos: Se enfocan principalmente en grafos estáticos, incapaces de procesar flujos de grafos dinámicos
  • Métodos Existentes de Flujos de Grafos: La mayoría se enfoca en detección de anomalías en lugar de clasificación multiclase; carecen de mecanismos efectivos para manejar cambios de concepto
  • Extracción de Características: Los métodos existentes utilizan características de grafos simples (como densidad de aristas, brecha espectral) con capacidad expresiva limitada

4. Motivación de la Investigación

Se requiere desarrollar métodos que puedan:

  • Procesar flujos de grafos dinámicos con número variable de nodos y aristas
  • Realizar clasificación multiclase en lugar de limitarse a detección de anomalías
  • Detectar y adaptarse efectivamente al cambio de concepto
  • Utilizar métodos de representación de grafos más ricos

Contribuciones Principales

  1. Propone un nuevo marco de clasificación de flujos de grafos: Aplicable a configuraciones generales de flujos de grafos con número variable de nodos y aristas, soportando tareas de clasificación multiclase
  2. Diseña un método de incrustación de grafos basado en prototipos: Convierte grafos en representaciones vectoriales de dimensión fija seleccionando grafos representativos de cada clase como prototipos
  3. Integra un mecanismo híbrido de detección de cambio de concepto: Combina aprendizaje incremental y detección de cambio basada en pérdida, implementando una estrategia de adaptación activa-pasiva híbrida
  4. Proporciona validación experimental completa: Verifica la efectividad del método en múltiples conjuntos de datos de referencia y realiza estudios de ablación detallados

Explicación Detallada del Método

Definición de Tarea

Dado un flujo de grafos D={(gt,yt)}t=1D = \{(g_t, y_t)\}_{t=1}^{\infty}, donde:

  • gt=(V,E)g_t = (V, E) es un grafo atribuido en el paso temporal tt
  • yt{1,...,K}y_t \in \{1, ..., K\} es la etiqueta de clase del grafo
  • Los grafos pueden tener un número variable de nodos y aristas
  • Los datos provienen de una distribución de probabilidad potencialmente no estacionaria pt(g,y)p_t(g, y)

El objetivo es aprender un clasificador h:GYh: G \rightarrow Y que pueda:

  1. Clasificar con precisión grafos recién llegados
  2. Adaptarse continuamente mediante aprendizaje incremental
  3. Detectar y manejar cambios de concepto

Arquitectura del Modelo

1. Gestión de Memoria de Grafos

Mantiene múltiples colas que almacenan grafos recientes: q={qc}c=1Kq = \{q_c\}_{c=1}^Kqc={gi}i=1Lq_c = \{g_i\}_{i=1}^L donde LL es el tamaño de la cola para cada clase.

2. Selección de Prototipos de Grafos

Utiliza el algoritmo Centers para seleccionar RR grafos prototipo para cada clase: pc=argming1qcg2qcδ(g1,g2)p_c = \arg\min_{g_1 \in q_c} \sum_{g_2 \in q_c} \delta(g_1, g_2) donde δ(,)\delta(\cdot, \cdot) es la distancia de edición de grafos.

3. Generación de Incrustaciones de Grafos

Calcula incrustaciones de grafos basadas en prototipos: eg={δ(g,pi)}i=1R×Ke_g = \{\delta(g, p_i)\}_{i=1}^{R \times K} Convierte el grafo en un vector de dimensión R×KR \times K.

4. Aprendizaje Incremental

Utiliza un clasificador de red neuronal con función de costo: C=1L×Ki=1L×Kl(yi,h(egi))C = \frac{1}{L \times K} \sum_{i=1}^{L \times K} l(y_i, h(e_{g_i})) El clasificador se actualiza mediante entrenamiento incremental: ht=ht1.train()h_t = h_{t-1}.train(\cdot)

5. Detección de Cambio de Concepto

Mantiene dos colas de precisión de predicción:

  • Cola de referencia qrefq_{ref}: almacena puntuaciones de predicción históricas
  • Cola móvil qmovq_{mov}: almacena puntuaciones de predicción recientes

Utiliza modelado de distribución binomial, con condición de detección: μmovμrefβσref\mu_{mov} \leq \mu_{ref} - \beta\sigma_{ref} donde β\beta es un parámetro de sensibilidad.

Puntos de Innovación Técnica

  1. Estrategia de Selección de Prototipos: Utiliza distancia de edición de grafos y método de mediana para seleccionar los grafos más representativos como prototipos
  2. Adaptación Híbrida de Cambio: Combina aprendizaje incremental pasivo y detección activa de cambio, recalculando prototipos cuando se detecta un cambio
  3. Procesamiento de Grafos Variables: Maneja grafos con número variable de nodos y aristas mediante método de incrustación basado en distancia
  4. Detección Impulsada por Pérdida: Utiliza rendimiento de predicción en lugar de cambios en distribución de datos para detectar cambios de concepto

Configuración Experimental

Conjuntos de Datos

  1. Conjunto de Datos Letter:
    • Contiene representaciones en grafos de las letras "A", "I", "Z"
    • Dos variantes: Letter high (perturbación alta), Letter med high (perturbación media-alta)
    • Utilizado para probar la capacidad de adaptación al cambio de concepto
  2. Conjunto de Datos GREC:
    • Representaciones en grafos de símbolos de planos arquitectónicos y electrónicos
    • Cinco niveles de perturbación
    • Tres clases, distribución uniforme de grafos
  3. Conjunto de Datos Fingerprint:
    • Representaciones en grafos de imágenes de huellas dactilares
    • Dos clases: "arch" y "left"
    • Proveniente de la base de datos de huellas dactilares NIST-4

Métricas de Evaluación

Utiliza la media geométrica (G-mean): G-mean=c=1KrcKG\text{-mean} = \sqrt[K]{\prod_{c=1}^K r_c} donde rcr_c es la tasa de recuperación de la clase cc.

Adopta método de evaluación prequential con factor de decaimiento de 0.99.

Métodos de Comparación

  • Método Propuesto: Método completo con incrustación de prototipos
  • Método de Características: Método de línea base utilizando dos características simples: densidad de aristas y brecha espectral

Detalles de Implementación

  • Distancia de Grafos: Distancia de edición de grafos
  • Clasificador: Red neuronal completamente conectada
  • Optimizador: Adam
  • Tasa de Aprendizaje: 0.001-0.01 (dependiente del conjunto de datos)
  • Tamaño de Memoria: L=10L = 10
  • Cantidad de Prototipos: R=1R = 1 o R=3R = 3

Resultados Experimentales

Resultados Principales

  1. Efecto de la Memoria de Grafos: El uso de memoria de grafos mejora significativamente la velocidad de aprendizaje y el rendimiento final, particularmente en las etapas iniciales del aprendizaje.
  2. Impacto de la Cantidad de Prototipos:
    • Sin cambio o con cambio leve, 3 prototipos superan a 1 prototipo
    • Después de cambio de concepto severo, menor cantidad de prototipos muestra mejor rendimiento
    • En conjuntos de datos GREC y Fingerprint, 3 prototipos muestran consistentemente mejor rendimiento
  3. Efectividad de Detección de Cambio de Concepto:
    • Antes de que ocurra el cambio, el rendimiento es similar con o sin detector de cambio
    • Después del cambio, el método con detector de cambio muestra mejora significativa de rendimiento
    • Valida la efectividad del recálculo de prototipos
  4. Comparación de Métodos: El método propuesto basado en incrustaciones supera significativamente al método basado en características simples en todos los conjuntos de datos.

Estudios de Ablación

  1. Tamaño de Memoria: Verifica el papel crítico de la memoria de grafos en el rendimiento
  2. Cantidad de Prototipos: Analiza el rendimiento de diferentes cantidades de prototipos en diferentes escenarios de cambio
  3. Detección de Cambio: Demuestra la necesidad del mecanismo de detección de cambio

Hallazgos Experimentales

  1. Curvas de Aprendizaje: Todos los métodos tienen una fase de aprendizaje inicial, pero el método propuesto converge más rápidamente
  2. Adaptación a Cambios: La estrategia de adaptación a cambios basada en recálculo de prototipos es efectiva
  3. Capacidad de Representación: Las incrustaciones basadas en prototipos tienen mayor capacidad expresiva que características de grafos simples

Trabajo Relacionado

Adaptación a Cambio de Concepto

  • Métodos Activos: Utilizan pruebas estadísticas o métodos de umbral para detectar explícitamente cambios
  • Métodos Pasivos: Utilizan aprendizaje incremental para adaptarse implícitamente a cambios
  • Métodos Híbridos: Combinan las ventajas de detección activa y adaptación pasiva

Clasificación de Flujos de Grafos

  • Clasificación Tradicional de Grafos: Se enfoca principalmente en grafos estáticos, con métodos ricos pero no aplicables a escenarios de flujo
  • Métodos Existentes de Flujos de Grafos: Se enfoca principalmente en detección de anomalías, con investigación limitada en clasificación multiclase
  • Incrustación de Grafos: Utiliza métodos como autocodificadores para aprender representaciones de grafos

La innovación de este artículo radica en combinar incrustación de prototipos, aprendizaje incremental y detección de cambio de concepto, dirigidos específicamente a tareas de clasificación multiclase de flujos de grafos.

Conclusiones y Discusión

Conclusiones Principales

  1. Efectividad del Método: El método híbrido propuesto muestra excelente rendimiento en tareas de clasificación de flujos de grafos, particularmente en escenarios con cambio de concepto
  2. Importancia de Componentes: La memoria de grafos, selección de prototipos y mecanismo de detección de cambio contribuyen todos significativamente al rendimiento final
  3. Adaptabilidad: El método puede manejar efectivamente flujos de grafos dinámicos con número variable de nodos y aristas

Limitaciones

  1. Complejidad Computacional: El cálculo de distancia de edición de grafos tiene alta complejidad computacional, lo que puede limitar aplicaciones a gran escala
  2. Sensibilidad de Parámetros: El parámetro de sensibilidad de detección de cambio necesita ajustarse según la tarea
  3. Disponibilidad de Etiquetas: Asume que se pueden obtener etiquetas verdaderas en cada paso, lo que puede no ser realista en aplicaciones prácticas

Direcciones Futuras

El artículo identifica explícitamente dos direcciones de investigación futuras importantes:

  1. Aprendizaje de Incrustaciones de Grafos: Investigar métodos de aprendizaje de incrustaciones de grafos de extremo a extremo para aplicaciones a flujos de grafos a gran escala
  2. Aprendizaje con Etiquetas Limitadas: Considerar paradigmas no supervisados, semi-supervisados, de aprendizaje activo, así como técnicas de aprendizaje con pocas muestras y aumento de datos

Evaluación Profunda

Fortalezas

  1. Importancia del Problema: La clasificación de flujos de grafos es un problema práctico e importante con amplio valor de aplicación
  2. Innovación del Método: Combina orgánicamente selección de prototipos, aprendizaje incremental y detección de cambio de concepto, formando una solución completa
  3. Suficiencia Experimental: Realiza validación experimental completa, incluyendo estudios de ablación y análisis de parámetros
  4. Claridad de Escritura: La estructura del artículo es clara, la descripción del método es detallada y fácil de entender y reproducir

Deficiencias

  1. Escala de Conjuntos de Datos: Los conjuntos de datos utilizados son relativamente pequeños, el efecto en flujos de grafos a gran escala es desconocido
  2. Eficiencia Computacional: La complejidad computacional del cálculo de distancia de edición de grafos puede convertirse en cuello de botella en aplicaciones prácticas
  3. Análisis Teórico: Carece de análisis teórico y garantías de convergencia
  4. Tipos de Cambio: Se enfoca principalmente en cambios abruptos, el efecto en cambios graduales no está claro

Impacto

  1. Contribución Académica: Proporciona nuevas perspectivas de solución para clasificación de flujos de grafos, llenando vacíos en este campo
  2. Valor Práctico: El método tiene potencial de aplicación práctica, particularmente en campos como monitoreo de infraestructura crítica
  3. Reproducibilidad: Proporciona detalles de implementación detallados y configuración de parámetros, facilitando la reproducción

Escenarios Aplicables

Este método es particularmente adecuado para:

  • Monitoreo de sistemas de infraestructura crítica
  • Análisis dinámico de redes sociales
  • Descubrimiento de fármacos con grafos moleculares
  • Análisis de comportamiento de usuarios en sistemas de recomendación
  • Cualquier escenario que requiera procesar estructuras de grafos dinámicos con cambio de concepto

Referencias

El artículo cita 37 referencias relacionadas, cubriendo múltiples campos relacionados incluyendo detección de cambio de concepto, redes neuronales de grafos, aprendizaje incremental, etc., proporcionando una base teórica sólida para la investigación.


Evaluación General: Este es un artículo de alta calidad con contribuciones importantes en el campo de clasificación de flujos de grafos. El diseño del método es razonable, la validación experimental es suficiente, la escritura es clara, y proporciona insights valiosos y soluciones para el desarrollo del campo. Aunque existen algunas limitaciones, su innovación y practicidad le confieren valor académico y de aplicación significativo.