2025-11-12T07:37:09.358830

Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification

Malialis, Li, Panayiotou et al.

Data stream mining aims at extracting meaningful knowledge from continually evolving data streams, addressing the challenges posed by nonstationary environments, particularly, concept drift which refers to a change in the underlying data distribution over time. Graph structures offer a powerful modelling tool to represent complex systems, such as, critical infrastructure systems and social networks. Learning from graph streams becomes a necessity to understand the dynamics of graph structures and to facilitate informed decision-making. This work introduces a novel method for graph stream classification which operates under the general setting where a data generating process produces graphs with varying nodes and edges over time. The method uses incremental learning for continual model adaptation, selecting representative graphs (prototypes) for each class, and creating graph embeddings. Additionally, it incorporates a loss-based concept drift detection mechanism to recalculate graph prototypes when drift is detected.

academic

Aprendizaje Incremental con Detección de Cambio de Concepto e Incrustaciones Basadas en Prototipos para Clasificación de Flujos de Grafos

Información Básica

ID del Artículo: 2404.02572
Título: Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification
Autores: Kleanthis Malialis, Jin Li, Christos G. Panayiotou, Marios M. Polycarpou
Clasificación: cs.LG
Fecha de Publicación: 12 de abril de 2024 (arXiv v2)
Institución Afiliada: Centro de Excelencia en Investigación e Innovación KIOS de la Universidad de Chipre, Departamento de Ingeniería Eléctrica y Computacional
Enlace del Artículo: https://arxiv.org/abs/2404.02572

Resumen

La minería de flujos de datos tiene como objetivo extraer conocimiento significativo de flujos de datos en continua evolución, abordando los desafíos presentados por entornos no estacionarios, particularmente el cambio de concepto (concept drift), es decir, la variación de la distribución de datos subyacente a lo largo del tiempo. Las estructuras de grafos proporcionan herramientas de modelado potentes para representar sistemas complejos, como sistemas de infraestructura crítica y redes sociales. El aprendizaje a partir de flujos de grafos se ha convertido en una necesidad para comprender la dinámica de estructuras de grafos y facilitar la toma de decisiones informadas. Este trabajo propone un nuevo método de clasificación de flujos de grafos aplicable a configuraciones generales donde el proceso generador de datos produce grafos con nodos y aristas que varían en el tiempo. El método utiliza aprendizaje incremental para la adaptación continua del modelo, selecciona grafos representativos (prototipos) para cada clase y crea incrustaciones de grafos. Además, integra un mecanismo de detección de cambio de concepto basado en pérdida, que recalcula los prototipos de grafos cuando se detecta un cambio.

Contexto de Investigación y Motivación

1. Problema Central

El problema central que aborda esta investigación es la tarea de clasificación en entornos dinámicos de flujos de grafos, donde el número de nodos y aristas de los grafos varía en el tiempo y existe el fenómeno de cambio de concepto.

2. Importancia del Problema

Necesidad Práctica: Muchos sistemas del mundo real (como infraestructura crítica, redes sociales, sistemas de recomendación) pueden representarse mediante estructuras de grafos dinámicos
Características de Datos: Los datos generados por estos sistemas poseen características de alta velocidad, gran volumen y diversidad
Desafíos Ambientales: El cambio de concepto en entornos no estacionarios puede causar degradación del rendimiento del modelo

3. Limitaciones de Métodos Existentes

Métodos Tradicionales de Clasificación de Grafos: Se enfocan principalmente en grafos estáticos, incapaces de procesar flujos de grafos dinámicos
Métodos Existentes de Flujos de Grafos: La mayoría se enfoca en detección de anomalías en lugar de clasificación multiclase; carecen de mecanismos efectivos para manejar cambios de concepto
Extracción de Características: Los métodos existentes utilizan características de grafos simples (como densidad de aristas, brecha espectral) con capacidad expresiva limitada

4. Motivación de la Investigación

Se requiere desarrollar métodos que puedan:

Procesar flujos de grafos dinámicos con número variable de nodos y aristas
Realizar clasificación multiclase en lugar de limitarse a detección de anomalías
Detectar y adaptarse efectivamente al cambio de concepto
Utilizar métodos de representación de grafos más ricos

Contribuciones Principales

Propone un nuevo marco de clasificación de flujos de grafos: Aplicable a configuraciones generales de flujos de grafos con número variable de nodos y aristas, soportando tareas de clasificación multiclase
Diseña un método de incrustación de grafos basado en prototipos: Convierte grafos en representaciones vectoriales de dimensión fija seleccionando grafos representativos de cada clase como prototipos
Integra un mecanismo híbrido de detección de cambio de concepto: Combina aprendizaje incremental y detección de cambio basada en pérdida, implementando una estrategia de adaptación activa-pasiva híbrida
Proporciona validación experimental completa: Verifica la efectividad del método en múltiples conjuntos de datos de referencia y realiza estudios de ablación detallados

Explicación Detallada del Método

Definición de Tarea

Dado un flujo de grafos $D = \{(g_t, y_t)\}_{t=1}^{\infty}$ , donde:

$g_t = (V, E)$ es un grafo atribuido en el paso temporal $t$
$y_t \in \{1, ..., K\}$ es la etiqueta de clase del grafo
Los grafos pueden tener un número variable de nodos y aristas
Los datos provienen de una distribución de probabilidad potencialmente no estacionaria $p_t(g, y)$

El objetivo es aprender un clasificador $h: G \rightarrow Y$ que pueda:

Clasificar con precisión grafos recién llegados
Adaptarse continuamente mediante aprendizaje incremental
Detectar y manejar cambios de concepto

Arquitectura del Modelo

1. Gestión de Memoria de Grafos

Mantiene múltiples colas que almacenan grafos recientes: $q = \{q_c\}_{c=1}^K$ $q_c = \{g_i\}_{i=1}^L$ donde $L$ es el tamaño de la cola para cada clase.

2. Selección de Prototipos de Grafos

Utiliza el algoritmo Centers para seleccionar $R$ grafos prototipo para cada clase: $p_c = \arg\min_{g_1 \in q_c} \sum_{g_2 \in q_c} \delta(g_1, g_2)$ donde $\delta(\cdot, \cdot)$ es la distancia de edición de grafos.

3. Generación de Incrustaciones de Grafos

Calcula incrustaciones de grafos basadas en prototipos: $e_g = \{\delta(g, p_i)\}_{i=1}^{R \times K}$ Convierte el grafo en un vector de dimensión $R \times K$ .

4. Aprendizaje Incremental

Utiliza un clasificador de red neuronal con función de costo: $C = \frac{1}{L \times K} \sum_{i=1}^{L \times K} l(y_i, h(e_{g_i}))$ El clasificador se actualiza mediante entrenamiento incremental: $h_t = h_{t-1}.train(\cdot)$

5. Detección de Cambio de Concepto

Mantiene dos colas de precisión de predicción:

Cola de referencia $q_{ref}$ : almacena puntuaciones de predicción históricas
Cola móvil $q_{mov}$ : almacena puntuaciones de predicción recientes

Utiliza modelado de distribución binomial, con condición de detección: $\mu_{mov} \leq \mu_{ref} - \beta\sigma_{ref}$ donde $\beta$ es un parámetro de sensibilidad.

Puntos de Innovación Técnica

Estrategia de Selección de Prototipos: Utiliza distancia de edición de grafos y método de mediana para seleccionar los grafos más representativos como prototipos
Adaptación Híbrida de Cambio: Combina aprendizaje incremental pasivo y detección activa de cambio, recalculando prototipos cuando se detecta un cambio
Procesamiento de Grafos Variables: Maneja grafos con número variable de nodos y aristas mediante método de incrustación basado en distancia
Detección Impulsada por Pérdida: Utiliza rendimiento de predicción en lugar de cambios en distribución de datos para detectar cambios de concepto

Configuración Experimental

Conjuntos de Datos

Conjunto de Datos Letter:
- Contiene representaciones en grafos de las letras "A", "I", "Z"
- Dos variantes: Letter high (perturbación alta), Letter med high (perturbación media-alta)
- Utilizado para probar la capacidad de adaptación al cambio de concepto
Conjunto de Datos GREC:
- Representaciones en grafos de símbolos de planos arquitectónicos y electrónicos
- Cinco niveles de perturbación
- Tres clases, distribución uniforme de grafos
Conjunto de Datos Fingerprint:
- Representaciones en grafos de imágenes de huellas dactilares
- Dos clases: "arch" y "left"
- Proveniente de la base de datos de huellas dactilares NIST-4

Métricas de Evaluación

Utiliza la media geométrica (G-mean): $G\text{-mean} = \sqrt[K]{\prod_{c=1}^K r_c}$ donde $r_c$ es la tasa de recuperación de la clase $c$ .

Adopta método de evaluación prequential con factor de decaimiento de 0.99.

Métodos de Comparación

Método Propuesto: Método completo con incrustación de prototipos
Método de Características: Método de línea base utilizando dos características simples: densidad de aristas y brecha espectral

Detalles de Implementación

Distancia de Grafos: Distancia de edición de grafos
Clasificador: Red neuronal completamente conectada
Optimizador: Adam
Tasa de Aprendizaje: 0.001-0.01 (dependiente del conjunto de datos)
Tamaño de Memoria: $L = 10$
Cantidad de Prototipos: $R = 1$ o $R = 3$

Resultados Experimentales

Resultados Principales

Efecto de la Memoria de Grafos: El uso de memoria de grafos mejora significativamente la velocidad de aprendizaje y el rendimiento final, particularmente en las etapas iniciales del aprendizaje.
Impacto de la Cantidad de Prototipos:
- Sin cambio o con cambio leve, 3 prototipos superan a 1 prototipo
- Después de cambio de concepto severo, menor cantidad de prototipos muestra mejor rendimiento
- En conjuntos de datos GREC y Fingerprint, 3 prototipos muestran consistentemente mejor rendimiento
Efectividad de Detección de Cambio de Concepto:
- Antes de que ocurra el cambio, el rendimiento es similar con o sin detector de cambio
- Después del cambio, el método con detector de cambio muestra mejora significativa de rendimiento
- Valida la efectividad del recálculo de prototipos
Comparación de Métodos: El método propuesto basado en incrustaciones supera significativamente al método basado en características simples en todos los conjuntos de datos.

Estudios de Ablación

Tamaño de Memoria: Verifica el papel crítico de la memoria de grafos en el rendimiento
Cantidad de Prototipos: Analiza el rendimiento de diferentes cantidades de prototipos en diferentes escenarios de cambio
Detección de Cambio: Demuestra la necesidad del mecanismo de detección de cambio

Hallazgos Experimentales

Curvas de Aprendizaje: Todos los métodos tienen una fase de aprendizaje inicial, pero el método propuesto converge más rápidamente
Adaptación a Cambios: La estrategia de adaptación a cambios basada en recálculo de prototipos es efectiva
Capacidad de Representación: Las incrustaciones basadas en prototipos tienen mayor capacidad expresiva que características de grafos simples

Trabajo Relacionado

Adaptación a Cambio de Concepto

Métodos Activos: Utilizan pruebas estadísticas o métodos de umbral para detectar explícitamente cambios
Métodos Pasivos: Utilizan aprendizaje incremental para adaptarse implícitamente a cambios
Métodos Híbridos: Combinan las ventajas de detección activa y adaptación pasiva

Clasificación de Flujos de Grafos

Clasificación Tradicional de Grafos: Se enfoca principalmente en grafos estáticos, con métodos ricos pero no aplicables a escenarios de flujo
Métodos Existentes de Flujos de Grafos: Se enfoca principalmente en detección de anomalías, con investigación limitada en clasificación multiclase
Incrustación de Grafos: Utiliza métodos como autocodificadores para aprender representaciones de grafos

La innovación de este artículo radica en combinar incrustación de prototipos, aprendizaje incremental y detección de cambio de concepto, dirigidos específicamente a tareas de clasificación multiclase de flujos de grafos.

Conclusiones y Discusión

Conclusiones Principales

Efectividad del Método: El método híbrido propuesto muestra excelente rendimiento en tareas de clasificación de flujos de grafos, particularmente en escenarios con cambio de concepto
Importancia de Componentes: La memoria de grafos, selección de prototipos y mecanismo de detección de cambio contribuyen todos significativamente al rendimiento final
Adaptabilidad: El método puede manejar efectivamente flujos de grafos dinámicos con número variable de nodos y aristas

Limitaciones

Complejidad Computacional: El cálculo de distancia de edición de grafos tiene alta complejidad computacional, lo que puede limitar aplicaciones a gran escala
Sensibilidad de Parámetros: El parámetro de sensibilidad de detección de cambio necesita ajustarse según la tarea
Disponibilidad de Etiquetas: Asume que se pueden obtener etiquetas verdaderas en cada paso, lo que puede no ser realista en aplicaciones prácticas

Direcciones Futuras

El artículo identifica explícitamente dos direcciones de investigación futuras importantes:

Aprendizaje de Incrustaciones de Grafos: Investigar métodos de aprendizaje de incrustaciones de grafos de extremo a extremo para aplicaciones a flujos de grafos a gran escala
Aprendizaje con Etiquetas Limitadas: Considerar paradigmas no supervisados, semi-supervisados, de aprendizaje activo, así como técnicas de aprendizaje con pocas muestras y aumento de datos

Evaluación Profunda

Fortalezas

Importancia del Problema: La clasificación de flujos de grafos es un problema práctico e importante con amplio valor de aplicación
Innovación del Método: Combina orgánicamente selección de prototipos, aprendizaje incremental y detección de cambio de concepto, formando una solución completa
Suficiencia Experimental: Realiza validación experimental completa, incluyendo estudios de ablación y análisis de parámetros
Claridad de Escritura: La estructura del artículo es clara, la descripción del método es detallada y fácil de entender y reproducir

Deficiencias

Escala de Conjuntos de Datos: Los conjuntos de datos utilizados son relativamente pequeños, el efecto en flujos de grafos a gran escala es desconocido
Eficiencia Computacional: La complejidad computacional del cálculo de distancia de edición de grafos puede convertirse en cuello de botella en aplicaciones prácticas
Análisis Teórico: Carece de análisis teórico y garantías de convergencia
Tipos de Cambio: Se enfoca principalmente en cambios abruptos, el efecto en cambios graduales no está claro

Impacto

Contribución Académica: Proporciona nuevas perspectivas de solución para clasificación de flujos de grafos, llenando vacíos en este campo
Valor Práctico: El método tiene potencial de aplicación práctica, particularmente en campos como monitoreo de infraestructura crítica
Reproducibilidad: Proporciona detalles de implementación detallados y configuración de parámetros, facilitando la reproducción

Escenarios Aplicables

Este método es particularmente adecuado para:

Monitoreo de sistemas de infraestructura crítica
Análisis dinámico de redes sociales
Descubrimiento de fármacos con grafos moleculares
Análisis de comportamiento de usuarios en sistemas de recomendación
Cualquier escenario que requiera procesar estructuras de grafos dinámicos con cambio de concepto

Referencias

El artículo cita 37 referencias relacionadas, cubriendo múltiples campos relacionados incluyendo detección de cambio de concepto, redes neuronales de grafos, aprendizaje incremental, etc., proporcionando una base teórica sólida para la investigación.

Evaluación General: Este es un artículo de alta calidad con contribuciones importantes en el campo de clasificación de flujos de grafos. El diseño del método es razonable, la validación experimental es suficiente, la escritura es clara, y proporciona insights valiosos y soluciones para el desarrollo del campo. Aunque existen algunas limitaciones, su innovación y practicidad le confieren valor académico y de aplicación significativo.