2025-11-12T07:37:09.358830

Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification

Malialis, Li, Panayiotou et al.

Data stream mining aims at extracting meaningful knowledge from continually evolving data streams, addressing the challenges posed by nonstationary environments, particularly, concept drift which refers to a change in the underlying data distribution over time. Graph structures offer a powerful modelling tool to represent complex systems, such as, critical infrastructure systems and social networks. Learning from graph streams becomes a necessity to understand the dynamics of graph structures and to facilitate informed decision-making. This work introduces a novel method for graph stream classification which operates under the general setting where a data generating process produces graphs with varying nodes and edges over time. The method uses incremental learning for continual model adaptation, selecting representative graphs (prototypes) for each class, and creating graph embeddings. Additionally, it incorporates a loss-based concept drift detection mechanism to recalculate graph prototypes when drift is detected.

academic

Apprentissage Incrémental avec Détection de Dérive Conceptuelle et Plongements Basés sur des Prototypes pour la Classification de Flux de Graphes

Informations Fondamentales

ID de l'article: 2404.02572
Titre: Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification
Auteurs: Kleanthis Malialis, Jin Li, Christos G. Panayiotou, Marios M. Polycarpou
Classification: cs.LG
Date de publication: 12 avril 2024 (arXiv v2)
Institution affiliée: Centre d'Excellence en Recherche et Innovation KIOS, Département d'Ingénierie Électrique et Informatique, Université de Chypre
Lien de l'article: https://arxiv.org/abs/2404.02572

Résumé

L'exploitation de flux de données vise à extraire des connaissances significatives à partir de flux de données en constante évolution, en abordant les défis posés par les environnements non stationnaires, en particulier la dérive conceptuelle (concept drift), c'est-à-dire les changements de la distribution de données sous-jacente au fil du temps. Les structures graphiques constituent des outils de modélisation puissants pour représenter des systèmes complexes, tels que les systèmes d'infrastructure critique et les réseaux sociaux. L'apprentissage à partir de flux de graphes devient une condition nécessaire pour comprendre la dynamique des structures graphiques et faciliter la prise de décision éclairée. Ce travail propose une nouvelle approche de classification de flux de graphes applicable au cadre général où le processus de génération de données produit des graphes dont les nœuds et les arêtes varient dans le temps. La méthode utilise l'apprentissage incrémental pour l'adaptation continue du modèle, sélectionne des graphes représentatifs (prototypes) pour chaque classe et crée des plongements de graphes. De plus, elle intègre un mécanisme de détection de dérive conceptuelle basé sur la perte, recalculant les prototypes de graphes lors de la détection d'une dérive.

Contexte et Motivation de la Recherche

1. Problème Central

Le problème central abordé par cette recherche est la tâche de classification dans un environnement dynamique de flux de graphes, où le nombre de nœuds et d'arêtes des graphes varie dans le temps et où existe un phénomène de dérive conceptuelle.

2. Importance du Problème

Besoins pratiques: De nombreux systèmes du monde réel (tels que les infrastructures critiques, les réseaux sociaux, les systèmes de recommandation) peuvent être représentés par des structures graphiques dynamiques
Caractéristiques des données: Les données produites par ces systèmes présentent des caractéristiques de haute vélocité, grande capacité et diversité
Défis environnementaux: La dérive conceptuelle dans les environnements non stationnaires entraîne une dégradation des performances du modèle

3. Limitations des Approches Existantes

Méthodes traditionnelles de classification de graphes: Principalement orientées vers les graphes statiques, incapables de traiter les flux de graphes dynamiques
Méthodes existantes de flux de graphes: La plupart se concentrent sur la détection d'anomalies plutôt que sur la classification multi-classe; manquent de mécanismes efficaces de gestion de la dérive conceptuelle
Extraction de caractéristiques: Les méthodes existantes utilisent des caractéristiques graphiques simples (telles que la densité des arêtes, l'écart spectral) avec une capacité d'expression limitée

4. Motivation de la Recherche

Nécessité de développer des approches capables de:

Traiter les flux de graphes dynamiques avec des nombres variables de nœuds et d'arêtes
Effectuer une classification multi-classe plutôt que de se limiter à la détection d'anomalies
Détecter et adapter efficacement la dérive conceptuelle
Utiliser des méthodes de représentation graphique plus riches

Contributions Principales

Proposition d'un nouveau cadre de classification de flux de graphes: Applicable au cadre général de flux de graphes avec des nombres variables de nœuds et d'arêtes, supportant les tâches de classification multi-classe
Conception d'une méthode de plongement de graphes basée sur des prototypes: Convertit les graphes en représentations vectorielles de dimension fixe en sélectionnant des graphes représentatifs comme prototypes pour chaque classe
Intégration d'un mécanisme hybride de détection de dérive conceptuelle: Combine l'apprentissage incrémental et la détection de dérive basée sur la perte, réalisant une stratégie d'adaptation mixte active-passive
Fourniture d'une vérification expérimentale complète: Valide l'efficacité de la méthode sur plusieurs ensembles de données de référence et effectue des études d'ablation détaillées

Détails de la Méthode

Définition de la Tâche

Étant donné un flux de graphes $D = \{(g_t, y_t)\}_{t=1}^{\infty}$ , où:

$g_t = (V, E)$ est un graphe attribué à l'étape temporelle $t$
$y_t \in \{1, ..., K\}$ est l'étiquette de classe du graphe
Les graphes peuvent avoir des nombres variables de nœuds et d'arêtes
Les données proviennent d'une distribution de probabilité potentiellement non stationnaire $p_t(g, y)$

L'objectif est d'apprendre un classificateur $h: G \rightarrow Y$ capable de:

Classer avec précision les graphes nouvellement arrivés
S'adapter continuellement par apprentissage incrémental
Détecter et gérer la dérive conceptuelle

Architecture du Modèle

1. Gestion de la Mémoire de Graphes

Maintient plusieurs files d'attente stockant les graphes récents: $q = \{q_c\}_{c=1}^K$ $q_c = \{g_i\}_{i=1}^L$ où $L$ est la taille de la file d'attente pour chaque classe.

2. Sélection de Prototypes de Graphes

Utilise l'algorithme Centers pour sélectionner $R$ graphes prototypes pour chaque classe: $p_c = \arg\min_{g_1 \in q_c} \sum_{g_2 \in q_c} \delta(g_1, g_2)$ où $\delta(\cdot, \cdot)$ est la distance d'édition de graphes.

3. Génération de Plongements de Graphes

Calcule les plongements de graphes basés sur les prototypes: $e_g = \{\delta(g, p_i)\}_{i=1}^{R \times K}$ Convertit le graphe en un vecteur de dimension $R \times K$ .

4. Apprentissage Incrémental

Utilise un classificateur de réseau de neurones avec fonction de coût: $C = \frac{1}{L \times K} \sum_{i=1}^{L \times K} l(y_i, h(e_{g_i}))$ Le classificateur est mis à jour par apprentissage incrémental: $h_t = h_{t-1}.train(\cdot)$

5. Détection de Dérive Conceptuelle

Maintient deux files d'attente de précision de prédiction:

File de référence $q_{ref}$ : stocke les scores de prédiction historiques
File mobile $q_{mov}$ : stocke les scores de prédiction récents

Utilise une distribution binomiale pour la modélisation, condition de détection: $\mu_{mov} \leq \mu_{ref} - \beta\sigma_{ref}$ où $\beta$ est un paramètre de sensibilité.

Points d'Innovation Technique

Stratégie de sélection de prototypes: Utilise la distance d'édition de graphes et la méthode médiane pour sélectionner les graphes les plus représentatifs comme prototypes
Adaptation hybride de dérive: Combine l'apprentissage incrémental passif et la détection de dérive active, recalculant les prototypes lors de la détection de dérive
Traitement de graphes variables: Gère les graphes avec des nombres variables de nœuds et d'arêtes par une méthode de plongement basée sur la distance
Détection pilotée par la perte: Utilise les performances de prédiction plutôt que les changements de distribution de données pour détecter la dérive conceptuelle

Configuration Expérimentale

Ensembles de Données

Ensemble Letter:
- Contient des représentations graphiques des lettres "A", "I", "Z"
- Deux variantes: Letter high (perturbation élevée), Letter med high (perturbation moyenne-élevée)
- Utilisé pour tester la capacité d'adaptation à la dérive conceptuelle
Ensemble GREC:
- Représentations graphiques de symboles de plans architecturaux et électroniques
- Cinq niveaux de perturbation
- Trois classes, graphes uniformément distribués
Ensemble Fingerprint:
- Représentations graphiques d'images d'empreintes digitales
- Deux classes: "arch" et "left"
- Provenant de la base de données d'empreintes digitales NIST-4

Métriques d'Évaluation

Utilise la moyenne géométrique (G-mean): $G\text{-mean} = \sqrt[K]{\prod_{c=1}^K r_c}$ où $r_c$ est le rappel de la classe $c$ .

Adopte une méthode d'évaluation prédictive avec facteur d'amortissement (prequential evaluation), avec facteur d'amortissement fixé à 0,99.

Méthodes de Comparaison

Méthode proposée: Méthode complète utilisant les plongements de prototypes
Méthode de caractéristiques: Méthode de base utilisant deux caractéristiques simples: densité des arêtes et écart spectral

Détails d'Implémentation

Distance graphique: Distance d'édition de graphes
Classificateur: Réseau de neurones entièrement connecté
Optimiseur: Adam
Taux d'apprentissage: 0,001-0,01 (dépendant de l'ensemble de données)
Taille de la mémoire: $L = 10$
Nombre de prototypes: $R = 1$ ou $R = 3$

Résultats Expérimentaux

Résultats Principaux

Rôle de la mémoire de graphes: L'utilisation de la mémoire de graphes améliore significativement la vitesse d'apprentissage et les performances finales, particulièrement lors des premières étapes d'apprentissage.
Impact du nombre de prototypes:
- En l'absence de dérive ou avec dérive légère, 3 prototypes surpassent 1 prototype
- Après une dérive conceptuelle sévère, un nombre moins élevé de prototypes montre de meilleures performances
- Sur les ensembles GREC et Fingerprint, 3 prototypes montrent des performances constamment meilleures
Efficacité de la détection de dérive conceptuelle:
- Avant l'occurrence de la dérive conceptuelle, les performances avec et sans détecteur de dérive sont similaires
- Après la dérive, la méthode avec détecteur de dérive montre une amélioration significative des performances
- Valide l'efficacité du recalcul des prototypes
Comparaison des méthodes: La méthode proposée basée sur les plongements surpasse significativement la méthode basée sur des caractéristiques simples sur tous les ensembles de données.

Études d'Ablation

Taille de la mémoire: Valide le rôle critique de la mémoire de graphes sur les performances
Nombre de prototypes: Analyse les performances de différents nombres de prototypes dans différents scénarios de dérive
Détection de dérive: Démontre la nécessité du mécanisme de détection de dérive

Découvertes Expérimentales

Courbes d'apprentissage: Toutes les méthodes présentent une phase d'apprentissage initiale, mais la méthode proposée converge plus rapidement
Adaptation à la dérive: La stratégie d'adaptation de dérive basée sur le recalcul de prototypes est efficace
Capacité de représentation: Les plongements basés sur des prototypes possèdent une plus grande capacité d'expression que les caractéristiques graphiques simples

Travaux Connexes

Adaptation à la Dérive Conceptuelle

Approches actives: Utilisent des tests statistiques ou des méthodes de seuil pour détecter explicitement la dérive
Approches passives: Utilisent l'apprentissage incrémental pour s'adapter implicitement à la dérive
Approches hybrides: Combinent les avantages de la détection active et de l'adaptation passive

Classification de Flux de Graphes

Classification traditionnelle de graphes: Principalement orientée vers les graphes statiques, avec des méthodes riches mais non applicables aux scénarios de flux
Méthodes existantes de flux de graphes: Principalement concentrées sur la détection d'anomalies, avec une recherche limitée sur la classification multi-classe
Plongements de graphes: Utilisent des méthodes telles que les autoencodeurs pour apprendre les représentations graphiques

L'innovation de cet article réside dans la combinaison des plongements de prototypes, de l'apprentissage incrémental et de la détection de dérive conceptuelle, spécifiquement adaptée aux tâches de classification multi-classe de flux de graphes.

Conclusions et Discussion

Conclusions Principales

Efficacité de la méthode: La méthode hybride proposée montre d'excellentes performances sur les tâches de classification de flux de graphes, particulièrement dans les scénarios avec dérive conceptuelle
Importance des composants: La mémoire de graphes, la sélection de prototypes et le mécanisme de détection de dérive contribuent tous de manière importante aux performances finales
Adaptabilité: La méthode peut gérer efficacement les flux de graphes dynamiques avec des nombres variables de nœuds et d'arêtes

Limitations

Complexité computationnelle: La complexité computationnelle du calcul de la distance d'édition de graphes est élevée, pouvant limiter les applications à grande échelle
Sensibilité aux paramètres: Le paramètre de sensibilité de la détection de dérive nécessite un ajustement selon la tâche
Disponibilité des étiquettes: Suppose que les étiquettes véritables sont disponibles à chaque étape, ce qui peut ne pas être réaliste dans les applications pratiques

Directions Futures

L'article identifie clairement deux directions de recherche futures importantes:

Apprentissage de plongements de graphes: Étudier les méthodes d'apprentissage de plongements de graphes de bout en bout pour les applications à flux de graphes à grande échelle
Apprentissage avec étiquettes limitées: Considérer les paradigmes non supervisés, semi-supervisés, d'apprentissage actif, ainsi que l'apprentissage avec peu d'exemples et les techniques d'augmentation de données

Évaluation Approfondie

Points Forts

Importance du problème: La classification de flux de graphes est un problème pratique et important avec une large valeur d'application
Innovativité de la méthode: Combine organiquement la sélection de prototypes, l'apprentissage incrémental et la détection de dérive conceptuelle, formant une solution complète
Suffisance expérimentale: Effectue une vérification expérimentale complète, incluant des études d'ablation et des analyses de paramètres
Clarté de la rédaction: La structure de l'article est claire, la description de la méthode est détaillée et facile à comprendre et reproduire

Insuffisances

Échelle des ensembles de données: Les ensembles de données utilisés sont relativement petits, l'efficacité sur les flux de graphes à grande échelle reste inconnue
Efficacité computationnelle: La complexité computationnelle élevée du calcul de la distance d'édition de graphes peut devenir un goulot d'étranglement pour les applications pratiques
Analyse théorique: Manque d'analyse théorique et de garanties de convergence
Types de dérive: Considère principalement la dérive soudaine, l'efficacité du traitement de la dérive progressive n'est pas claire

Influence

Contribution académique: Fournit une nouvelle perspective de résolution pour la classification de flux de graphes, comblant un vide dans ce domaine
Valeur pratique: La méthode possède un potentiel d'application pratique, particulièrement dans des domaines tels que la surveillance des infrastructures
Reproductibilité: Fournit des détails d'implémentation détaillés et des paramètres, facilitant la reproduction

Scénarios d'Application

Cette méthode est particulièrement adaptée à:

Surveillance des systèmes d'infrastructure critique
Analyse dynamique des réseaux sociaux
Découverte de médicaments par graphes moléculaires
Analyse du comportement des utilisateurs dans les systèmes de recommandation
Tout scénario nécessitant le traitement de structures graphiques dynamiques avec dérive conceptuelle

Références

L'article cite 37 références connexes, couvrant plusieurs domaines connexes tels que la détection de dérive conceptuelle, les réseaux de neurones graphiques et l'apprentissage incrémental, fournissant une base théorique solide pour la recherche.

Évaluation Globale: Cet article est un travail de haute qualité avec des contributions importantes dans le domaine de la classification de flux de graphes. La conception de la méthode est raisonnable, la vérification expérimentale est suffisante, la rédaction est claire et il fournit des insights et des solutions précieuses pour le développement du domaine. Bien qu'il présente certaines limitations, son innovativité et son utilité pratique lui confèrent une valeur académique et applicative importante.