2025-11-12T07:37:09.358830

Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification

Malialis, Li, Panayiotou et al.
Data stream mining aims at extracting meaningful knowledge from continually evolving data streams, addressing the challenges posed by nonstationary environments, particularly, concept drift which refers to a change in the underlying data distribution over time. Graph structures offer a powerful modelling tool to represent complex systems, such as, critical infrastructure systems and social networks. Learning from graph streams becomes a necessity to understand the dynamics of graph structures and to facilitate informed decision-making. This work introduces a novel method for graph stream classification which operates under the general setting where a data generating process produces graphs with varying nodes and edges over time. The method uses incremental learning for continual model adaptation, selecting representative graphs (prototypes) for each class, and creating graph embeddings. Additionally, it incorporates a loss-based concept drift detection mechanism to recalculate graph prototypes when drift is detected.
academic

Apprentissage Incrémental avec Détection de Dérive Conceptuelle et Plongements Basés sur des Prototypes pour la Classification de Flux de Graphes

Informations Fondamentales

  • ID de l'article: 2404.02572
  • Titre: Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification
  • Auteurs: Kleanthis Malialis, Jin Li, Christos G. Panayiotou, Marios M. Polycarpou
  • Classification: cs.LG
  • Date de publication: 12 avril 2024 (arXiv v2)
  • Institution affiliée: Centre d'Excellence en Recherche et Innovation KIOS, Département d'Ingénierie Électrique et Informatique, Université de Chypre
  • Lien de l'article: https://arxiv.org/abs/2404.02572

Résumé

L'exploitation de flux de données vise à extraire des connaissances significatives à partir de flux de données en constante évolution, en abordant les défis posés par les environnements non stationnaires, en particulier la dérive conceptuelle (concept drift), c'est-à-dire les changements de la distribution de données sous-jacente au fil du temps. Les structures graphiques constituent des outils de modélisation puissants pour représenter des systèmes complexes, tels que les systèmes d'infrastructure critique et les réseaux sociaux. L'apprentissage à partir de flux de graphes devient une condition nécessaire pour comprendre la dynamique des structures graphiques et faciliter la prise de décision éclairée. Ce travail propose une nouvelle approche de classification de flux de graphes applicable au cadre général où le processus de génération de données produit des graphes dont les nœuds et les arêtes varient dans le temps. La méthode utilise l'apprentissage incrémental pour l'adaptation continue du modèle, sélectionne des graphes représentatifs (prototypes) pour chaque classe et crée des plongements de graphes. De plus, elle intègre un mécanisme de détection de dérive conceptuelle basé sur la perte, recalculant les prototypes de graphes lors de la détection d'une dérive.

Contexte et Motivation de la Recherche

1. Problème Central

Le problème central abordé par cette recherche est la tâche de classification dans un environnement dynamique de flux de graphes, où le nombre de nœuds et d'arêtes des graphes varie dans le temps et où existe un phénomène de dérive conceptuelle.

2. Importance du Problème

  • Besoins pratiques: De nombreux systèmes du monde réel (tels que les infrastructures critiques, les réseaux sociaux, les systèmes de recommandation) peuvent être représentés par des structures graphiques dynamiques
  • Caractéristiques des données: Les données produites par ces systèmes présentent des caractéristiques de haute vélocité, grande capacité et diversité
  • Défis environnementaux: La dérive conceptuelle dans les environnements non stationnaires entraîne une dégradation des performances du modèle

3. Limitations des Approches Existantes

  • Méthodes traditionnelles de classification de graphes: Principalement orientées vers les graphes statiques, incapables de traiter les flux de graphes dynamiques
  • Méthodes existantes de flux de graphes: La plupart se concentrent sur la détection d'anomalies plutôt que sur la classification multi-classe; manquent de mécanismes efficaces de gestion de la dérive conceptuelle
  • Extraction de caractéristiques: Les méthodes existantes utilisent des caractéristiques graphiques simples (telles que la densité des arêtes, l'écart spectral) avec une capacité d'expression limitée

4. Motivation de la Recherche

Nécessité de développer des approches capables de:

  • Traiter les flux de graphes dynamiques avec des nombres variables de nœuds et d'arêtes
  • Effectuer une classification multi-classe plutôt que de se limiter à la détection d'anomalies
  • Détecter et adapter efficacement la dérive conceptuelle
  • Utiliser des méthodes de représentation graphique plus riches

Contributions Principales

  1. Proposition d'un nouveau cadre de classification de flux de graphes: Applicable au cadre général de flux de graphes avec des nombres variables de nœuds et d'arêtes, supportant les tâches de classification multi-classe
  2. Conception d'une méthode de plongement de graphes basée sur des prototypes: Convertit les graphes en représentations vectorielles de dimension fixe en sélectionnant des graphes représentatifs comme prototypes pour chaque classe
  3. Intégration d'un mécanisme hybride de détection de dérive conceptuelle: Combine l'apprentissage incrémental et la détection de dérive basée sur la perte, réalisant une stratégie d'adaptation mixte active-passive
  4. Fourniture d'une vérification expérimentale complète: Valide l'efficacité de la méthode sur plusieurs ensembles de données de référence et effectue des études d'ablation détaillées

Détails de la Méthode

Définition de la Tâche

Étant donné un flux de graphes D={(gt,yt)}t=1D = \{(g_t, y_t)\}_{t=1}^{\infty}, où:

  • gt=(V,E)g_t = (V, E) est un graphe attribué à l'étape temporelle tt
  • yt{1,...,K}y_t \in \{1, ..., K\} est l'étiquette de classe du graphe
  • Les graphes peuvent avoir des nombres variables de nœuds et d'arêtes
  • Les données proviennent d'une distribution de probabilité potentiellement non stationnaire pt(g,y)p_t(g, y)

L'objectif est d'apprendre un classificateur h:GYh: G \rightarrow Y capable de:

  1. Classer avec précision les graphes nouvellement arrivés
  2. S'adapter continuellement par apprentissage incrémental
  3. Détecter et gérer la dérive conceptuelle

Architecture du Modèle

1. Gestion de la Mémoire de Graphes

Maintient plusieurs files d'attente stockant les graphes récents: q={qc}c=1Kq = \{q_c\}_{c=1}^Kqc={gi}i=1Lq_c = \{g_i\}_{i=1}^LLL est la taille de la file d'attente pour chaque classe.

2. Sélection de Prototypes de Graphes

Utilise l'algorithme Centers pour sélectionner RR graphes prototypes pour chaque classe: pc=argming1qcg2qcδ(g1,g2)p_c = \arg\min_{g_1 \in q_c} \sum_{g_2 \in q_c} \delta(g_1, g_2)δ(,)\delta(\cdot, \cdot) est la distance d'édition de graphes.

3. Génération de Plongements de Graphes

Calcule les plongements de graphes basés sur les prototypes: eg={δ(g,pi)}i=1R×Ke_g = \{\delta(g, p_i)\}_{i=1}^{R \times K} Convertit le graphe en un vecteur de dimension R×KR \times K.

4. Apprentissage Incrémental

Utilise un classificateur de réseau de neurones avec fonction de coût: C=1L×Ki=1L×Kl(yi,h(egi))C = \frac{1}{L \times K} \sum_{i=1}^{L \times K} l(y_i, h(e_{g_i})) Le classificateur est mis à jour par apprentissage incrémental: ht=ht1.train()h_t = h_{t-1}.train(\cdot)

5. Détection de Dérive Conceptuelle

Maintient deux files d'attente de précision de prédiction:

  • File de référence qrefq_{ref}: stocke les scores de prédiction historiques
  • File mobile qmovq_{mov}: stocke les scores de prédiction récents

Utilise une distribution binomiale pour la modélisation, condition de détection: μmovμrefβσref\mu_{mov} \leq \mu_{ref} - \beta\sigma_{ref}β\beta est un paramètre de sensibilité.

Points d'Innovation Technique

  1. Stratégie de sélection de prototypes: Utilise la distance d'édition de graphes et la méthode médiane pour sélectionner les graphes les plus représentatifs comme prototypes
  2. Adaptation hybride de dérive: Combine l'apprentissage incrémental passif et la détection de dérive active, recalculant les prototypes lors de la détection de dérive
  3. Traitement de graphes variables: Gère les graphes avec des nombres variables de nœuds et d'arêtes par une méthode de plongement basée sur la distance
  4. Détection pilotée par la perte: Utilise les performances de prédiction plutôt que les changements de distribution de données pour détecter la dérive conceptuelle

Configuration Expérimentale

Ensembles de Données

  1. Ensemble Letter:
    • Contient des représentations graphiques des lettres "A", "I", "Z"
    • Deux variantes: Letter high (perturbation élevée), Letter med high (perturbation moyenne-élevée)
    • Utilisé pour tester la capacité d'adaptation à la dérive conceptuelle
  2. Ensemble GREC:
    • Représentations graphiques de symboles de plans architecturaux et électroniques
    • Cinq niveaux de perturbation
    • Trois classes, graphes uniformément distribués
  3. Ensemble Fingerprint:
    • Représentations graphiques d'images d'empreintes digitales
    • Deux classes: "arch" et "left"
    • Provenant de la base de données d'empreintes digitales NIST-4

Métriques d'Évaluation

Utilise la moyenne géométrique (G-mean): G-mean=c=1KrcKG\text{-mean} = \sqrt[K]{\prod_{c=1}^K r_c}rcr_c est le rappel de la classe cc.

Adopte une méthode d'évaluation prédictive avec facteur d'amortissement (prequential evaluation), avec facteur d'amortissement fixé à 0,99.

Méthodes de Comparaison

  • Méthode proposée: Méthode complète utilisant les plongements de prototypes
  • Méthode de caractéristiques: Méthode de base utilisant deux caractéristiques simples: densité des arêtes et écart spectral

Détails d'Implémentation

  • Distance graphique: Distance d'édition de graphes
  • Classificateur: Réseau de neurones entièrement connecté
  • Optimiseur: Adam
  • Taux d'apprentissage: 0,001-0,01 (dépendant de l'ensemble de données)
  • Taille de la mémoire: L=10L = 10
  • Nombre de prototypes: R=1R = 1 ou R=3R = 3

Résultats Expérimentaux

Résultats Principaux

  1. Rôle de la mémoire de graphes: L'utilisation de la mémoire de graphes améliore significativement la vitesse d'apprentissage et les performances finales, particulièrement lors des premières étapes d'apprentissage.
  2. Impact du nombre de prototypes:
    • En l'absence de dérive ou avec dérive légère, 3 prototypes surpassent 1 prototype
    • Après une dérive conceptuelle sévère, un nombre moins élevé de prototypes montre de meilleures performances
    • Sur les ensembles GREC et Fingerprint, 3 prototypes montrent des performances constamment meilleures
  3. Efficacité de la détection de dérive conceptuelle:
    • Avant l'occurrence de la dérive conceptuelle, les performances avec et sans détecteur de dérive sont similaires
    • Après la dérive, la méthode avec détecteur de dérive montre une amélioration significative des performances
    • Valide l'efficacité du recalcul des prototypes
  4. Comparaison des méthodes: La méthode proposée basée sur les plongements surpasse significativement la méthode basée sur des caractéristiques simples sur tous les ensembles de données.

Études d'Ablation

  1. Taille de la mémoire: Valide le rôle critique de la mémoire de graphes sur les performances
  2. Nombre de prototypes: Analyse les performances de différents nombres de prototypes dans différents scénarios de dérive
  3. Détection de dérive: Démontre la nécessité du mécanisme de détection de dérive

Découvertes Expérimentales

  1. Courbes d'apprentissage: Toutes les méthodes présentent une phase d'apprentissage initiale, mais la méthode proposée converge plus rapidement
  2. Adaptation à la dérive: La stratégie d'adaptation de dérive basée sur le recalcul de prototypes est efficace
  3. Capacité de représentation: Les plongements basés sur des prototypes possèdent une plus grande capacité d'expression que les caractéristiques graphiques simples

Travaux Connexes

Adaptation à la Dérive Conceptuelle

  • Approches actives: Utilisent des tests statistiques ou des méthodes de seuil pour détecter explicitement la dérive
  • Approches passives: Utilisent l'apprentissage incrémental pour s'adapter implicitement à la dérive
  • Approches hybrides: Combinent les avantages de la détection active et de l'adaptation passive

Classification de Flux de Graphes

  • Classification traditionnelle de graphes: Principalement orientée vers les graphes statiques, avec des méthodes riches mais non applicables aux scénarios de flux
  • Méthodes existantes de flux de graphes: Principalement concentrées sur la détection d'anomalies, avec une recherche limitée sur la classification multi-classe
  • Plongements de graphes: Utilisent des méthodes telles que les autoencodeurs pour apprendre les représentations graphiques

L'innovation de cet article réside dans la combinaison des plongements de prototypes, de l'apprentissage incrémental et de la détection de dérive conceptuelle, spécifiquement adaptée aux tâches de classification multi-classe de flux de graphes.

Conclusions et Discussion

Conclusions Principales

  1. Efficacité de la méthode: La méthode hybride proposée montre d'excellentes performances sur les tâches de classification de flux de graphes, particulièrement dans les scénarios avec dérive conceptuelle
  2. Importance des composants: La mémoire de graphes, la sélection de prototypes et le mécanisme de détection de dérive contribuent tous de manière importante aux performances finales
  3. Adaptabilité: La méthode peut gérer efficacement les flux de graphes dynamiques avec des nombres variables de nœuds et d'arêtes

Limitations

  1. Complexité computationnelle: La complexité computationnelle du calcul de la distance d'édition de graphes est élevée, pouvant limiter les applications à grande échelle
  2. Sensibilité aux paramètres: Le paramètre de sensibilité de la détection de dérive nécessite un ajustement selon la tâche
  3. Disponibilité des étiquettes: Suppose que les étiquettes véritables sont disponibles à chaque étape, ce qui peut ne pas être réaliste dans les applications pratiques

Directions Futures

L'article identifie clairement deux directions de recherche futures importantes:

  1. Apprentissage de plongements de graphes: Étudier les méthodes d'apprentissage de plongements de graphes de bout en bout pour les applications à flux de graphes à grande échelle
  2. Apprentissage avec étiquettes limitées: Considérer les paradigmes non supervisés, semi-supervisés, d'apprentissage actif, ainsi que l'apprentissage avec peu d'exemples et les techniques d'augmentation de données

Évaluation Approfondie

Points Forts

  1. Importance du problème: La classification de flux de graphes est un problème pratique et important avec une large valeur d'application
  2. Innovativité de la méthode: Combine organiquement la sélection de prototypes, l'apprentissage incrémental et la détection de dérive conceptuelle, formant une solution complète
  3. Suffisance expérimentale: Effectue une vérification expérimentale complète, incluant des études d'ablation et des analyses de paramètres
  4. Clarté de la rédaction: La structure de l'article est claire, la description de la méthode est détaillée et facile à comprendre et reproduire

Insuffisances

  1. Échelle des ensembles de données: Les ensembles de données utilisés sont relativement petits, l'efficacité sur les flux de graphes à grande échelle reste inconnue
  2. Efficacité computationnelle: La complexité computationnelle élevée du calcul de la distance d'édition de graphes peut devenir un goulot d'étranglement pour les applications pratiques
  3. Analyse théorique: Manque d'analyse théorique et de garanties de convergence
  4. Types de dérive: Considère principalement la dérive soudaine, l'efficacité du traitement de la dérive progressive n'est pas claire

Influence

  1. Contribution académique: Fournit une nouvelle perspective de résolution pour la classification de flux de graphes, comblant un vide dans ce domaine
  2. Valeur pratique: La méthode possède un potentiel d'application pratique, particulièrement dans des domaines tels que la surveillance des infrastructures
  3. Reproductibilité: Fournit des détails d'implémentation détaillés et des paramètres, facilitant la reproduction

Scénarios d'Application

Cette méthode est particulièrement adaptée à:

  • Surveillance des systèmes d'infrastructure critique
  • Analyse dynamique des réseaux sociaux
  • Découverte de médicaments par graphes moléculaires
  • Analyse du comportement des utilisateurs dans les systèmes de recommandation
  • Tout scénario nécessitant le traitement de structures graphiques dynamiques avec dérive conceptuelle

Références

L'article cite 37 références connexes, couvrant plusieurs domaines connexes tels que la détection de dérive conceptuelle, les réseaux de neurones graphiques et l'apprentissage incrémental, fournissant une base théorique solide pour la recherche.


Évaluation Globale: Cet article est un travail de haute qualité avec des contributions importantes dans le domaine de la classification de flux de graphes. La conception de la méthode est raisonnable, la vérification expérimentale est suffisante, la rédaction est claire et il fournit des insights et des solutions précieuses pour le développement du domaine. Bien qu'il présente certaines limitations, son innovativité et son utilité pratique lui confèrent une valeur académique et applicative importante.