2025-11-12T07:37:09.358830

Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification

Malialis, Li, Panayiotou et al.

Data stream mining aims at extracting meaningful knowledge from continually evolving data streams, addressing the challenges posed by nonstationary environments, particularly, concept drift which refers to a change in the underlying data distribution over time. Graph structures offer a powerful modelling tool to represent complex systems, such as, critical infrastructure systems and social networks. Learning from graph streams becomes a necessity to understand the dynamics of graph structures and to facilitate informed decision-making. This work introduces a novel method for graph stream classification which operates under the general setting where a data generating process produces graphs with varying nodes and edges over time. The method uses incremental learning for continual model adaptation, selecting representative graphs (prototypes) for each class, and creating graph embeddings. Additionally, it incorporates a loss-based concept drift detection mechanism to recalculate graph prototypes when drift is detected.

academic

Inkrementelles Lernen mit Konzeptdrift-Erkennung und prototypbasierten Einbettungen zur Klassifizierung von Graphströmen

Grundinformationen

Paper-ID: 2404.02572
Titel: Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification
Autoren: Kleanthis Malialis, Jin Li, Christos G. Panayiotou, Marios M. Polycarpou
Klassifizierung: cs.LG
Veröffentlichungsdatum: 12. April 2024 (arXiv v2)
Zugehörige Institution: KIOS Forschungs- und Innovationszentrum für Exzellenz, Abteilung für Elektro- und Computertechnik, Universität Zypern
Paper-Link: https://arxiv.org/abs/2404.02572

Zusammenfassung

Das Data-Stream-Mining zielt darauf ab, aussagekräftige Erkenntnisse aus kontinuierlich sich entwickelnden Datenströmen zu gewinnen und dabei die Herausforderungen nicht-stationärer Umgebungen zu bewältigen, insbesondere die Konzeptdrift – die Veränderung der zugrunde liegenden Datenverteilung im Zeitverlauf. Graphstrukturen bieten ein leistungsstarkes Modellierungswerkzeug zur Darstellung komplexer Systeme wie kritische Infrastruktursysteme und soziale Netzwerke. Das Lernen aus Graphströmen ist notwendig geworden, um die Dynamik von Graphstrukturen zu verstehen und fundierte Entscheidungen zu treffen. Diese Arbeit schlägt eine neue Methode zur Klassifizierung von Graphströmen vor, die für die allgemeine Einstellung anwendbar ist, in der der Datenerzeugungsprozess Graphen mit zeitlich variierenden Knoten und Kanten erzeugt. Die Methode nutzt inkrementelles Lernen für kontinuierliche Modellanpassung, wählt repräsentative Graphen (Prototypen) für jede Klasse aus und erstellt Graph-Einbettungen. Darüber hinaus integriert sie einen verlustbasierten Konzeptdrift-Erkennungsmechanismus, der die Graph-Prototypen bei erkannter Drift neu berechnet.

Forschungshintergrund und Motivation

1. Kernproblem

Das Kernproblem dieser Forschung ist die Klassifizierungsaufgabe in dynamischen Graphstrom-Umgebungen, in denen sich die Anzahl der Knoten und Kanten eines Graphen im Zeitverlauf ändert und Konzeptdrift auftritt.

2. Problemrelevanz

Praktische Anforderung: Viele reale Systeme (wie kritische Infrastrukturen, soziale Netzwerke, Empfehlungssysteme) können durch dynamische Graphstrukturen dargestellt werden
Datenmerkmale: Die von diesen Systemen erzeugten Daten weisen hohe Geschwindigkeit, großes Volumen und Vielfalt auf
Umweltherausforderungen: Konzeptdrift in nicht-stationären Umgebungen führt zu Leistungsabfall des Modells

3. Einschränkungen bestehender Methoden

Traditionelle Graphklassifizierungsmethoden: Konzentrieren sich hauptsächlich auf statische Graphen und können keine Streaming-Dynamikgraphen verarbeiten
Bestehende Graphstrom-Methoden: Konzentrieren sich meist auf Anomalieerkennung statt auf Mehrklassen-Klassifizierung; es fehlen effektive Mechanismen zur Behandlung von Konzeptdrift
Merkmalsextraktion: Bestehende Methoden verwenden einfache Graphmerkmale (wie Kantendichte, Spektrallücke) mit begrenzter Ausdruckskraft

4. Forschungsmotivation

Es besteht Bedarf an der Entwicklung von Methoden, die:

Dynamische Graphströme mit variabler Knoten- und Kantenzahl verarbeiten können
Mehrklassen-Klassifizierung statt nur Anomalieerkennung durchführen
Konzeptdrift effektiv erkennen und sich daran anpassen
Reichhaltigere Graphdarstellungsmethoden verwenden

Kernbeiträge

Vorschlag eines neuen Graphstrom-Klassifizierungsrahmens: Anwendbar auf allgemeine Graphstrom-Einstellungen mit variabler Knoten- und Kantenzahl, unterstützt Mehrklassen-Klassifizierungsaufgaben
Entwurf einer prototypbasierten Graph-Einbettungsmethode: Konvertiert Graphen durch Auswahl repräsentativer Graphen jeder Klasse als Prototypen in Vektordarstellungen mit fester Dimension
Integration eines hybriden Konzeptdrift-Erkennungsmechanismus: Kombiniert inkrementelles Lernen und verlustbasierte Drift-Erkennung, um eine aktiv-passive Hybrid-Adaptationsstrategie zu realisieren
Bereitstellung vollständiger experimenteller Validierung: Validiert die Wirksamkeit der Methode auf mehreren Benchmark-Datensätzen mit detaillierten Ablationsstudien

Methodische Details

Aufgabendefinition

Gegeben ein Graphstrom $D = \{(g_t, y_t)\}_{t=1}^{\infty}$ , wobei:

$g_t = (V, E)$ ein attributierter Graph zum Zeitschritt $t$ ist
$y_t \in \{1, ..., K\}$ die Klassenlabel des Graphen ist
Graphen eine variable Anzahl von Knoten und Kanten haben können
Daten aus einer möglicherweise nicht-stationären Wahrscheinlichkeitsverteilung $p_t(g, y)$ stammen

Das Ziel ist das Erlernen eines Klassifizierers $h: G \rightarrow Y$ , der:

Neu ankommende Graphen genau klassifizieren kann
Sich durch inkrementelles Lernen kontinuierlich anpasst
Konzeptdrift erkennt und behandelt

Modellarchitektur

1. Graph-Speicherverwaltung

Verwaltung mehrerer Warteschlangen zur Speicherung aktueller Graphen: $q = \{q_c\}_{c=1}^K$ $q_c = \{g_i\}_{i=1}^L$ wobei $L$ die Größe der Warteschlange für jede Klasse ist.

2. Graph-Prototypauswahl

Verwendung des Centers-Algorithmus zur Auswahl von $R$ Prototypgraphen für jede Klasse: $p_c = \arg\min_{g_1 \in q_c} \sum_{g_2 \in q_c} \delta(g_1, g_2)$ wobei $\delta(\cdot, \cdot)$ die Graph-Editierdistanz ist.

3. Graph-Einbettungsgenerierung

Berechnung der Graph-Einbettung basierend auf Prototypen: $e_g = \{\delta(g, p_i)\}_{i=1}^{R \times K}$ Konvertiert den Graphen in einen Vektor der Dimension $R \times K$ .

4. Inkrementelles Lernen

Verwendung eines neuronalen Netzwerk-Klassifizierers mit Kostenfunktion: $C = \frac{1}{L \times K} \sum_{i=1}^{L \times K} l(y_i, h(e_{g_i}))$ Der Klassifizierer wird durch inkrementelles Training aktualisiert: $h_t = h_{t-1}.train(\cdot)$

5. Konzeptdrift-Erkennung

Verwaltung zweier Warteschlangen für Vorhersagegenauigkeit:

Referenzwarteschlange $q_{ref}$ : Speichert historische Vorhersageergebnisse
Bewegliche Warteschlange $q_{mov}$ : Speichert aktuelle Vorhersageergebnisse

Verwendung der Binomialverteilung zur Modellierung, Erkennungsbedingung: $\mu_{mov} \leq \mu_{ref} - \beta\sigma_{ref}$ wobei $\beta$ ein Empfindlichkeitsparameter ist.

Technische Innovationen

Prototypauswahl-Strategie: Verwendung der Graph-Editierdistanz und der Median-Methode zur Auswahl der repräsentativsten Graphen als Prototypen
Hybrid-Drift-Anpassung: Kombination von passivem inkrementellem Lernen und aktiver Drift-Erkennung mit Neuberechnung von Prototypen bei erkannter Drift
Verarbeitung variabler Graphen: Behandlung von Graphen mit variabler Knoten- und Kantenzahl durch distanzbasierte Einbettungsmethoden
Verlustgesteuerte Erkennung: Verwendung von Vorhersageleistung statt Datenverteilungsänderung zur Erkennung von Konzeptdrift

Experimentelle Einrichtung

Datensätze

Letter-Datensatz:
- Enthält Graphdarstellungen der Buchstaben "A", "I", "Z"
- Zwei Varianten: Letter high (hohe Störung), Letter med high (mittlere bis hohe Störung)
- Zur Prüfung der Konzeptdrift-Adaptationsfähigkeit
GREC-Datensatz:
- Graphdarstellungen von Architektur- und Elektronikzeichnungssymbolen
- Fünf Störungsstufen
- Drei Klassen mit gleichmäßig verteilten Graphen
Fingerprint-Datensatz:
- Graphdarstellungen von Fingerabdruckbildern
- Zwei Klassen: "arch" und "left"
- Aus der NIST-4-Fingerabdruckdatenbank

Bewertungsmetriken

Verwendung des geometrischen Mittels (G-mean): $G\text{-mean} = \sqrt[K]{\prod_{c=1}^K r_c}$ wobei $r_c$ die Recall-Rate der Klasse $c$ ist.

Anwendung der prequential-Evaluierungsmethode mit Abklingfaktor 0,99.

Vergleichsmethoden

Vorgeschlagene Methode: Vollständige Methode mit Prototyp-Einbettung
Merkmalsmethode: Baseline-Methode mit zwei einfachen Merkmalen (Kantendichte und Spektrallücke)

Implementierungsdetails

Graph-Distanz: Graph-Editierdistanz
Klassifizierer: Vollständig verbundenes neuronales Netzwerk
Optimierer: Adam
Lernrate: 0,001-0,01 (datensatzabhängig)
Speichergröße: $L = 10$
Anzahl der Prototypen: $R = 1$ oder $R = 3$

Experimentelle Ergebnisse

Hauptergebnisse

Auswirkung des Graph-Speichers: Die Verwendung des Graph-Speichers verbessert die Lerngeschwindigkeit und die endgültige Leistung erheblich, besonders in der frühen Lernphase.
Auswirkung der Prototypanzahl:
- Ohne Drift oder bei leichter Drift ist 1 Prototyp besser als 3 Prototypen
- Nach schwerer Konzeptdrift zeigt eine geringere Prototypanzahl bessere Leistung
- Bei GREC- und Fingerprint-Datensätzen zeigen 3 Prototypen durchgehend bessere Leistung
Wirksamkeit der Konzeptdrift-Erkennung:
- Vor Auftreten von Konzeptdrift ist die Leistung mit und ohne Drift-Detektor ähnlich
- Nach Drift-Auftreten zeigt die Methode mit Drift-Detektor signifikante Leistungsverbesserung
- Validiert die Wirksamkeit der Prototyp-Neuberechnung
Methodenvergleich: Die vorgeschlagene einbettungsbasierte Methode übertrifft die merkmalbasierte Methode auf allen Datensätzen deutlich.

Ablationsstudien

Speichergröße: Validiert die kritische Rolle des Graph-Speichers für die Leistung
Prototypanzahl: Analysiert die Leistung verschiedener Prototypanzahlen in verschiedenen Drift-Szenarien
Drift-Erkennung: Demonstriert die Notwendigkeit des Drift-Erkennungsmechanismus

Experimentelle Erkenntnisse

Lernkurven: Alle Methoden zeigen anfängliche Lernphasen, aber die vorgeschlagene Methode konvergiert schneller
Drift-Anpassung: Die auf Prototyp-Neuberechnung basierende Drift-Adaptationsstrategie ist wirksam
Darstellungsfähigkeit: Prototyp-basierte Einbettungen sind ausdrucksstärker als einfache Graphmerkmale

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Methodenwirksamkeit: Die vorgeschlagene Hybrid-Methode zeigt ausgezeichnete Leistung bei Graphstrom-Klassifizierungsaufgaben, besonders in Szenarien mit Konzeptdrift
Komponentenbedeutung: Graph-Speicher, Prototypauswahl und Drift-Erkennungsmechanismus tragen alle wesentlich zur endgültigen Leistung bei
Adaptivität: Die Methode kann dynamische Graphströme mit variabler Knoten- und Kantenzahl effektiv verarbeiten

Einschränkungen

Rechenkomplexität: Die Berechnung der Graph-Editierdistanz hat hohe Komplexität und kann großflächige Anwendungen einschränken
Parameterempfindlichkeit: Der Empfindlichkeitsparameter der Drift-Erkennung muss je nach Aufgabe angepasst werden
Label-Verfügbarkeit: Setzt voraus, dass echte Labels bei jedem Schritt verfügbar sind, was in praktischen Anwendungen möglicherweise nicht realistisch ist

Zukünftige Richtungen

Das Paper identifiziert zwei wichtige zukünftige Forschungsrichtungen:

Erlernen von Graph-Einbettungen: Untersuchung von Methoden zum End-to-End-Erlernen von Graph-Einbettungen für großflächige Graphstrom-Probleme
Lernen mit begrenzten Labels: Berücksichtigung von unüberwachten, halbüberwachten und aktiven Lernparadigmen sowie Few-Shot-Learning und Datenerweiterungstechniken

Tiefgehende Bewertung

Stärken

Problemrelevanz: Graphstrom-Klassifizierung ist ein praktisches und wichtiges Problem mit breiter Anwendbarkeit
Methodische Innovation: Organische Kombination von Prototypauswahl, inkrementellem Lernen und Konzeptdrift-Erkennung zu einer vollständigen Lösung
Experimentelle Vollständigkeit: Umfassende experimentelle Validierung einschließlich Ablationsstudien und Parameteranalyse
Schreibklarheit: Klare Papierstruktur, detaillierte Methodenbeschreibung, leicht verständlich und reproduzierbar

Schwächen

Datensatzgröße: Die verwendeten Datensätze sind relativ klein, die Wirksamkeit bei großflächigen Graphströmen ist unbekannt
Recheneffizienz: Die hohe Komplexität der Graph-Editierdistanz-Berechnung könnte ein Engpass für praktische Anwendungen sein
Theoretische Analyse: Mangel an theoretischer Analyse und Konvergenzgarantien
Drift-Typen: Konzentriert sich hauptsächlich auf plötzliche Drift, die Wirksamkeit bei gradueller Drift ist unklar

Einfluss

Akademischer Beitrag: Bietet neue Lösungsansätze für Graphstrom-Klassifizierung und füllt Lücken in diesem Forschungsbereich
Praktischer Wert: Die Methode hat Anwendungspotenzial, besonders in Bereichen wie Infrastrukturüberwachung
Reproduzierbarkeit: Detaillierte Implementierungsdetails und Parametereinstellungen fördern die Reproduzierbarkeit

Anwendungsszenarien

Diese Methode ist besonders geeignet für:

Überwachung kritischer Infrastruktursysteme
Dynamische Analyse sozialer Netzwerke
Molekulargraph-Wirkstoffforschung
Benutzerverhaltenanalyse in Empfehlungssystemen
Alle Szenarien, die die Verarbeitung dynamischer Graphstrukturen mit Konzeptdrift erfordern

Literaturverzeichnis

Das Paper zitiert 37 verwandte Arbeiten, die Konzeptdrift-Erkennung, Graphneuronale Netze, inkrementelles Lernen und andere verwandte Bereiche abdecken und eine solide theoretische Grundlage für die Forschung bieten.

Gesamtbewertung: Dies ist ein hochqualitatives Paper mit wichtigen Beiträgen zum Bereich der Graphstrom-Klassifizierung. Die Methodengestaltung ist vernünftig, die experimentelle Validierung ist umfassend, die Schreibweise ist klar und es bietet wertvolle Erkenntnisse und Lösungen für die Entwicklung dieses Bereichs. Trotz einiger Einschränkungen machen seine Innovativität und Praktikabilität es zu einem Paper mit wichtigem akademischem und anwendungsorientiertem Wert.