Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification
Malialis, Li, Panayiotou et al.
Data stream mining aims at extracting meaningful knowledge from continually evolving data streams, addressing the challenges posed by nonstationary environments, particularly, concept drift which refers to a change in the underlying data distribution over time. Graph structures offer a powerful modelling tool to represent complex systems, such as, critical infrastructure systems and social networks. Learning from graph streams becomes a necessity to understand the dynamics of graph structures and to facilitate informed decision-making. This work introduces a novel method for graph stream classification which operates under the general setting where a data generating process produces graphs with varying nodes and edges over time. The method uses incremental learning for continual model adaptation, selecting representative graphs (prototypes) for each class, and creating graph embeddings. Additionally, it incorporates a loss-based concept drift detection mechanism to recalculate graph prototypes when drift is detected.
academic
Inkrementelles Lernen mit Konzeptdrift-Erkennung und prototypbasierten Einbettungen zur Klassifizierung von Graphströmen
Das Data-Stream-Mining zielt darauf ab, aussagekräftige Erkenntnisse aus kontinuierlich sich entwickelnden Datenströmen zu gewinnen und dabei die Herausforderungen nicht-stationärer Umgebungen zu bewältigen, insbesondere die Konzeptdrift – die Veränderung der zugrunde liegenden Datenverteilung im Zeitverlauf. Graphstrukturen bieten ein leistungsstarkes Modellierungswerkzeug zur Darstellung komplexer Systeme wie kritische Infrastruktursysteme und soziale Netzwerke. Das Lernen aus Graphströmen ist notwendig geworden, um die Dynamik von Graphstrukturen zu verstehen und fundierte Entscheidungen zu treffen. Diese Arbeit schlägt eine neue Methode zur Klassifizierung von Graphströmen vor, die für die allgemeine Einstellung anwendbar ist, in der der Datenerzeugungsprozess Graphen mit zeitlich variierenden Knoten und Kanten erzeugt. Die Methode nutzt inkrementelles Lernen für kontinuierliche Modellanpassung, wählt repräsentative Graphen (Prototypen) für jede Klasse aus und erstellt Graph-Einbettungen. Darüber hinaus integriert sie einen verlustbasierten Konzeptdrift-Erkennungsmechanismus, der die Graph-Prototypen bei erkannter Drift neu berechnet.
Das Kernproblem dieser Forschung ist die Klassifizierungsaufgabe in dynamischen Graphstrom-Umgebungen, in denen sich die Anzahl der Knoten und Kanten eines Graphen im Zeitverlauf ändert und Konzeptdrift auftritt.
Praktische Anforderung: Viele reale Systeme (wie kritische Infrastrukturen, soziale Netzwerke, Empfehlungssysteme) können durch dynamische Graphstrukturen dargestellt werden
Datenmerkmale: Die von diesen Systemen erzeugten Daten weisen hohe Geschwindigkeit, großes Volumen und Vielfalt auf
Umweltherausforderungen: Konzeptdrift in nicht-stationären Umgebungen führt zu Leistungsabfall des Modells
Traditionelle Graphklassifizierungsmethoden: Konzentrieren sich hauptsächlich auf statische Graphen und können keine Streaming-Dynamikgraphen verarbeiten
Bestehende Graphstrom-Methoden: Konzentrieren sich meist auf Anomalieerkennung statt auf Mehrklassen-Klassifizierung; es fehlen effektive Mechanismen zur Behandlung von Konzeptdrift
Vorschlag eines neuen Graphstrom-Klassifizierungsrahmens: Anwendbar auf allgemeine Graphstrom-Einstellungen mit variabler Knoten- und Kantenzahl, unterstützt Mehrklassen-Klassifizierungsaufgaben
Entwurf einer prototypbasierten Graph-Einbettungsmethode: Konvertiert Graphen durch Auswahl repräsentativer Graphen jeder Klasse als Prototypen in Vektordarstellungen mit fester Dimension
Integration eines hybriden Konzeptdrift-Erkennungsmechanismus: Kombiniert inkrementelles Lernen und verlustbasierte Drift-Erkennung, um eine aktiv-passive Hybrid-Adaptationsstrategie zu realisieren
Bereitstellung vollständiger experimenteller Validierung: Validiert die Wirksamkeit der Methode auf mehreren Benchmark-Datensätzen mit detaillierten Ablationsstudien
Verwaltung mehrerer Warteschlangen zur Speicherung aktueller Graphen:
q={qc}c=1Kqc={gi}i=1L
wobei L die Größe der Warteschlange für jede Klasse ist.
Verwendung des Centers-Algorithmus zur Auswahl von R Prototypgraphen für jede Klasse:
pc=argming1∈qc∑g2∈qcδ(g1,g2)
wobei δ(⋅,⋅) die Graph-Editierdistanz ist.
Verwendung eines neuronalen Netzwerk-Klassifizierers mit Kostenfunktion:
C=L×K1∑i=1L×Kl(yi,h(egi))
Der Klassifizierer wird durch inkrementelles Training aktualisiert: ht=ht−1.train(⋅)
Prototypauswahl-Strategie: Verwendung der Graph-Editierdistanz und der Median-Methode zur Auswahl der repräsentativsten Graphen als Prototypen
Hybrid-Drift-Anpassung: Kombination von passivem inkrementellem Lernen und aktiver Drift-Erkennung mit Neuberechnung von Prototypen bei erkannter Drift
Verarbeitung variabler Graphen: Behandlung von Graphen mit variabler Knoten- und Kantenzahl durch distanzbasierte Einbettungsmethoden
Verlustgesteuerte Erkennung: Verwendung von Vorhersageleistung statt Datenverteilungsänderung zur Erkennung von Konzeptdrift
Auswirkung des Graph-Speichers: Die Verwendung des Graph-Speichers verbessert die Lerngeschwindigkeit und die endgültige Leistung erheblich, besonders in der frühen Lernphase.
Auswirkung der Prototypanzahl:
Ohne Drift oder bei leichter Drift ist 1 Prototyp besser als 3 Prototypen
Nach schwerer Konzeptdrift zeigt eine geringere Prototypanzahl bessere Leistung
Bei GREC- und Fingerprint-Datensätzen zeigen 3 Prototypen durchgehend bessere Leistung
Wirksamkeit der Konzeptdrift-Erkennung:
Vor Auftreten von Konzeptdrift ist die Leistung mit und ohne Drift-Detektor ähnlich
Nach Drift-Auftreten zeigt die Methode mit Drift-Detektor signifikante Leistungsverbesserung
Validiert die Wirksamkeit der Prototyp-Neuberechnung
Methodenvergleich: Die vorgeschlagene einbettungsbasierte Methode übertrifft die merkmalbasierte Methode auf allen Datensätzen deutlich.
Traditionelle Graphklassifizierung: Konzentriert sich hauptsächlich auf statische Graphen mit reichhaltigen Methoden, aber nicht für Streaming-Szenarien geeignet
Bestehende Graphstrom-Methoden: Konzentrieren sich hauptsächlich auf Anomalieerkennung, Mehrklassen-Klassifizierungsforschung ist begrenzt
Graph-Einbettung: Verwendet Methoden wie Autoencoder zum Erlernen von Graphdarstellungen
Die Innovation dieses Papers liegt in der Kombination von Prototyp-Einbettung, inkrementellem Lernen und Konzeptdrift-Erkennung, speziell für Mehrklassen-Graphstrom-Klassifizierungsaufgaben.
Methodenwirksamkeit: Die vorgeschlagene Hybrid-Methode zeigt ausgezeichnete Leistung bei Graphstrom-Klassifizierungsaufgaben, besonders in Szenarien mit Konzeptdrift
Komponentenbedeutung: Graph-Speicher, Prototypauswahl und Drift-Erkennungsmechanismus tragen alle wesentlich zur endgültigen Leistung bei
Adaptivität: Die Methode kann dynamische Graphströme mit variabler Knoten- und Kantenzahl effektiv verarbeiten
Rechenkomplexität: Die Berechnung der Graph-Editierdistanz hat hohe Komplexität und kann großflächige Anwendungen einschränken
Parameterempfindlichkeit: Der Empfindlichkeitsparameter der Drift-Erkennung muss je nach Aufgabe angepasst werden
Label-Verfügbarkeit: Setzt voraus, dass echte Labels bei jedem Schritt verfügbar sind, was in praktischen Anwendungen möglicherweise nicht realistisch ist
Das Paper identifiziert zwei wichtige zukünftige Forschungsrichtungen:
Erlernen von Graph-Einbettungen: Untersuchung von Methoden zum End-to-End-Erlernen von Graph-Einbettungen für großflächige Graphstrom-Probleme
Lernen mit begrenzten Labels: Berücksichtigung von unüberwachten, halbüberwachten und aktiven Lernparadigmen sowie Few-Shot-Learning und Datenerweiterungstechniken
Das Paper zitiert 37 verwandte Arbeiten, die Konzeptdrift-Erkennung, Graphneuronale Netze, inkrementelles Lernen und andere verwandte Bereiche abdecken und eine solide theoretische Grundlage für die Forschung bieten.
Gesamtbewertung: Dies ist ein hochqualitatives Paper mit wichtigen Beiträgen zum Bereich der Graphstrom-Klassifizierung. Die Methodengestaltung ist vernünftig, die experimentelle Validierung ist umfassend, die Schreibweise ist klar und es bietet wertvolle Erkenntnisse und Lösungen für die Entwicklung dieses Bereichs. Trotz einiger Einschränkungen machen seine Innovativität und Praktikabilität es zu einem Paper mit wichtigem akademischem und anwendungsorientiertem Wert.