SigSPARQL: Signals as a First-Class Citizen When Querying Knowledge Graphs
Schwarzinger, Steindl, Frühwirth et al.
Purpose: Cyber-Physical Systems (CPSs) integrate computation and physical processes, producing time series data from thousands of sensors. Knowledge graphs can contextualize these data, yet current approaches that are applicably to monitoring CPS rely on observation-based approaches. This limits the ability to express computations on sensor data, especially when no assumptions can be made about sampling synchronicity or sampling rates.
Methodology: We propose an approach for integrating knowledge graphs with signals that model run-time sensor data as functions from time to data. To demonstrate this approach, we introduce SigSPARQL, a query language that can combine RDF data and signals. We assess its technical feasibility with a prototype and demonstrate its use in a typical CPS monitoring use case.
Findings: Our approach enables queries to combine graph-based knowledge with signals, overcoming some key limits of observation-based methods. The developed prototype successfully demonstrated feasibility and applicability.
Value: This work presents a query-based approach for CPS monitoring that integrates knowledge graphs and signals, alleviating problems of observation-based approaches. By leveraging system knowledge, it enables operators to run a single query across different system instances within the same domain. Future work will extend SigSPARQL with additional signal functions and evaluate it in large-scale CPS deployments.
academic
SigSPARQL: Signale als Bürger erster Klasse beim Abfragen von Wissensgraphen
Dieses Papier präsentiert einen neuartigen Ansatz zur Datenabfrage in der Überwachung von Cyber-physischen Systemen (CPS), der Wissensgraphen mit Signalverarbeitung kombiniert. Traditionelle Methoden basieren auf Beobachtungsdaten und weisen Einschränkungen bei der Verarbeitung von Sensordatenberechnungen auf, besonders bei asynchronem oder inkonsistentem Abtastverhalten. Die Autoren stellen die Abfragesprache SigSPARQL vor, die Laufzeit-Sensordaten als zeitabhängige Funktionen (Signale) modelliert und einheitliche Abfragen von RDF-Daten und Signalen ermöglicht. Ein Prototypsystem validiert die technische Machbarkeit und demonstriert die Anwendungseffektivität in typischen CPS-Überwachungsszenarien.
Kernproblem: Cyber-physische Systeme erzeugen große Mengen zeitlicher Sensordaten, die mit Systeminformationen kombiniert werden müssen. Bestehende beobachtungsbasierte Methoden weisen jedoch Komplexität und Einschränkungen bei der Ausdrucksfähigkeit von Sensordatenberechnungen auf.
Bedeutung: Mit der digitalen Transformation werden CPS in Gebäuden, Energienetzen, Fertigung und anderen Bereichen weit verbreitet. Die effektive Nutzung von Sensordaten ist für Systemanalyse, Überwachung und Steuerung entscheidend.
Einschränkungen bestehender Methoden:
Ontologie-basierte Datenzugriffsmethoden (OBDA) verteilen zeitliche Werte eines einzelnen Sensors über Tausende von Elementen, die unabhängige Beobachtungen darstellen
Die Abfragekomplexität nimmt zu, da zeitliche Wertkonzepte aus unabhängigen Beobachtungen rekonstruiert werden müssen
Herausforderungen bei der Verarbeitung asynchroner Zeitreihen, da Beobachtungen mit unterschiedlichen Zeitstempeln schwer zu kombinieren sind
Fehlende einheitliche Konzepte für die Datenmodellierung zwischen Beobachtungen
Forschungsmotivation: Einführung des Signalkonzepts als „Bürger erster Klasse" zur Abstraktion unabhängiger Beobachtungen und Überwindung der Ausdruckslimitierungen bestehender Methoden.
Sprachunabhängiges Framework: Definition von drei Kernoperatoren (Signal, ApplySF, LiftVal) zur Integration von Wissensgraph-Abfragesprachen mit Signalverarbeitung
Entwurf der SigSPARQL-Abfragesprache: Erweiterung der SPARQL-Syntax und -Semantik mit Unterstützung für Signale als Bürger erster Klasse in Abfrageergebnissen
Prototypsystem: Implementierung basierend auf Oxigraph zur Validierung der technischen Machbarkeit
Umfassende theoretische Grundlagen: Basierend auf funktionaler reaktiver Programmierung (FRP), etabliert formale Beziehungen zwischen Signalen und Zeitreihendaten
Praktischer Anwendungswert: Demonstration der Anwendbarkeit durch ein Überwachungsszenario für Elektrofahrzeug-Ladestationen
Eingabe: Mit Signalen annotierter RDF-Datensatz <D, S, φ>, wobei D der RDF-Datensatz ist, S die Menge der RDF-Signale und φ die Signalnotationsfunktion
Ausgabe: Zeitlich gelöste Sequenzen (TSS) oder kontinuierlich aktualisierte RDF-Graphen
Einschränkungen: Unterstützung kontinuierlicher Abfragen, Verarbeitung asynchroner Sensordatenströme
Definition 7.1: Ein RDF-Signal ψ ist eine (möglicherweise partielle) Funktion
der Form T→RDF, wobei T die Zeitdomäne und RDF die Menge der RDF-Terme ist
Grundgerüst: Basierend auf der Oxigraph-Graphdatenbank
Zeitmodell: Diskrete Zeit mit „Last-Observation-Carried-Forward"-Strategie zur Modellierung von Daten zwischen Beobachtungen
Evaluierungsmethode: Zweistufige Evaluierung – Konstruktion von Signalberechnungsbeschreibungen, dann Registrierung in der kontinuierlichen Abfrage-Engine
Ansatz von Bollen et al.: Erweiterung der Graphabstimmung zur Unterstützung von Messungen und Zeitreihenmuster
Hybride Datenmodellforschung: Fusion von Graph- und Zeitreihendaten
Differenzierungsvorteil dieses Papiers: Signalbasierte Modellierung zeitlicher Werte unter Nutzung der FRP-Theorie zur Lösung von Problemen beobachtungsbasierter Methoden
Signaltyp-Einschränkungen: Die Unterstützung aller möglichen Signaltypen ist komplex; der aktuelle Prototyp unterstützt nur die „Last-Observation-Carried-Forward"-Strategie
Ausdrucksfähigkeits-Einschränkungen: Unmöglichkeit, komplexe Zeitfensterberechnungen wie „Durchschnitt der letzten 10 Minuten" auszudrücken
Fehlende Leistungsanalyse: Keine detaillierten Leistungsbewertungen enthalten
Unzureichende Skalierungsvalidierung: Mangel an Validierung in großflächigen CPS-Bereitstellungen
Das Papier zitiert 36 relevante Arbeiten, die wichtige Arbeiten in den Schlüsselbereichen RDF-Stromverarbeitung, Zeitdaten-Abfrage und funktionaler reaktiver Programmierung abdecken und eine solide theoretische Grundlage und technischen Hintergrund für diese Forschung bieten.
Gesamtbewertung: Dies ist ein hochqualitatives Datenbankforschungspapier, das wichtige Beiträge zur Erweiterung von Wissensgraph-Abfragesprachen leistet. Die theoretischen Grundlagen sind solide, der technische Ansatz ist vernünftig und die Implementierung ist relativ vollständig. Obwohl es Raum für Verbesserungen in Evaluierung und Leistung gibt, bietet es wertvolle neue Richtungen für die Entwicklung verwandter Bereiche.