SigSPARQL: Signals as a First-Class Citizen When Querying Knowledge Graphs
Schwarzinger, Steindl, Frühwirth et al.
Purpose: Cyber-Physical Systems (CPSs) integrate computation and physical processes, producing time series data from thousands of sensors. Knowledge graphs can contextualize these data, yet current approaches that are applicably to monitoring CPS rely on observation-based approaches. This limits the ability to express computations on sensor data, especially when no assumptions can be made about sampling synchronicity or sampling rates.
Methodology: We propose an approach for integrating knowledge graphs with signals that model run-time sensor data as functions from time to data. To demonstrate this approach, we introduce SigSPARQL, a query language that can combine RDF data and signals. We assess its technical feasibility with a prototype and demonstrate its use in a typical CPS monitoring use case.
Findings: Our approach enables queries to combine graph-based knowledge with signals, overcoming some key limits of observation-based methods. The developed prototype successfully demonstrated feasibility and applicability.
Value: This work presents a query-based approach for CPS monitoring that integrates knowledge graphs and signals, alleviating problems of observation-based approaches. By leveraging system knowledge, it enables operators to run a single query across different system instances within the same domain. Future work will extend SigSPARQL with additional signal functions and evaluate it in large-scale CPS deployments.
academic
SigSPARQL : Les Signaux en tant que Citoyen de Première Classe lors de l'Interrogation de Graphes de Connaissances
Cet article propose une nouvelle approche combinant les graphes de connaissances et le traitement des signaux pour résoudre les problèmes d'interrogation de données dans la surveillance des systèmes cyberphysiques (CPS). Les méthodes traditionnelles basées sur les observations présentent des limitations lors du traitement des calculs de données de capteurs, particulièrement en cas d'échantillonnage asynchrone ou de fréquences d'échantillonnage incohérentes. Les auteurs proposent le langage de requête SigSPARQL, qui modélise les données de capteurs à l'exécution en tant que fonctions temps-vers-données (signaux), permettant l'interrogation unifiée des données RDF et des signaux. La faisabilité technique est validée par un système prototype, et les effets d'application sont démontrés dans des cas d'usage typiques de surveillance de CPS.
Problème central : Les systèmes cyberphysiques génèrent de grandes quantités de données de capteurs de séries temporelles qui doivent être analysées en combinaison avec les informations contextuelles du système. Cependant, les méthodes existantes basées sur les observations présentent une complexité et des limitations dans l'expression des calculs de données de capteurs.
Importance : Avec le développement de la numérisation, les CPS sont largement appliqués dans les bâtiments, les réseaux énergétiques, la fabrication et d'autres domaines. L'utilisation efficace des données de capteurs est cruciale pour l'analyse, la surveillance et le contrôle des systèmes.
Limitations des Méthodes Existantes :
Les méthodes d'accès aux données basées sur l'ontologie (OBDA) dispersent les valeurs temporelles d'un seul capteur dans des milliers d'éléments représentant des observations indépendantes lors du mappage des séries temporelles vers des structures graphiques
La complexité des requêtes augmente, nécessitant la reconstruction du concept de valeur temporelle à partir d'observations indépendantes
Des défis se posent lors du traitement de séries temporelles asynchrones, où les observations avec des horodatages différents sont difficiles à combiner
Absence d'un concept unifié pour la modélisation des données entre les observations
Motivation de la Recherche : Introduire le concept de signal en tant que « citoyen de première classe » pour abstraire les observations indépendantes et surmonter les insuffisances des méthodes actuelles dans l'expression des calculs de données de capteurs.
Proposition d'un cadre indépendant du langage : Définition de trois opérateurs fondamentaux (Signal, ApplySF, LiftVal) pour intégrer les langages de requête de graphes de connaissances et le traitement des signaux
Conception du langage de requête SigSPARQL : Extension de la syntaxe et de la sémantique SPARQL, supportant les signaux en tant que citoyens de première classe dans les résultats de requête
Construction d'un système prototype : Implémentation basée sur Oxigraph, validant la faisabilité technique
Fourniture d'une base théorique complète : Basée sur la théorie de la programmation réactive fonctionnelle (FRP), établissant les relations formelles entre les signaux et les données de séries temporelles
Démonstration de la valeur pratique : Preuve de l'applicabilité de la méthode par le biais d'un cas d'usage de surveillance de stations de recharge de véhicules électriques
Entrée : Ensemble de données RDF annoté par des signaux <D, S, φ>, où D est l'ensemble de données RDF, S est l'ensemble de signaux RDF, et φ est la fonction d'annotation de signaux
Sortie : Séquence de solutions temporelles (TSS) ou graphe RDF mis à jour en continu
Contraintes : Support des requêtes continues, traitement des flux de données de capteurs asynchrones
Définition 7.1 : Un signal RDF ψ est une fonction (possiblement partielle)
de la forme T → RDF, où T est le domaine temporel et RDF est l'ensemble
des termes RDF
Définition 7.2 : <D, S, φ>
- D : Ensemble de données RDF conventionnel
- S : Ensemble de signaux RDF
- φ : Fonction partielle IRI×IRI → S (fonction d'annotation de signaux)
Séquence de Solutions Temporelles (TSS) : Permet aux solutions de lier des variables à des termes RDF ou des signaux RDF, évaluables au point temporel τ
Requêtes Continues : Les requêtes SELECT retournent une TSS, les requêtes CONSTRUCT retournent un graphe RDF en croissance continue
Calcul de Signaux : Application ponctuelle des fonctions et opérateurs SPARQL au domaine des signaux
Abstraction des Signaux : Utilisation du concept de signal issu de la FRP pour remplacer l'approche basée sur les observations, fournissant une modélisation plus naturelle des données temporelles
Modèle de Requête Unifié : Combinaison des connaissances de structure graphique et du traitement des signaux temporels dans une seule requête
Extension du Système de Types : Extension de l'algèbre SPARQL pour supporter les types de signaux, gérant automatiquement l'élévation de type
Sémantique de Requête Continue : Définition d'un mécanisme de déclenchement d'événements, supportant les applications de surveillance en temps réel
Cadre de Base : Basé sur la base de données graphique Oxigraph
Modèle Temporel : Temps discret, utilisant la stratégie de « dernière observation » pour modéliser les données entre les observations
Approche d'Évaluation : Évaluation en deux étapes - construction de la description du calcul du signal, puis enregistrement du moteur de requête continue
Implémentation du Prototype Réussie : Implémentation complète de la syntaxe et de la sémantique SigSPARQL
Exécution des Requêtes : Support des requêtes SELECT continues (retournant une TSS) et des requêtes CONSTRUCT (retournant un graphe RDF continuellement mis à jour)
Traitement des Signaux : Traitement réussi de l'acquisition, du calcul et de la détection d'événements de signaux
Capacité de Requête Unifiée : Une seule requête peut s'appliquer à différentes instances de systèmes dans le même domaine
Surveillance en Temps Réel : Détection efficace des événements de violation d'enveloppe opérationnelle
Conscience du Contexte : Amélioration de la capacité d'expression des requêtes en utilisant les connaissances du système fournies par le graphe de connaissances
Approche de Bollen et al. : Extension de la correspondance de graphes pour supporter les mesures et les motifs de séries temporelles
Recherche sur les Modèles de Données Hybrides : Fusion des données graphiques et de séries temporelles
Avantage Différencié de cet Article : Modélisation des valeurs temporelles basée sur les signaux, utilisant la théorie FRP pour résoudre les problèmes de la méthode basée sur les observations
L'approche des signaux en tant que citoyens de première classe résout efficacement les limitations des méthodes traditionnelles basées sur les observations
SigSPARQL fournit une interface de requête unifiée pour les graphes de connaissances et le traitement des signaux
La faisabilité technique est validée par le système prototype
La valeur pratique est démontrée dans les scénarios de surveillance de CPS
Limitation des Types de Signaux : La complexité du support de tous les types de signaux possibles est élevée ; le prototype actuel ne supporte que la stratégie de « dernière observation »
Limitation de la Capacité d'Expression : Impossibilité d'exprimer des calculs complexes de fenêtres temporelles tels que « la moyenne des 10 dernières minutes »
Absence d'Analyse de Performance : Pas d'évaluation de performance détaillée
Validation d'Échelle Insuffisante : Manque de validation dans les déploiements de CPS à grande échelle
Optimisation des Performances : Conception d'un prototype optimisé pour l'évaluation des performances et les cas d'usage de surveillance à grande échelle
Extension Fonctionnelle : Ajout de fonctions avancées de traitement des signaux (comme les opérations d'intégration)
Évaluation Utilisateur : Évaluation des avantages d'utilisabilité du langage
Graphes de Connaissances Temporels : Extension de la sémantique du langage de requête pour supporter les graphes de connaissances temporels
Déploiement Réel : Enquête sur les besoins des déploiements réels de CPS
L'article cite 36 références connexes, couvrant les travaux importants dans les domaines clés du traitement des flux RDF, de l'interrogation de données temporelles et de la programmation réactive fonctionnelle, fournissant une base théorique et un contexte technique solides pour cette recherche.
Évaluation Globale : Ceci est un article de recherche de haute qualité dans le domaine des systèmes de bases de données, apportant des contributions importantes à l'extension des langages de requête de graphes de connaissances. La base théorique est solide, la solution technique est rationnelle et l'implémentation est relativement complète. Bien qu'il y ait de la place pour l'amélioration dans l'évaluation et les performances, cet article fournit une direction nouvelle et précieuse pour le développement des domaines connexes.