SigSPARQL: Signals as a First-Class Citizen When Querying Knowledge Graphs
Schwarzinger, Steindl, Frühwirth et al.
Purpose: Cyber-Physical Systems (CPSs) integrate computation and physical processes, producing time series data from thousands of sensors. Knowledge graphs can contextualize these data, yet current approaches that are applicably to monitoring CPS rely on observation-based approaches. This limits the ability to express computations on sensor data, especially when no assumptions can be made about sampling synchronicity or sampling rates.
Methodology: We propose an approach for integrating knowledge graphs with signals that model run-time sensor data as functions from time to data. To demonstrate this approach, we introduce SigSPARQL, a query language that can combine RDF data and signals. We assess its technical feasibility with a prototype and demonstrate its use in a typical CPS monitoring use case.
Findings: Our approach enables queries to combine graph-based knowledge with signals, overcoming some key limits of observation-based methods. The developed prototype successfully demonstrated feasibility and applicability.
Value: This work presents a query-based approach for CPS monitoring that integrates knowledge graphs and signals, alleviating problems of observation-based approaches. By leveraging system knowledge, it enables operators to run a single query across different system instances within the same domain. Future work will extend SigSPARQL with additional signal functions and evaluate it in large-scale CPS deployments.
academic
SigSPARQL: الإشارات كمواطن من الدرجة الأولى عند الاستعلام عن الرسوم البيانية للمعرفة
تقترح هذه الورقة منهجاً جديداً يجمع بين الرسوم البيانية للمعرفة ومعالجة الإشارات لمعالجة مشاكل الاستعلام عن البيانات في مراقبة الأنظمة الفيزيائية السيبرانية (CPS). تعاني الطرق التقليدية المستندة إلى الملاحظات من قيود في معالجة حسابات بيانات المستشعرات، خاصة عندما تكون العينات غير متزامنة أو معدلات العينات غير متسقة. يقترح المؤلفون لغة الاستعلام SigSPARQL، التي تقوم بنمذجة بيانات المستشعرات في وقت التشغيل كدوال من الوقت إلى البيانات (إشارات)، مما يحقق استعلاماً موحداً لبيانات RDF والإشارات. تم التحقق من جدوى التقنية من خلال نظام نموذجي وعرض تأثيراتها التطبيقية في حالات الاستخدام النموذجية لمراقبة CPS.
المشكلة الأساسية: تنتج الأنظمة الفيزيائية السيبرانية كميات كبيرة من بيانات المستشعرات ذات السلاسل الزمنية، والتي تتطلب دمجها مع معلومات السياق النظامي للتحليل، لكن الطرق الحالية المستندة إلى الملاحظات تواجه تعقيداً وقيوداً في التعبير عن حسابات بيانات المستشعرات.
الأهمية: مع التطور الرقمي، تطبق الأنظمة الفيزيائية السيبرانية على نطاق واسع في المباني وشبكات الطاقة والتصنيع وغيرها، وتحسين استخدام بيانات المستشعرات أمر حاسم لتحليل النظام ومراقبته والتحكم فيه.
قيود الطرق الموجودة:
تقوم طرق الوصول إلى البيانات القائمة على الأنطولوجيا (OBDA) بتعيين السلاسل الزمنية إلى هياكل رسومية، حيث تتشتت القيم الزمنية لمستشعر واحد عبر آلاف العناصر التي تمثل ملاحظات مستقلة
يزداد تعقيد الاستعلام، مما يتطلب إعادة بناء مفهوم القيم الزمنية من الملاحظات المستقلة
تواجه تحديات في التعامل مع السلاسل الزمنية غير المتزامنة، حيث يصعب دمج الملاحظات ذات الطوابع الزمنية المختلفة
تفتقر إلى مفهوم موحد لنمذجة البيانات بين القيم المرصودة
دافع البحث: إدخال مفهوم الإشارة (Signal) كـ "مواطن من الدرجة الأولى" لتجريد الملاحظات المستقلة والتغلب على أوجه القصور في الطرق الحالية في التعبير عن حسابات بيانات المستشعرات.
اقتراح إطار عمل مستقل عن اللغة: تحديد ثلاث عمليات أساسية (Signal و ApplySF و LiftVal) لدمج لغات الاستعلام عن الرسوم البيانية للمعرفة مع معالجة الإشارات
تصميم لغة الاستعلام SigSPARQL: توسيع بناء الجملة والدلالات SPARQL لدعم الإشارات كمواطنين من الدرجة الأولى في نتائج الاستعلام
بناء نظام نموذجي: تم التنفيذ على أساس Oxigraph للتحقق من جدوى التقنية
توفير أساس نظري كامل: بناءً على نظرية البرمجة التفاعلية الوظيفية (FRP)، إنشاء علاقة رسمية بين الإشارات وبيانات السلاسل الزمنية
عرض القيمة التطبيقية: إثبات قابلية تطبيق الطريقة من خلال حالة استخدام مراقبة محطة شحن السيارات الكهربائية
الإدخال: مجموعة بيانات RDF معلقة بالإشارات <D, S, φ>، حيث D هي مجموعة بيانات RDF، و S هي مجموعة إشارات RDF، و φ هي دالة التعليق على الإشارات
الإخراج: سلسلة حل زمنية (TSS) أو رسم بياني RDF محدث بشكل مستمر
القيود: دعم الاستعلامات المستمرة، معالجة تدفقات بيانات المستشعرات غير المتزامنة
تستشهد الورقة بـ 36 مرجعاً ذا صلة، تغطي الأعمال المهمة في مجالات معالجة تدفقات RDF والاستعلام عن البيانات الزمنية والبرمجة التفاعلية الوظيفية وغيرها، مما يوفر أساساً نظرياً وخلفية تقنية قوية لهذا البحث.
التقييم الشامل: هذه ورقة بحثية عالية الجودة في أنظمة قواعد البيانات، تقدم مساهمات مهمة في توسيع لغات الاستعلام عن الرسوم البيانية للمعرفة. الأساس النظري متين، والحل التقني معقول، والتنفيذ شامل نسبياً. على الرغم من وجود مجال للتحسن في التقييم والأداء، فإنها توفر اتجاهاً جديداً قيماً لتطور المجالات ذات الصلة.