2025-11-12T22:13:10.653124

SigSPARQL: Signals as a First-Class Citizen When Querying Knowledge Graphs

Schwarzinger, Steindl, Frühwirth et al.
Purpose: Cyber-Physical Systems (CPSs) integrate computation and physical processes, producing time series data from thousands of sensors. Knowledge graphs can contextualize these data, yet current approaches that are applicably to monitoring CPS rely on observation-based approaches. This limits the ability to express computations on sensor data, especially when no assumptions can be made about sampling synchronicity or sampling rates. Methodology: We propose an approach for integrating knowledge graphs with signals that model run-time sensor data as functions from time to data. To demonstrate this approach, we introduce SigSPARQL, a query language that can combine RDF data and signals. We assess its technical feasibility with a prototype and demonstrate its use in a typical CPS monitoring use case. Findings: Our approach enables queries to combine graph-based knowledge with signals, overcoming some key limits of observation-based methods. The developed prototype successfully demonstrated feasibility and applicability. Value: This work presents a query-based approach for CPS monitoring that integrates knowledge graphs and signals, alleviating problems of observation-based approaches. By leveraging system knowledge, it enables operators to run a single query across different system instances within the same domain. Future work will extend SigSPARQL with additional signal functions and evaluate it in large-scale CPS deployments.
academic

SigSPARQL: الإشارات كمواطن من الدرجة الأولى عند الاستعلام عن الرسوم البيانية للمعرفة

المعلومات الأساسية

  • معرّف الورقة: 2506.03826
  • العنوان: SigSPARQL: الإشارات كمواطن من الدرجة الأولى عند الاستعلام عن الرسوم البيانية للمعرفة
  • المؤلفون: Tobias Schwarzinger, Gernot Steindl, Thomas Frühwirth, Thomas Preindl, Konrad Diwold, Katrin Ehrenmüller, Fajar J. Ekaputra
  • التصنيف: cs.DB (قواعد البيانات)
  • تاريخ النشر: يوليو 2025
  • رابط الورقة: https://arxiv.org/abs/2506.03826

الملخص

تقترح هذه الورقة منهجاً جديداً يجمع بين الرسوم البيانية للمعرفة ومعالجة الإشارات لمعالجة مشاكل الاستعلام عن البيانات في مراقبة الأنظمة الفيزيائية السيبرانية (CPS). تعاني الطرق التقليدية المستندة إلى الملاحظات من قيود في معالجة حسابات بيانات المستشعرات، خاصة عندما تكون العينات غير متزامنة أو معدلات العينات غير متسقة. يقترح المؤلفون لغة الاستعلام SigSPARQL، التي تقوم بنمذجة بيانات المستشعرات في وقت التشغيل كدوال من الوقت إلى البيانات (إشارات)، مما يحقق استعلاماً موحداً لبيانات RDF والإشارات. تم التحقق من جدوى التقنية من خلال نظام نموذجي وعرض تأثيراتها التطبيقية في حالات الاستخدام النموذجية لمراقبة CPS.

خلفية البحث والدافع

تعريف المشكلة

  1. المشكلة الأساسية: تنتج الأنظمة الفيزيائية السيبرانية كميات كبيرة من بيانات المستشعرات ذات السلاسل الزمنية، والتي تتطلب دمجها مع معلومات السياق النظامي للتحليل، لكن الطرق الحالية المستندة إلى الملاحظات تواجه تعقيداً وقيوداً في التعبير عن حسابات بيانات المستشعرات.
  2. الأهمية: مع التطور الرقمي، تطبق الأنظمة الفيزيائية السيبرانية على نطاق واسع في المباني وشبكات الطاقة والتصنيع وغيرها، وتحسين استخدام بيانات المستشعرات أمر حاسم لتحليل النظام ومراقبته والتحكم فيه.
  3. قيود الطرق الموجودة:
    • تقوم طرق الوصول إلى البيانات القائمة على الأنطولوجيا (OBDA) بتعيين السلاسل الزمنية إلى هياكل رسومية، حيث تتشتت القيم الزمنية لمستشعر واحد عبر آلاف العناصر التي تمثل ملاحظات مستقلة
    • يزداد تعقيد الاستعلام، مما يتطلب إعادة بناء مفهوم القيم الزمنية من الملاحظات المستقلة
    • تواجه تحديات في التعامل مع السلاسل الزمنية غير المتزامنة، حيث يصعب دمج الملاحظات ذات الطوابع الزمنية المختلفة
    • تفتقر إلى مفهوم موحد لنمذجة البيانات بين القيم المرصودة
  4. دافع البحث: إدخال مفهوم الإشارة (Signal) كـ "مواطن من الدرجة الأولى" لتجريد الملاحظات المستقلة والتغلب على أوجه القصور في الطرق الحالية في التعبير عن حسابات بيانات المستشعرات.

المساهمات الأساسية

  1. اقتراح إطار عمل مستقل عن اللغة: تحديد ثلاث عمليات أساسية (Signal و ApplySF و LiftVal) لدمج لغات الاستعلام عن الرسوم البيانية للمعرفة مع معالجة الإشارات
  2. تصميم لغة الاستعلام SigSPARQL: توسيع بناء الجملة والدلالات SPARQL لدعم الإشارات كمواطنين من الدرجة الأولى في نتائج الاستعلام
  3. بناء نظام نموذجي: تم التنفيذ على أساس Oxigraph للتحقق من جدوى التقنية
  4. توفير أساس نظري كامل: بناءً على نظرية البرمجة التفاعلية الوظيفية (FRP)، إنشاء علاقة رسمية بين الإشارات وبيانات السلاسل الزمنية
  5. عرض القيمة التطبيقية: إثبات قابلية تطبيق الطريقة من خلال حالة استخدام مراقبة محطة شحن السيارات الكهربائية

شرح الطريقة

تعريف المهمة

الإدخال: مجموعة بيانات RDF معلقة بالإشارات <D, S, φ>، حيث D هي مجموعة بيانات RDF، و S هي مجموعة إشارات RDF، و φ هي دالة التعليق على الإشارات الإخراج: سلسلة حل زمنية (TSS) أو رسم بياني RDF محدث بشكل مستمر القيود: دعم الاستعلامات المستمرة، معالجة تدفقات بيانات المستشعرات غير المتزامنة

المفاهيم الأساسية ونموذج البيانات

1. تعريف الإشارة

التعريف 7.1: إشارة RDF ψ هي دالة من الشكل T→RDF (قد تكون جزئية)
حيث T هي المجال الزمني، و RDF هي مجموعة شروط RDF

2. مجموعة بيانات RDF معلقة بالإشارات

التعريف 7.2: <D, S, φ>
- D: مجموعة بيانات RDF عادية
- S: مجموعة إشارات RDF
- φ: دالة جزئية من IRI×IRI→S (دالة التعليق على الإشارات)

إطار العمل المستقل عن اللغة

يقترح المؤلفون ثلاث عمليات أساسية:

  1. Signal(s, p): بناء إشارة بناءً على مصدر الإشارة s وخاصية الإشارة p
  2. ApplySF(f, a⃗): تطبيق دالة إشارة n-ary f على قائمة معاملات إشارة بطول n
  3. LiftVal(v): رفع القيمة v إلى إشارة ثابتة

تصميم لغة SigSPARQL

توسيع البناء الجملي

  1. جملة SIGNALS:
SIGNALS {
    ev:ActivePower FROM ?device AS ?ap
    ev:Envelope FROM ?garage AS ?env
}
  1. جملة WHEN:
WHEN {
    SUM(?ap * ?sign) > ?env
    BECOMES TRUE AT ?violation_time
}

تعريف الدلالات

  1. سلسلة الحل الزمنية (TSS): تسمح للحل بربط المتغيرات بشروط RDF أو إشارات RDF، قابلة للتقييم في نقطة زمنية τ
  2. الاستعلامات المستمرة: تُرجع استعلامات SELECT سلسلة حل زمنية، وتُرجع استعلامات CONSTRUCT رسم بياني RDF متنامياً بشكل مستمر
  3. حساب الإشارة: تطبيق نقطي لرفع دوال وعمليات SPARQL إلى مجال الإشارات

نقاط الابتكار التقني

  1. تجريد الإشارة: استخدام مفهوم الإشارة من FRP لاستبدال الطريقة المستندة إلى الملاحظات، مما يوفر نمذجة بيانات زمنية أكثر طبيعية
  2. نموذج استعلام موحد: دمج معرفة الهيكل الرسومي ومعالجة الإشارات الزمنية في استعلام واحد
  3. توسيع نظام النوع: توسيع الجبر SPARQL لدعم أنواع الإشارات، مع التعامل التلقائي مع رفع النوع
  4. دلالات الاستعلام المستمرة: تحديد آلية الأحداث المُطلقة، دعم تطبيقات المراقبة في الوقت الفعلي

إعداد التجربة

تنفيذ النموذج الأولي

  • الإطار الأساسي: بناءً على قاعدة بيانات الرسوم البيانية Oxigraph
  • النموذج الزمني: وقت منفصل، باستخدام استراتيجية "آخر ملاحظة" لنمذجة البيانات بين الملاحظات
  • طريقة التقييم: تقييم على مرحلتين - بناء وصف حساب الإشارة، ثم تسجيل محرك الاستعلام المستمر

حالة الاستخدام للتحقق

سيناريو مراقبة محطة شحن السيارات الكهربائية:

  • مكونات النظام: عدة شواحن EV وأنظمة الخلايا الكهروضوئية والبطاريات
  • هدف المراقبة: الكشف عن أحداث انتهاك حيث يتجاوز استهلاك الطاقة حد التغليف التشغيلي
  • مصادر البيانات: مستشعرات القوة النشطة (AP) ومستشعرات حالة الشحن (SoC) وحدود التغليف التشغيلي

مثال الاستعلام

CONSTRUCT {
    ?garage ev:hasEnvelopeViolation [
        ev:description "Envelope Violated!" ;
        ev:startTime ?violation_time
    ]
}
WHEN {
    SUM(?ap * ?sign) > ?env
    BECOMES TRUE AT ?violation_time
}
SIGNALS {
    ev:ActivePower FROM ?device AS ?ap
    ev:Envelope FROM ?garage AS ?env
}
WHERE {
    ?garage a ev:Garage ; sosa:hosts ?device .
    ?device a ?ap_device_type .
    BIND(IF(?ap_device_type = ev:PVSystem, -1, 1) AS ?sign)
}
GROUP BY ?garage

نتائج التجربة

التحقق من الجدوى التقنية

  1. تنفيذ النموذج الأولي بنجاح: تنفيذ كامل لبناء الجملة والدلالات SigSPARQL
  2. تنفيذ الاستعلام: دعم استعلامات SELECT المستمرة (إرجاع TSS) واستعلامات CONSTRUCT (إرجاع رسم بياني RDF محدث بشكل مستمر)
  3. معالجة الإشارات: معالجة ناجحة لاستخراج الإشارات وحسابها والكشف عن الأحداث

تأثير التطبيق

  1. القدرة على الاستعلام الموحد: يمكن تطبيق استعلام واحد على حالات نظام مختلفة في نفس المجال
  2. المراقبة في الوقت الفعلي: الكشف الفعال عن أحداث انتهاك التغليف التشغيلي
  3. الوعي بالسياق: الاستفادة من معرفة النظام المقدمة من الرسم البياني للمعرفة لتحسين قدرة التعبير عن الاستعلام

التحقق الوظيفي

  • معالجة ناجحة للبيانات غير المتزامنة من المستشعرات
  • دعم حسابات الإشارات المعقدة (الجمع والمقارنة وما إلى ذلك)
  • تنفيذ آلية تشغيل الأحداث وربط الطوابع الزمنية
  • التحقق من صحة الاستعلامات المستمرة

الأعمال ذات الصلة

معالجة تدفقات RDF

  1. الطرق المستندة إلى النوافذ (C-SPARQL و RSP-QL وغيرها): تقسيم التدفقات غير المحدودة إلى علاقات محدودة
  2. الأنظمة المستوحاة من CEP (EP-SPARQL وغيرها): الكشف عن الأنماط في تدفقات الأحداث

الاستعلام عن البيانات الزمنية و OBDA

  1. Chrontext: إعادة كتابة استعلامات SPARQL إلى استعلامات قاعدة بيانات السلاسل الزمنية
  2. Ontop-temporal: توسيع قدرة الاستعلام بصيغ منطقية زمنية
  3. STARQL: طريقة شاملة تدعم الاستعلامات المستمرة والتاريخية

تكامل الرسوم البيانية والسلاسل الزمنية

  1. طريقة Bollen وآخرين: توسيع مطابقة الرسوم البيانية لدعم القياسات وأنماط السلاسل الزمنية
  2. أبحاث نماذج البيانات الهجينة: دمج بيانات الرسوم البيانية والسلاسل الزمنية

الميزة التفاضلية للورقة: نمذجة القيم الزمنية بناءً على الإشارات، واستخدام نظرية FRP لحل مشاكل الطريقة المستندة إلى الملاحظات

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. الإشارات كمواطنين من الدرجة الأولى تحل بفعالية قيود الطرق التقليدية المستندة إلى الملاحظات
  2. SigSPARQL توفر واجهة استعلام موحدة للرسوم البيانية للمعرفة ومعالجة الإشارات
  3. الجدوى التقنية تم التحقق منها من خلال النظام النموذجي
  4. القيمة العملية تم إثباتها في سيناريوهات مراقبة CPS

القيود

  1. قيود نوع الإشارة: تعقيد دعم جميع أنواع الإشارات الممكنة مرتفع، يدعم النموذج الأولي الحالي فقط استراتيجية "آخر ملاحظة"
  2. قيود القدرة على التعبير: لا يمكن التعبير عن حسابات نوافذ زمنية معقدة مثل "متوسط آخر 10 دقائق"
  3. غياب تحليل الأداء: لم يتم تضمين تقييم أداء مفصل
  4. عدم كفاية التحقق من الحجم: نقص التحقق من نشر CPS على نطاق واسع

الاتجاهات المستقبلية

  1. تحسين الأداء: تصميم نموذج أولي محسّن لتقييم الأداء وحالات الاستخدام في المراقبة على نطاق واسع
  2. توسيع الوظائف: إضافة وظائف معالجة إشارات متقدمة (مثل العمليات المتكاملة)
  3. تقييم المستخدم: تقييم مزايا سهولة استخدام اللغة
  4. الرسوم البيانية للمعرفة الزمنية: توسيع دلالات لغة الاستعلام لدعم الرسوم البيانية للمعرفة الزمنية
  5. النشر الفعلي: التحقيق في متطلبات نشر CPS الحقيقية

التقييم المتعمق

المزايا

  1. أساس نظري متين: بناءً على نظرية FRP، يوفر تعريفات رياضية ودلالات صارمة
  2. تعريف المشكلة واضح: تحديد دقيق للمشاكل الأساسية في الطرق الموجودة واقتراح حلول موجهة
  3. التصميم المعقول: توسيع اللغة يحافظ على التوافق مع SPARQL، مما يقلل من تكاليف التعلم
  4. التنفيذ الكامل: تشكيل سلسلة كاملة من النظرية إلى النموذج الأولي إلى التطبيق
  5. الابتكار القوي: أول من يقدم مفهوم إشارة FRP إلى الاستعلام عن الرسوم البيانية للمعرفة

أوجه القصور

  1. التقييم المحدود: نقص المقارنات الكمية مع الطرق الموجودة والتحقق على نطاق واسع
  2. الوظائف المحدودة: مكتبة دوال الإشارات نسبياً بسيطة، قدرة تحليل الوقت المعقد غير كافية
  3. الأداء غير معروفة: لا توجد معايير أداء واختبارات تحسين
  4. نطاق التطبيق: موجهة بشكل أساسي لمراقبة CPS، قابلية التطبيق في المجالات الأخرى قيد الانتظار

التأثير

  1. المساهمة الأكاديمية: توفير أفكار جديدة لتكامل الرسوم البيانية للمعرفة وبيانات السلاسل الزمنية
  2. القيمة العملية: آفاق تطبيق واسعة في إنترنت الأشياء والصناعة 4.0 وغيرها
  3. دفع التكنولوجيا: قد تعزز التطور الإضافي لمعيار SPARQL
  4. الدمج بين التخصصات: تعزيز التقاطع بين قواعد البيانات والويب الدلالي والبرمجة الوظيفية

السيناريوهات المطبقة

  1. المراقبة الصناعية: مراقبة أنظمة التصنيع وشبكات الطاقة في الوقت الفعلي
  2. المباني الذكية: مراقبة وتحكم حالة معدات المباني
  3. النقل الذكي: مراقبة تدفق المرور وحالة المركبات
  4. المراقبة البيئية: تحليل بيانات شبكات المستشعرات الكبيرة

المراجع

تستشهد الورقة بـ 36 مرجعاً ذا صلة، تغطي الأعمال المهمة في مجالات معالجة تدفقات RDF والاستعلام عن البيانات الزمنية والبرمجة التفاعلية الوظيفية وغيرها، مما يوفر أساساً نظرياً وخلفية تقنية قوية لهذا البحث.


التقييم الشامل: هذه ورقة بحثية عالية الجودة في أنظمة قواعد البيانات، تقدم مساهمات مهمة في توسيع لغات الاستعلام عن الرسوم البيانية للمعرفة. الأساس النظري متين، والحل التقني معقول، والتنفيذ شامل نسبياً. على الرغم من وجود مجال للتحسن في التقييم والأداء، فإنها توفر اتجاهاً جديداً قيماً لتطور المجالات ذات الصلة.