2025-11-12T22:13:10.653124

SigSPARQL: Signals as a First-Class Citizen When Querying Knowledge Graphs

Schwarzinger, Steindl, Frühwirth et al.
Purpose: Cyber-Physical Systems (CPSs) integrate computation and physical processes, producing time series data from thousands of sensors. Knowledge graphs can contextualize these data, yet current approaches that are applicably to monitoring CPS rely on observation-based approaches. This limits the ability to express computations on sensor data, especially when no assumptions can be made about sampling synchronicity or sampling rates. Methodology: We propose an approach for integrating knowledge graphs with signals that model run-time sensor data as functions from time to data. To demonstrate this approach, we introduce SigSPARQL, a query language that can combine RDF data and signals. We assess its technical feasibility with a prototype and demonstrate its use in a typical CPS monitoring use case. Findings: Our approach enables queries to combine graph-based knowledge with signals, overcoming some key limits of observation-based methods. The developed prototype successfully demonstrated feasibility and applicability. Value: This work presents a query-based approach for CPS monitoring that integrates knowledge graphs and signals, alleviating problems of observation-based approaches. By leveraging system knowledge, it enables operators to run a single query across different system instances within the same domain. Future work will extend SigSPARQL with additional signal functions and evaluate it in large-scale CPS deployments.
academic

SigSPARQL: ज्ञान ग्राफ़ को क्वेरी करते समय सिग्नल को प्रथम-श्रेणी नागरिक के रूप में

बुनियादी जानकारी

  • पेपर आईडी: 2506.03826
  • शीर्षक: SigSPARQL: ज्ञान ग्राफ़ को क्वेरी करते समय सिग्नल को प्रथम-श्रेणी नागरिक के रूप में
  • लेखक: Tobias Schwarzinger, Gernot Steindl, Thomas Frühwirth, Thomas Preindl, Konrad Diwold, Katrin Ehrenmüller, Fajar J. Ekaputra
  • वर्गीकरण: cs.DB (डेटाबेस)
  • प्रकाशन समय: जुलाई 2025
  • पेपर लिंक: https://arxiv.org/abs/2506.03826

सारांश

यह पेपर साइबर-फिजिकल सिस्टम (CPS) निगरानी में डेटा क्वेरी समस्या के लिए ज्ञान ग्राफ़ को सिग्नल प्रोसेसिंग के साथ जोड़ने का एक नया दृष्टिकोण प्रस्तावित करता है। पारंपरिक विधियां अवलोकन डेटा पर आधारित हैं, जो संवेदक डेटा गणना में सीमाएं रखती हैं, विशेषकर असमकालिक नमूनाकरण या असंगत नमूनाकरण दरों के मामले में। लेखकों ने SigSPARQL क्वेरी भाषा प्रस्तावित की है, जो रनटाइम संवेदक डेटा को समय-से-डेटा फ़ंक्शन (सिग्नल) के रूप में मॉडल करती है, RDF डेटा और सिग्नल की एकीकृत क्वेरी को सक्षम करती है। प्रोटोटाइप सिस्टम के माध्यम से तकनीकी व्यवहार्यता को सत्यापित किया गया है और विशिष्ट CPS निगरानी उपयोग मामलों में अनुप्रयोग प्रभाव प्रदर्शित किया गया है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

  1. मुख्य समस्या: साइबर-फिजिकल सिस्टम बड़ी मात्रा में समय-श्रृंखला संवेदक डेटा उत्पन्न करते हैं, जिन्हें सिस्टम संदर्भ जानकारी के साथ विश्लेषण के लिए संयोजित करने की आवश्यकता होती है, लेकिन मौजूदा अवलोकन-आधारित विधियां संवेदक डेटा गणना अभिव्यक्ति में जटिलता और सीमाएं रखती हैं।
  2. महत्व: डिजिटलीकरण के विकास के साथ, CPS को निर्माण, ऊर्जा नेटवर्क, विनिर्माण और अन्य क्षेत्रों में व्यापक रूप से लागू किया जाता है। संवेदक डेटा का प्रभावी उपयोग सिस्टम विश्लेषण, निगरानी और नियंत्रण के लिए महत्वपूर्ण है।
  3. मौजूदा विधियों की सीमाएं:
    • ऑन्टोलॉजी-आधारित डेटा एक्सेस (OBDA) विधियां समय-श्रृंखला को ग्राफ़ संरचना में मैप करते समय, एक एकल संवेदक के समय मान हजारों तत्वों में बिखरे होते हैं जो स्वतंत्र अवलोकनों का प्रतिनिधित्व करते हैं
    • क्वेरी जटिलता बढ़ती है, स्वतंत्र अवलोकनों से समय मान अवधारणा को पुनर्निर्माण करने की आवश्यकता होती है
    • असमकालिक समय-श्रृंखला को संभालते समय चुनौतियों का सामना करना पड़ता है, विभिन्न समय मुहर्तों के अवलोकनों को संयोजित करना कठिन है
    • अवलोकन मानों के बीच डेटा मॉडलिंग के लिए एकीकृत अवधारणा की कमी है
  4. अनुसंधान प्रेरणा: "प्रथम-श्रेणी नागरिक" के रूप में सिग्नल अवधारणा को पेश करना, स्वतंत्र अवलोकनों को अमूर्त करना, वर्तमान विधियों में संवेदक डेटा गणना अभिव्यक्ति की कमियों को दूर करना।

मुख्य योगदान

  1. भाषा-स्वतंत्र ढांचा प्रस्तावित किया: तीन मुख्य ऑपरेटर (Signal, ApplySF, LiftVal) को परिभाषित किया जो ज्ञान ग्राफ़ क्वेरी भाषा को सिग्नल प्रोसेसिंग के साथ एकीकृत करते हैं
  2. SigSPARQL क्वेरी भाषा डिज़ाइन की: SPARQL सिंटैक्स और शब्दार्थ को विस्तारित किया, सिग्नल को क्वेरी परिणाम के प्रथम-श्रेणी नागरिक के रूप में समर्थन करता है
  3. प्रोटोटाइप सिस्टम बनाया: Oxigraph पर आधारित, तकनीकी व्यवहार्यता को सत्यापित किया
  4. संपूर्ण सैद्धांतिक आधार प्रदान किया: कार्यात्मक प्रतिक्रियाशील प्रोग्रामिंग (FRP) सिद्धांत पर आधारित, सिग्नल और समय-श्रृंखला डेटा के बीच औपचारिक संबंध स्थापित किए
  5. व्यावहारिक अनुप्रयोग मूल्य प्रदर्शित किया: इलेक्ट्रिक वाहन चार्जिंग स्टेशन निगरानी उपयोग मामले के माध्यम से विधि की प्रयोज्यता सिद्ध की

विधि विवरण

कार्य परिभाषा

इनपुट: सिग्नल-एनोटेटेड RDF डेटासेट <D, S, φ>, जहां D एक RDF डेटासेट है, S RDF सिग्नल का संग्रह है, φ सिग्नल एनोटेशन फ़ंक्शन है आउटपुट: समय-समाधान श्रृंखला (TSS) या निरंतर अद्यतन RDF ग्राफ़ बाधाएं: निरंतर क्वेरी समर्थन, असमकालिक संवेदक डेटा स्ट्रीम को संभालना

मुख्य अवधारणाएं और डेटा मॉडल

1. सिग्नल परिभाषा

परिभाषा 7.1: RDF सिग्नल ψ T→RDF के रूप में (संभवतः आंशिक) फ़ंक्शन है
जहां T समय डोमेन है, RDF RDF शर्तों का संग्रह है

2. सिग्नल-एनोटेटेड RDF डेटासेट

परिभाषा 7.2: <D, S, φ>
- D: नियमित RDF डेटासेट
- S: RDF सिग्नल का संग्रह  
- φ: IRI×IRI→S का आंशिक फ़ंक्शन (सिग्नल एनोटेशन फ़ंक्शन)

भाषा-स्वतंत्र ढांचा

लेखकों ने तीन मुख्य ऑपरेटर प्रस्तावित किए:

  1. Signal(s, p): सिग्नल स्रोत s और सिग्नल विशेषता p के आधार पर सिग्नल का निर्माण
  2. ApplySF(f, a⃗): n-आर्य सिग्नल फ़ंक्शन f को लंबाई n की सिग्नल पैरामीटर सूची पर लागू करना
  3. LiftVal(v): मान v को स्थिर सिग्नल में उन्नत करना

SigSPARQL भाषा डिज़ाइन

सिंटैक्स विस्तार

  1. SIGNALS खंड:
SIGNALS {
    ev:ActivePower FROM ?device AS ?ap
    ev:Envelope FROM ?garage AS ?env
}
  1. WHEN खंड:
WHEN {
    SUM(?ap * ?sign) > ?env
    BECOMES TRUE AT ?violation_time
}

शब्दार्थ परिभाषा

  1. समय-समाधान श्रृंखला (TSS): समाधान को चर को RDF शर्तों या RDF सिग्नल में बांधने की अनुमति देता है, समय बिंदु τ पर मूल्यांकन किया जा सकता है
  2. निरंतर क्वेरी: SELECT क्वेरी TSS लौटाती है, CONSTRUCT क्वेरी निरंतर बढ़ते RDF ग्राफ़ लौटाती है
  3. सिग्नल गणना: SPARQL फ़ंक्शन और ऑपरेटर को सिग्नल डोमेन में बिंदु-वार अनुप्रयोग के माध्यम से उन्नत किया जाता है

तकनीकी नवाचार बिंदु

  1. सिग्नल अमूर्तता: FRP में सिग्नल अवधारणा का उपयोग करके अवलोकन-आधारित विधि को प्रतिस्थापित करना, समय डेटा मॉडलिंग के लिए अधिक प्राकृतिक प्रदान करना
  2. एकीकृत क्वेरी मॉडल: एकल क्वेरी में ग्राफ़ संरचना ज्ञान और समय सिग्नल प्रोसेसिंग को संयोजित करना
  3. प्रकार प्रणाली विस्तार: सिग्नल प्रकार का समर्थन करने के लिए SPARQL बीजगणित को विस्तारित करना, स्वचालित रूप से प्रकार उन्नयन को संभालना
  4. निरंतर क्वेरी शब्दार्थ: ट्रिगर इवेंट तंत्र को परिभाषित करना, वास्तविक समय निगरानी अनुप्रयोगों का समर्थन करना

प्रयोगात्मक सेटअप

प्रोटोटाइप कार्यान्वयन

  • आधार ढांचा: Oxigraph ग्राफ़ डेटाबेस पर आधारित
  • समय मॉडल: असतत समय, "अंतिम अवलोकन" रणनीति का उपयोग करके अवलोकन अंतराल डेटा को मॉडल करना
  • मूल्यांकन विधि: दो-चरणीय मूल्यांकन - सिग्नल गणना विवरण का निर्माण, फिर निरंतर क्वेरी इंजन में पंजीकरण

सत्यापन उपयोग मामला

इलेक्ट्रिक वाहन चार्जिंग स्टेशन निगरानी परिदृश्य:

  • सिस्टम संरचना: कई EV चार्जर, फोटोवोल्टिक प्रणाली, बैटरी
  • निगरानी लक्ष्य: शक्ति खपत का पता लगाना जो परिचालन एनवेलप सीमा से अधिक है
  • डेटा स्रोत: सक्रिय शक्ति (AP) संवेदक, बैटरी स्थिति (SoC) संवेदक, परिचालन एनवेलप सीमा

क्वेरी उदाहरण

CONSTRUCT {
    ?garage ev:hasEnvelopeViolation [
        ev:description "Envelope Violated!" ;
        ev:startTime ?violation_time
    ]
}
WHEN {
    SUM(?ap * ?sign) > ?env
    BECOMES TRUE AT ?violation_time
}
SIGNALS {
    ev:ActivePower FROM ?device AS ?ap
    ev:Envelope FROM ?garage AS ?env
}
WHERE {
    ?garage a ev:Garage ; sosa:hosts ?device .
    ?device a ?ap_device_type .
    BIND(IF(?ap_device_type = ev:PVSystem, -1, 1) AS ?sign)
}
GROUP BY ?garage

प्रयोगात्मक परिणाम

तकनीकी व्यवहार्यता सत्यापन

  1. प्रोटोटाइप सिस्टम सफलतापूर्वक कार्यान्वित: SigSPARQL सिंटैक्स और शब्दार्थ का पूर्ण कार्यान्वयन
  2. क्वेरी निष्पादन: निरंतर SELECT क्वेरी (TSS लौटाता है) और CONSTRUCT क्वेरी (निरंतर अद्यतन RDF ग्राफ़ लौटाता है) का समर्थन
  3. सिग्नल प्रोसेसिंग: सिग्नल प्राप्ति, गणना और इवेंट पहचान को सफलतापूर्वक संभाला

अनुप्रयोग प्रभाव

  1. एकीकृत क्वेरी क्षमता: एकल क्वेरी को एक ही डोमेन के विभिन्न सिस्टम उदाहरणों पर लागू किया जा सकता है
  2. वास्तविक समय निगरानी: परिचालन एनवेलप उल्लंघन इवेंट को प्रभावी ढंग से पहचानना
  3. संदर्भ-जागरूक: ज्ञान ग्राफ़ द्वारा प्रदान की गई सिस्टम ज्ञान का उपयोग करके क्वेरी अभिव्यक्ति क्षमता को बढ़ाना

कार्यात्मक सत्यापन

  • असमकालिक संवेदक डेटा के एकीकृत प्रोसेसिंग को सफलतापूर्वक कार्यान्वित किया
  • जटिल सिग्नल गणना (योग, तुलना आदि) का समर्थन किया
  • इवेंट ट्रिगर तंत्र और समय मुहर्त बंधन को कार्यान्वित किया
  • निरंतर क्वेरी की सही्ता को सत्यापित किया

संबंधित कार्य

RDF स्ट्रीम प्रोसेसिंग

  1. विंडो-आधारित विधियां (C-SPARQL, RSP-QL आदि): असीमित स्ट्रीम को सीमित संबंधों में विभाजित करना
  2. CEP-प्रेरित सिस्टम (EP-SPARQL आदि): इवेंट स्ट्रीम में पैटर्न का पता लगाना

समय डेटा क्वेरी और OBDA

  1. Chrontext: SPARQL क्वेरी को समय-श्रृंखला डेटाबेस क्वेरी में पुनः लिखना
  2. Ontop-temporal: समय तार्किक सूत्र क्वेरी क्षमता को विस्तारित करना
  3. STARQL: निरंतर और ऐतिहासिक क्वेरी का समर्थन करने वाली व्यापक विधि

ग्राफ़ और समय-श्रृंखला एकीकरण

  1. Bollen आदि की विधि: माप और समय-श्रृंखला पैटर्न का समर्थन करने के लिए ग्राफ़ मिलान को विस्तारित करना
  2. हाइब्रिड डेटा मॉडल अनुसंधान: ग्राफ़ और समय-श्रृंखला डेटा का संलयन

इस पेपर का अंतर: सिग्नल मॉडलिंग के आधार पर समय मान, अवलोकन विधि की समस्याओं को हल करने के लिए FRP सिद्धांत का उपयोग

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. सिग्नल को प्रथम-श्रेणी नागरिक के रूप में दृष्टिकोण पारंपरिक अवलोकन विधि की सीमाओं को प्रभावी ढंग से हल करता है
  2. SigSPARQL ज्ञान ग्राफ़ और सिग्नल प्रोसेसिंग के लिए एकीकृत क्वेरी इंटरफेस प्रदान करता है
  3. तकनीकी व्यवहार्यता प्रोटोटाइप सिस्टम द्वारा सत्यापित की गई है
  4. व्यावहारिक मूल्य CPS निगरानी परिदृश्य में सिद्ध किया गया है

सीमाएं

  1. सिग्नल प्रकार सीमा: सभी संभावित सिग्नल प्रकारों का समर्थन करने की जटिलता अधिक है, वर्तमान प्रोटोटाइप केवल "अंतिम अवलोकन" रणनीति का समर्थन करता है
  2. अभिव्यक्ति क्षमता सीमा: "पिछले 10 मिनट का औसत मान" जैसी जटिल समय विंडो गणना को व्यक्त नहीं कर सकता
  3. प्रदर्शन विश्लेषण अनुपस्थित: विस्तृत प्रदर्शन मूल्यांकन शामिल नहीं है
  4. स्केल सत्यापन अपर्याप्त: बड़े पैमाने पर CPS तैनाती के सत्यापन की कमी है

भविष्य की दिशाएं

  1. प्रदर्शन अनुकूलन: प्रदर्शन मूल्यांकन और बड़े पैमाने पर निगरानी उपयोग मामलों के लिए अनुकूलित प्रोटोटाइप डिज़ाइन करना
  2. कार्यात्मकता विस्तार: उन्नत सिग्नल प्रोसेसिंग फ़ंक्शन (जैसे एकीकरण संचालन) जोड़ना
  3. उपयोगकर्ता मूल्यांकन: भाषा की प्रयोज्यता लाभों का मूल्यांकन करना
  4. समय ज्ञान ग्राफ़: समय ज्ञान ग्राफ़ का समर्थन करने के लिए क्वेरी भाषा शब्दार्थ को विस्तारित करना
  5. व्यावहारिक तैनाती: वास्तविक CPS तैनाती आवश्यकताओं की जांच करना

गहन मूल्यांकन

शक्तियां

  1. दृढ़ सैद्धांतिक आधार: FRP सिद्धांत पर आधारित, कठोर गणितीय परिभाषा और शब्दार्थ प्रदान करता है
  2. स्पष्ट समस्या परिभाषा: मौजूदा विधियों की मुख्य समस्याओं को सटीक रूप से पहचानता है और लक्षित समाधान प्रदान करता है
  3. तर्कसंगत डिज़ाइन: भाषा विस्तार SPARQL के साथ संगतता बनाए रखता है, कम सीखने की लागत
  4. पूर्ण कार्यान्वयन: सिद्धांत से प्रोटोटाइप से अनुप्रयोग तक पूर्ण श्रृंखला बनाता है
  5. मजबूत नवाचार: पहली बार FRP सिग्नल अवधारणा को ज्ञान ग्राफ़ क्वेरी में पेश करता है

कमियां

  1. सीमित मूल्यांकन: मौजूदा विधियों के साथ मात्रात्मक तुलना और बड़े पैमाने पर सत्यापन की कमी है
  2. सीमित कार्यात्मकता: सिग्नल फ़ंक्शन लाइब्रेरी अपेक्षाकृत सरल है, जटिल समय विश्लेषण क्षमता अपर्याप्त है
  3. प्रदर्शन अज्ञात: प्रदर्शन बेंचमार्क परीक्षण और अनुकूलन विश्लेषण नहीं है
  4. अनुप्रयोग सीमा: मुख्य रूप से CPS निगरानी पर केंद्रित, अन्य क्षेत्रों में प्रयोज्यता की पुष्टि की जानी है

प्रभाव

  1. शैक्षणिक योगदान: ज्ञान ग्राफ़ और समय डेटा एकीकरण के लिए नई सोच प्रदान करता है
  2. व्यावहारिक मूल्य: IoT, इंडस्ट्री 4.0 आदि क्षेत्रों में व्यापक अनुप्रयोग संभावनाएं
  3. तकनीकी प्रेरणा: SPARQL मानक के आगे विकास को प्रेरित कर सकता है
  4. अंतः-विषय संलयन: डेटाबेस, शब्दार्थ वेब और कार्यात्मक प्रोग्रामिंग के बीच क्रॉस-डोमेन सहयोग को बढ़ावा देता है

प्रयोज्य परिदृश्य

  1. औद्योगिक निगरानी: विनिर्माण प्रणाली, ऊर्जा नेटवर्क वास्तविक समय निगरानी
  2. स्मार्ट बिल्डिंग: निर्माण उपकरण स्थिति निगरानी और नियंत्रण
  3. स्मार्ट परिवहन: यातायात प्रवाह और वाहन स्थिति निगरानी
  4. पर्यावरण निगरानी: बड़े पैमाने पर संवेदक नेटवर्क डेटा विश्लेषण

संदर्भ

पेपर में 36 संबंधित संदर्भ उद्धृत किए गए हैं, जो RDF स्ट्रीम प्रोसेसिंग, समय डेटा क्वेरी, कार्यात्मक प्रतिक्रियाशील प्रोग्रामिंग आदि मुख्य क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करते हैं, जो इस अनुसंधान के लिए दृढ़ सैद्धांतिक आधार और तकनीकी पृष्ठभूमि प्रदान करते हैं।


समग्र मूल्यांकन: यह ज्ञान ग्राफ़ क्वेरी भाषा विस्तार के क्षेत्र में एक उच्च-गुणवत्ता वाला डेटाबेस प्रणाली अनुसंधान पेपर है, जो महत्वपूर्ण योगदान प्रदान करता है। सैद्धांतिक आधार दृढ़ है, तकनीकी समाधान तर्कसंगत है, कार्यान्वयन अपेक्षाकृत पूर्ण है। यद्यपि मूल्यांकन और प्रदर्शन के पहलुओं में सुधार की गुंजाइश है, यह संबंधित क्षेत्र के विकास के लिए मूल्यवान नई दिशा प्रदान करता है।