2025-11-12T22:13:10.653124

SigSPARQL: Signals as a First-Class Citizen When Querying Knowledge Graphs

Schwarzinger, Steindl, Frühwirth et al.
Purpose: Cyber-Physical Systems (CPSs) integrate computation and physical processes, producing time series data from thousands of sensors. Knowledge graphs can contextualize these data, yet current approaches that are applicably to monitoring CPS rely on observation-based approaches. This limits the ability to express computations on sensor data, especially when no assumptions can be made about sampling synchronicity or sampling rates. Methodology: We propose an approach for integrating knowledge graphs with signals that model run-time sensor data as functions from time to data. To demonstrate this approach, we introduce SigSPARQL, a query language that can combine RDF data and signals. We assess its technical feasibility with a prototype and demonstrate its use in a typical CPS monitoring use case. Findings: Our approach enables queries to combine graph-based knowledge with signals, overcoming some key limits of observation-based methods. The developed prototype successfully demonstrated feasibility and applicability. Value: This work presents a query-based approach for CPS monitoring that integrates knowledge graphs and signals, alleviating problems of observation-based approaches. By leveraging system knowledge, it enables operators to run a single query across different system instances within the same domain. Future work will extend SigSPARQL with additional signal functions and evaluate it in large-scale CPS deployments.
academic

SigSPARQL: Сигналы как объекты первого класса при запросе графов знаний

Основная информация

  • ID статьи: 2506.03826
  • Название: SigSPARQL: Signals as a First-Class Citizen When Querying Knowledge Graphs
  • Авторы: Tobias Schwarzinger, Gernot Steindl, Thomas Frühwirth, Thomas Preindl, Konrad Diwold, Katrin Ehrenmüller, Fajar J. Ekaputra
  • Категория: cs.DB (Базы данных)
  • Дата публикации: июль 2025
  • Ссылка на статью: https://arxiv.org/abs/2506.03826

Аннотация

В данной статье предлагается новый подход к решению проблем запроса данных при мониторинге киберфизических систем (КФС) путём объединения графов знаний с обработкой сигналов. Традиционные методы, основанные на наблюдаемых данных, имеют ограничения при обработке вычислений данных датчиков, особенно в случаях асинхронной дискретизации или несогласованных частот дискретизации. Авторы предлагают язык запросов SigSPARQL, который моделирует данные датчиков во время выполнения как функции времени в данные (сигналы), обеспечивая унифицированный запрос данных RDF и сигналов. Прототипная система подтверждает техническую осуществимость, а типичные варианты использования мониторинга КФС демонстрируют практическую применимость.

Исследовательский контекст и мотивация

Определение проблемы

  1. Основная проблема: Киберфизические системы генерируют большие объёмы временных рядов данных датчиков, требующих анализа в сочетании с информацией о контексте системы. Однако существующие методы, основанные на наблюдениях, имеют сложность и ограничения при выражении вычислений данных датчиков.
  2. Значимость: С развитием цифровизации КФС широко применяются в строительстве, энергетических сетях, производстве и других областях. Эффективное использование данных датчиков критически важно для анализа, мониторинга и управления системами.
  3. Ограничения существующих методов:
    • Методы доступа к данным на основе онтологий (OBDA) при отображении временных рядов в структуру графа распределяют временные значения одного датчика по тысячам элементов, представляющих независимые наблюдения
    • Сложность запросов возрастает, требуя реконструкции концепции временных значений из независимых наблюдений
    • Возникают трудности при обработке асинхронных временных рядов, когда наблюдения с разными временными метками сложно комбинировать
    • Отсутствует унифицированная концепция моделирования данных между наблюдениями
  4. Исследовательская мотивация: Введение концепции сигнала как "объекта первого класса" для абстрагирования независимых наблюдений и преодоления недостатков текущих методов в выражении вычислений данных датчиков.

Основные вклады

  1. Предложена независимая от языка архитектура: Определены три основных оператора (Signal, ApplySF, LiftVal) для интеграции языков запросов графов знаний с обработкой сигналов
  2. Разработан язык запросов SigSPARQL: Расширена синтаксис и семантика SPARQL для поддержки сигналов как объектов первого класса в результатах запросов
  3. Построена прототипная система: Реализована на основе Oxigraph, подтверждающая техническую осуществимость
  4. Предоставлена полная теоретическая база: На основе функционального реактивного программирования (FRP) установлены формальные отношения между сигналами и данными временных рядов
  5. Продемонстрирована практическая ценность: Вариант использования мониторинга зарядных станций электромобилей подтверждает применимость метода

Подробное описание методологии

Определение задачи

Входные данные: Аннотированный сигналами набор данных RDF <D, S, φ>, где D — набор данных RDF, S — набор сигналов RDF, φ — функция аннотации сигналов Выходные данные: Последовательность временных решений (TSS) или постоянно обновляемый граф RDF Ограничения: Поддержка непрерывных запросов, обработка асинхронных потоков данных датчиков

Основные концепции и модель данных

1. Определение сигнала

Определение 7.1: Сигнал RDF ψ — это (возможно частичная) функция вида T→RDF,
где T — временная область, RDF — множество терминов RDF

2. Набор данных RDF с аннотацией сигналов

Определение 7.2: <D, S, φ>
- D: обычный набор данных RDF
- S: набор сигналов RDF  
- φ: частичная функция IRI×IRI→S (функция аннотации сигналов)

Независимая от языка архитектура

Авторы предлагают три основных оператора:

  1. Signal(s, p): Конструирование сигнала на основе источника сигнала s и свойства сигнала p
  2. ApplySF(f, a⃗): Применение n-арной функции сигнала f к списку параметров сигналов длины n
  3. LiftVal(v): Повышение значения v до постоянного сигнала

Разработка языка SigSPARQL

Расширение синтаксиса

  1. Предложение SIGNALS:
SIGNALS {
    ev:ActivePower FROM ?device AS ?ap
    ev:Envelope FROM ?garage AS ?env
}
  1. Предложение WHEN:
WHEN {
    SUM(?ap * ?sign) > ?env
    BECOMES TRUE AT ?violation_time
}

Определение семантики

  1. Последовательность временных решений (TSS): Позволяет решениям связывать переменные с терминами RDF или сигналами RDF, которые можно оценить в момент времени τ
  2. Непрерывные запросы: Запросы SELECT возвращают TSS, запросы CONSTRUCT возвращают постоянно растущий граф RDF
  3. Вычисление сигналов: Функции и операторы SPARQL поточечно применяются к сигналам

Технические инновации

  1. Абстракция сигналов: Использование концепции сигналов из FRP вместо методов на основе наблюдений обеспечивает более естественное моделирование временных данных
  2. Унифицированная модель запросов: Объединение структурных знаний графа и обработки временных сигналов в едином запросе
  3. Расширение системы типов: Расширение алгебры SPARQL для поддержки типов сигналов с автоматической обработкой повышения типов
  4. Семантика непрерывных запросов: Определение механизма срабатывания событий для поддержки приложений мониторинга в реальном времени

Экспериментальная установка

Реализация прототипа

  • Базовая архитектура: На основе графовой базы данных Oxigraph
  • Временная модель: Дискретное время с использованием стратегии "последнего наблюдения" для моделирования данных между наблюдениями
  • Метод оценки: Двухэтапная оценка — построение описания вычисления сигналов, затем регистрация в механизме непрерывных запросов

Вариант использования для проверки

Сценарий мониторинга зарядной станции электромобилей:

  • Компоненты системы: Несколько зарядников EV, система фотоэлектрических панелей, батарея
  • Цель мониторинга: Обнаружение событий нарушения, когда потребление мощности превышает установленный лимит
  • Источники данных: Датчики активной мощности (AP), датчики состояния заряда батареи (SoC), установленные лимиты

Пример запроса

CONSTRUCT {
    ?garage ev:hasEnvelopeViolation [
        ev:description "Envelope Violated!" ;
        ev:startTime ?violation_time
    ]
}
WHEN {
    SUM(?ap * ?sign) > ?env
    BECOMES TRUE AT ?violation_time
}
SIGNALS {
    ev:ActivePower FROM ?device AS ?ap
    ev:Envelope FROM ?garage AS ?env
}
WHERE {
    ?garage a ev:Garage ; sosa:hosts ?device .
    ?device a ?ap_device_type .
    BIND(IF(?ap_device_type = ev:PVSystem, -1, 1) AS ?sign)
}
GROUP BY ?garage

Результаты экспериментов

Проверка технической осуществимости

  1. Успешная реализация прототипной системы: Полная реализация синтаксиса и семантики SigSPARQL
  2. Выполнение запросов: Поддержка непрерывных запросов SELECT (возвращающих TSS) и запросов CONSTRUCT (возвращающих постоянно обновляемые графы RDF)
  3. Обработка сигналов: Успешная обработка получения сигналов, вычислений и обнаружения событий

Эффект применения

  1. Унифицированная способность запросов: Единый запрос может применяться к различным экземплярам систем в одной области
  2. Мониторинг в реальном времени: Эффективное обнаружение событий нарушения установленных лимитов
  3. Контекстная осведомлённость: Использование знаний системы, предоставляемых графом знаний, для повышения выразительности запросов

Функциональная проверка

  • Успешная обработка асинхронных данных датчиков в унифицированном формате
  • Поддержка сложных вычислений сигналов (суммирование, сравнение и т.д.)
  • Реализация механизма срабатывания событий и привязки временных меток
  • Проверка корректности непрерывных запросов

Связанные работы

Обработка потоков RDF

  1. Методы на основе окон (C-SPARQL, RSP-QL и др.): Разделение неограниченных потоков на ограниченные отношения
  2. Системы, вдохновлённые CEP (EP-SPARQL и др.): Обнаружение паттернов в потоках событий

Запросы временных данных и OBDA

  1. Chrontext: Переписывание запросов SPARQL в запросы к базам данных временных рядов
  2. Ontop-temporal: Расширение возможностей запросов с использованием формул временной логики
  3. STARQL: Комплексный метод, поддерживающий непрерывные и исторические запросы

Интеграция графов и временных рядов

  1. Метод Bollena и др.: Расширение сопоставления графов для поддержки измерений и паттернов временных рядов
  2. Исследования гибридных моделей данных: Слияние данных графов и временных рядов

Отличительные преимущества данной работы: Моделирование временных значений на основе сигналов с использованием теории FRP для решения проблем методов на основе наблюдений

Заключение и обсуждение

Основные выводы

  1. Подход "сигналы как объекты первого класса" эффективно решает ограничения традиционных методов на основе наблюдений
  2. SigSPARQL обеспечивает унифицированный интерфейс запросов для графов знаний и обработки сигналов
  3. Техническая осуществимость подтверждена прототипной системой
  4. Практическая ценность доказана в сценариях мониторинга КФС

Ограничения

  1. Ограничения типов сигналов: Высокая сложность поддержки всех возможных типов сигналов; текущий прототип поддерживает только стратегию "последнего наблюдения"
  2. Ограничения выразительности: Невозможность выражения сложных вычислений временных окон, таких как "среднее значение за последние 10 минут"
  3. Отсутствие анализа производительности: Отсутствуют детальные оценки производительности
  4. Недостаточная проверка масштабируемости: Отсутствует проверка на крупномасштабных развёртываниях КФС

Будущие направления

  1. Оптимизация производительности: Разработка оптимизированного прототипа для оценки производительности и крупномасштабных сценариев мониторинга
  2. Расширение функциональности: Добавление продвинутых функций обработки сигналов (например, интегральные операции)
  3. Оценка пользователями: Оценка преимуществ языка с точки зрения удобства использования
  4. Графы знаний с временной информацией: Расширение семантики языка запросов для поддержки графов знаний с временной информацией
  5. Практическое развёртывание: Исследование требований реальных развёртываний КФС

Глубокая оценка

Преимущества

  1. Прочная теоретическая база: На основе теории FRP с строгими математическими определениями и семантикой
  2. Чёткое определение проблемы: Точное выявление основных проблем существующих методов с целевым решением
  3. Разумный дизайн: Расширение языка сохраняет совместимость со SPARQL, снижая затраты на обучение
  4. Полная реализация: Формирует полную цепь от теории к прототипу и приложениям
  5. Высокая инновационность: Первое введение концепции сигналов FRP в запросы графов знаний

Недостатки

  1. Ограниченная оценка: Отсутствуют количественные сравнения с существующими методами и крупномасштабная проверка
  2. Ограниченная функциональность: Относительно простая библиотека функций сигналов, недостаточные возможности для сложного временного анализа
  3. Неизвестная производительность: Отсутствуют тесты производительности и анализ оптимизации
  4. Ограниченная область применения: Ориентирована в основном на мониторинг КФС; применимость в других областях требует проверки

Влияние

  1. Академический вклад: Предлагает новый подход к интеграции графов знаний и временных данных
  2. Практическая ценность: Широкие перспективы применения в Интернете вещей, Индустрии 4.0 и других областях
  3. Технологический прогресс: Может способствовать дальнейшему развитию стандарта SPARQL
  4. Междисциплинарное слияние: Способствует пересечению баз данных, семантической сети и функционального программирования

Сценарии применения

  1. Промышленный мониторинг: Мониторинг производственных систем, энергетических сетей в реальном времени
  2. Умные здания: Мониторинг и управление состоянием оборудования зданий
  3. Умный транспорт: Мониторинг транспортных потоков и состояния транспортных средств
  4. Экологический мониторинг: Анализ данных крупномасштабных сетей датчиков

Библиография

Статья цитирует 36 связанных работ, охватывающих ключевые области обработки потоков RDF, запросов временных данных и функционального реактивного программирования, обеспечивая прочную теоретическую базу и технический контекст для данного исследования.


Общая оценка: Это высококачественная научная работа в области систем баз данных, вносящая важный вклад в расширение языков запросов графов знаний. Имеет прочную теоретическую базу, разумное техническое решение и относительно полную реализацию. Хотя в оценке и производительности есть место для улучшения, работа предоставляет ценное новое направление для развития соответствующих областей.