2025-11-12T22:13:10.653124

SigSPARQL: Signals as a First-Class Citizen When Querying Knowledge Graphs

Schwarzinger, Steindl, Frühwirth et al.
Purpose: Cyber-Physical Systems (CPSs) integrate computation and physical processes, producing time series data from thousands of sensors. Knowledge graphs can contextualize these data, yet current approaches that are applicably to monitoring CPS rely on observation-based approaches. This limits the ability to express computations on sensor data, especially when no assumptions can be made about sampling synchronicity or sampling rates. Methodology: We propose an approach for integrating knowledge graphs with signals that model run-time sensor data as functions from time to data. To demonstrate this approach, we introduce SigSPARQL, a query language that can combine RDF data and signals. We assess its technical feasibility with a prototype and demonstrate its use in a typical CPS monitoring use case. Findings: Our approach enables queries to combine graph-based knowledge with signals, overcoming some key limits of observation-based methods. The developed prototype successfully demonstrated feasibility and applicability. Value: This work presents a query-based approach for CPS monitoring that integrates knowledge graphs and signals, alleviating problems of observation-based approaches. By leveraging system knowledge, it enables operators to run a single query across different system instances within the same domain. Future work will extend SigSPARQL with additional signal functions and evaluate it in large-scale CPS deployments.
academic

SigSPARQL: 지식 그래프 쿼리 시 신호를 일급 객체로 취급

기본 정보

  • 논문 ID: 2506.03826
  • 제목: SigSPARQL: Signals as a First-Class Citizen When Querying Knowledge Graphs
  • 저자: Tobias Schwarzinger, Gernot Steindl, Thomas Frühwirth, Thomas Preindl, Konrad Diwold, Katrin Ehrenmüller, Fajar J. Ekaputra
  • 분류: cs.DB (데이터베이스)
  • 발표 시간: 2025년 7월
  • 논문 링크: https://arxiv.org/abs/2506.03826

초록

본 논문은 정보물리시스템(CPS) 모니터링의 데이터 쿼리 문제를 해결하기 위해 지식 그래프와 신호 처리를 결합한 새로운 방법을 제안한다. 기존 방법은 관측 데이터에 기반하며, 특히 샘플링이 비동기이거나 샘플링 속도가 일치하지 않는 경우 센서 데이터 계산 처리에 제한이 있다. 저자들은 SigSPARQL 쿼리 언어를 제안하여 런타임 센서 데이터를 시간에서 데이터로의 함수(신호)로 모델링하고, RDF 데이터와 신호의 통합 쿼리를 구현했다. 프로토타입 시스템을 통해 기술적 타당성을 검증하고 전형적인 CPS 모니터링 사용 사례에서 응용 효과를 입증했다.

연구 배경 및 동기

문제 정의

  1. 핵심 문제: 정보물리시스템이 생성하는 대량의 시계열 센서 데이터를 시스템 컨텍스트 정보와 결합하여 분석해야 하지만, 기존 관측 기반 방법은 센서 데이터 계산 표현에서 복잡성과 제한이 있다.
  2. 중요성: 디지털화 발전에 따라 CPS는 건축, 에너지 네트워크, 제조업 등 다양한 분야에 광범위하게 적용되고 있으며, 센서 데이터의 효과적 활용은 시스템 분석, 모니터링 및 제어에 필수적이다.
  3. 기존 방법의 한계:
    • 온톨로지 기반 데이터 접근(OBDA) 방법은 시계열을 그래프 구조로 매핑할 때, 단일 센서의 시간 값이 독립적 관측을 나타내는 수천 개의 요소에 분산된다
    • 쿼리 복잡도 증가로 독립적 관측에서 시간 값 개념을 재구성해야 한다
    • 비동기 시계열 처리 시 어려움이 있으며, 서로 다른 타임스탬프의 관측을 조합하기 어렵다
    • 관측값 간 데이터 모델링에 대한 통합 개념이 부족하다
  4. 연구 동기: 신호(Signal) 개념을 "일급 객체"로 도입하여 독립적 관측을 추상화하고, 현재 방법의 센서 데이터 계산 표현 부족을 극복한다.

핵심 기여

  1. 언어 무관 프레임워크 제안: 지식 그래프 쿼리 언어와 신호 처리를 통합하기 위한 세 가지 핵심 연산자(Signal, ApplySF, LiftVal) 정의
  2. SigSPARQL 쿼리 언어 설계: SPARQL 구문과 의미론을 확장하여 신호를 쿼리 결과의 일급 객체로 지원
  3. 프로토타입 시스템 구축: Oxigraph 기반 구현으로 기술적 타당성 검증
  4. 완전한 이론적 기초 제공: 함수형 반응형 프로그래밍(FRP) 이론에 기반하여 신호와 시계열 데이터의 형식화된 관계 수립
  5. 실제 응용 가치 입증: 전기자동차 충전소 모니터링 사용 사례를 통해 방법의 적용성 증명

방법론 상세 설명

작업 정의

입력: 신호 주석이 달린 RDF 데이터셋 <D, S, φ>, 여기서 D는 RDF 데이터셋, S는 RDF 신호 집합, φ는 신호 주석 함수 출력: 시계열 해석(TSS) 또는 지속적으로 업데이트되는 RDF 그래프 제약 조건: 연속 쿼리 지원, 비동기 센서 데이터 스트림 처리

핵심 개념 및 데이터 모델

1. 신호 정의

정의 7.1: RDF 신호 ψ는 T→RDF 형태의 (부분적일 수 있는) 함수
여기서 T는 시간 영역, RDF는 RDF 항 집합

2. 신호 주석 RDF 데이터셋

정의 7.2: <D, S, φ>
- D: 일반 RDF 데이터셋
- S: RDF 신호 집합  
- φ: IRI×IRI→S의 부분 함수(신호 주석 함수)

언어 무관 프레임워크

저자들은 세 가지 핵심 연산자를 제안한다:

  1. Signal(s, p): 신호 소스 s와 신호 속성 p를 기반으로 신호 구성
  2. ApplySF(f, a⃗): n원 신호 함수 f를 길이 n의 신호 매개변수 목록에 적용
  3. LiftVal(v): 값 v를 상수 신호로 승격

SigSPARQL 언어 설계

구문 확장

  1. SIGNALS 절:
SIGNALS {
    ev:ActivePower FROM ?device AS ?ap
    ev:Envelope FROM ?garage AS ?env
}
  1. WHEN 절:
WHEN {
    SUM(?ap * ?sign) > ?env
    BECOMES TRUE AT ?violation_time
}

의미론 정의

  1. 시계열 해석(TSS): 해석이 변수를 RDF 항 또는 RDF 신호에 바인딩할 수 있으며, 시간점 τ에서 평가 가능
  2. 연속 쿼리: SELECT 쿼리는 TSS를 반환하고, CONSTRUCT 쿼리는 지속적으로 증가하는 RDF 그래프를 반환
  3. 신호 계산: 점별 적용을 통해 SPARQL 함수와 연산자를 신호 영역으로 승격

기술 혁신점

  1. 신호 추상화: FRP의 신호 개념을 사용하여 관측 기반 방법을 대체하고, 시간 데이터의 더 자연스러운 모델링 제공
  2. 통합 쿼리 모델: 단일 쿼리에서 그래프 구조 지식과 시간 신호 처리 결합
  3. 타입 시스템 확장: SPARQL 대수를 확장하여 신호 타입 지원, 자동 타입 승격 처리
  4. 연속 쿼리 의미론: 이벤트 트리거 메커니즘 정의, 실시간 모니터링 응용 지원

실험 설정

프로토타입 구현

  • 기초 프레임워크: Oxigraph 그래프 데이터베이스 기반
  • 시간 모델: 이산 시간, "마지막 관측" 전략을 사용하여 관측 간 데이터 모델링
  • 평가 방식: 2단계 평가 - 신호 계산 설명 구성, 이후 연속 쿼리 엔진 등록

검증 사용 사례

전기자동차 충전소 모니터링 시나리오:

  • 시스템 구성: 다중 EV 충전기, 태양광 시스템, 배터리
  • 모니터링 목표: 전력 소비가 운영 봉투 제한을 초과하는 위반 이벤트 감지
  • 데이터 소스: 유효 전력(AP) 센서, 배터리 상태(SoC) 센서, 운영 봉투 제한

쿼리 예시

CONSTRUCT {
    ?garage ev:hasEnvelopeViolation [
        ev:description "Envelope Violated!" ;
        ev:startTime ?violation_time
    ]
}
WHEN {
    SUM(?ap * ?sign) > ?env
    BECOMES TRUE AT ?violation_time
}
SIGNALS {
    ev:ActivePower FROM ?device AS ?ap
    ev:Envelope FROM ?garage AS ?env
}
WHERE {
    ?garage a ev:Garage ; sosa:hosts ?device .
    ?device a ?ap_device_type .
    BIND(IF(?ap_device_type = ev:PVSystem, -1, 1) AS ?sign)
}
GROUP BY ?garage

실험 결과

기술적 타당성 검증

  1. 프로토타입 시스템 성공 구현: SigSPARQL 구문과 의미론의 완전한 구현
  2. 쿼리 실행: 연속 SELECT 쿼리(TSS 반환) 및 CONSTRUCT 쿼리(지속적으로 업데이트되는 RDF 그래프 반환) 지원
  3. 신호 처리: 신호 획득, 계산 및 이벤트 감지 성공적 처리

응용 효과

  1. 통합 쿼리 능력: 단일 쿼리를 동일 영역 내 다양한 시스템 인스턴스에 적용 가능
  2. 실시간 모니터링: 운영 봉투 위반 이벤트 효과적 감지
  3. 컨텍스트 인식: 지식 그래프가 제공하는 시스템 지식을 활용하여 쿼리 표현 능력 강화

기능 검증

  • 비동기 센서 데이터의 통합 처리 성공적 구현
  • 복잡한 신호 계산(합계, 비교 등) 지원
  • 이벤트 트리거 메커니즘 및 타임스탬프 바인딩 구현
  • 연속 쿼리의 정확성 검증

관련 연구

RDF 스트림 처리

  1. 윈도우 기반 방법(C-SPARQL, RSP-QL 등): 무한 스트림을 유한 관계로 분할
  2. CEP 영감 시스템(EP-SPARQL 등): 이벤트 스트림에서 패턴 감지

시간 데이터 쿼리 및 OBDA

  1. Chrontext: SPARQL 쿼리를 시계열 데이터베이스 쿼리로 재작성
  2. Ontop-temporal: 시간 논리 공식 쿼리 능력 확장
  3. STARQL: 연속 및 과거 쿼리를 지원하는 종합 방법

그래프와 시계열 통합

  1. Bollen 등의 방법: 측정 및 시계열 패턴을 지원하도록 그래프 매칭 확장
  2. 혼합 데이터 모델 연구: 그래프 및 시계열 데이터 융합

본 논문의 차별화 우위: 신호 모델링을 기반으로 시간 값을 표현하고, FRP 이론을 활용하여 관측 방법의 문제 해결

결론 및 논의

주요 결론

  1. 신호를 일급 객체로 취급하는 방법이 기존 관측 방법의 한계를 효과적으로 해결한다
  2. SigSPARQL은 지식 그래프와 신호 처리의 통합 쿼리 인터페이스를 제공한다
  3. 기술적 타당성이 프로토타입 시스템을 통해 검증되었다
  4. 실용적 가치가 CPS 모니터링 시나리오에서 입증되었다

한계점

  1. 신호 타입 제한: 모든 가능한 신호 타입 지원의 복잡성이 높으며, 현재 프로토타입은 "마지막 관측" 전략만 지원한다
  2. 표현 능력 제한: "지난 10분 평균값" 등 복잡한 시간 윈도우 계산을 표현할 수 없다
  3. 성능 분석 부재: 상세한 성능 평가가 포함되지 않았다
  4. 규모 검증 부족: 대규모 CPS 배포에 대한 검증이 부족하다

향후 방향

  1. 성능 최적화: 최적화된 프로토타입 설계로 성능 평가 및 대규모 모니터링 사용 사례 수행
  2. 기능 확장: 고급 신호 처리 함수(예: 적분 연산) 추가
  3. 사용자 평가: 언어의 사용성 우위 평가
  4. 시간 지식 그래프: 시간 지식 그래프 지원을 위해 쿼리 언어 의미론 확장
  5. 실제 배포: 실제 CPS 배포 요구사항 조사

심층 평가

장점

  1. 견고한 이론적 기초: FRP 이론에 기반하여 엄격한 수학적 정의와 의미론 제공
  2. 명확한 문제 정의: 기존 방법의 핵심 문제를 정확히 파악하고 맞춤형 해결책 제시
  3. 합리적 설계: 언어 확장이 SPARQL과의 호환성을 유지하여 학습 비용 낮음
  4. 완전한 구현: 이론에서 프로토타입을 거쳐 응용까지 완전한 체인 형성
  5. 강한 혁신성: 처음으로 FRP 신호 개념을 지식 그래프 쿼리에 도입

부족한 점

  1. 제한된 평가: 기존 방법과의 정량적 비교 및 대규모 검증 부재
  2. 기능 제한: 신호 함수 라이브러리가 상대적으로 단순하며, 복잡한 시간 분석 능력 부족
  3. 성능 미지수: 성능 벤치마크 테스트 및 최적화 분석 없음
  4. 응용 범위: 주로 CPS 모니터링에 초점을 맞추고 있으며, 다른 분야의 적용성 미검증

영향력

  1. 학술 기여: 지식 그래프와 시간 데이터 통합에 새로운 사고방식 제공
  2. 실용적 가치: IoT, 산업 4.0 등 분야에서 광범위한 응용 전망
  3. 기술 추진: SPARQL 표준의 추가 발전을 촉진할 가능성
  4. 학제 간 융합: 데이터베이스, 시맨틱 웹, 함수형 프로그래밍의 교차 촉진

적용 시나리오

  1. 산업 모니터링: 제조 시스템, 에너지 네트워크 실시간 모니터링
  2. 스마트 빌딩: 건물 설비 상태 모니터링 및 제어
  3. 스마트 교통: 교통 흐름 및 차량 상태 모니터링
  4. 환경 모니터링: 대규모 센서 네트워크 데이터 분석

참고 문헌

논문은 36편의 관련 문헌을 인용하고 있으며, RDF 스트림 처리, 시간 데이터 쿼리, 함수형 반응형 프로그래밍 등 핵심 분야의 중요한 연구를 포함하여 본 연구에 견고한 이론적 기초와 기술적 배경을 제공한다.


종합 평가: 이는 지식 그래프 쿼리 언어 확장 분야에서 중요한 기여를 한 고품질의 데이터베이스 시스템 연구 논문이다. 이론적 기초가 견고하고, 기술 방안이 합리적이며, 구현이 비교적 완전하다. 평가 및 성능 측면에서 개선의 여지가 있지만, 관련 분야의 발전에 가치 있는 새로운 방향을 제시한다.