Implementing SIAv2 Over Rubin Observatory's Data Butler
Jenness, Voutsinas, Dubois-Felsmann et al.
The IVOA Simple Image Access version 2 protocol defines an easy way to provide community access to a collection of data. At the Vera C. Rubin Observatory we currently enable ObsTAP access to our data holdings via an ObsCore export or view of our Data Butler repositories. This approach comes with some deployment constraints, such as requiring pgsphere and compatibility with our CADC TAP implementation, so recently we decided to see whether we could instead provide an SIAv2 service that talks directly to our Data Butler. Here we describe our motivation, implementation strategies, and current deployment status, as well as discussing some metadata mismatches between the Butler data models and SIAv2.
Das IVOA Simple Image Access Protocol Version 2 (SIAv2) definiert eine einfache Methode zur Bereitstellung des Zugriffs auf Datensatzsammlungen für die Gemeinschaft. Am Vera C. Rubin Observatory wird der ObsTAP-Datenzugriff derzeit durch ObsCore-Exporte oder -Ansichten aus dem Data Butler Repository implementiert. Dieser Ansatz weist jedoch einige Bereitstellungsbeschränkungen auf, wie die Notwendigkeit der pgsphere-Unterstützung und die Kompatibilität mit der CADC TAP-Implementierung. Daher beschlossen wir, zu untersuchen, ob wir einen SIAv2-Dienst bereitstellen können, der direkt mit dem Data Butler kommuniziert. Dieses Papier beschreibt unsere Motivation, Implementierungsstrategie, den aktuellen Bereitstellungsstatus sowie einige Metadaten-Nichtübereinstimmungsprobleme zwischen dem Butler-Datenmodell und SIAv2.
Das Data Butler-System des Rubin Observatory besteht aus einer Metadaten-Registry und einem Datei-Datenspeicher. Die Registry enthält ausreichend Informationen zur Erstellung von ObsCore-Datensätzen. Zuvor gab es zwei Methoden zur Bereitstellung von ObsCore-Tabellen:
Exportieren von Datensätzen als CSV- oder Parquet-Dateien und Laden in eine statische Datenbank
Verwendung von Registry-Backend-Hooks zur Bereitstellung einer Echtzeitsynchonisierung mit ObsCore-Tabellen
Statische Exportmethode: Geeignet für formale Datenveröffentlichungen und Integration in die leistungsstarke Qserv-Datenbank, aber ungeeignet für dynamische Datensätze wie nächtliche Schnellprodukte
Echtzeit-ObsCore-Methode: Erfordert Bereitstellungsumgebung mit pgsphere-Unterstützung und Neuerstellung der gesamten Tabelle bei Konfigurationsänderungen
Diese Einschränkungen veranlassten das Forschungsteam, eine einfachere, aber standardisierte Abfrageschicht zu suchen, die direkt auf dem Butler-System basiert. Das IVOA SIAv2-Protokoll wurde zur offensichtlichen Wahl, da:
Die direkte Schnittstelle mit Butler größere Flexibilität bietet
Konfigurationsänderungen nur einen einfachen Neustart des Dienstes erfordern
Es sofort mit jedem Butler-Repository zusammenarbeitet
Direkte Zuordnung von IVOA SIAv2-Protokollabfragen zu Rubins Data Butler-Abfragesystem zur Implementierung einer standardisierten astronomischen Datenzugriffschnittstelle, während gleichzeitig die Bereitstellungsbeschränkungen der traditionellen ObsCore-Tabellenmethode vermieden werden.
Dieses Papier zitiert die folgenden Schlüsselliteraturquellen:
Dowler, P., et al. (2015). IVOA Simple Image Access Version 2.0 – Definition des SIAv2-Standardprotokolls
Jenness, T., et al. (2022). Kernarchitektur-Papier des Rubin Data Butler-Systems
Louys, M., et al. (2017). ObsCore-Datenmodell und TAP-Implementierungsstandard
Salnikov, A. (2022). Technisches Memo zu ObsCore als Butler-Registry-Ansicht
Zusammenfassung: Dieses Papier zeigt einen erfolgreichen Engineeringpraxis-Fall, der praktische Bereitstellungsprobleme löst und gleichzeitig die Kompatibilität mit internationalen Standards beibehält. Obwohl es einige Datenmodell-Nichtübereinstimmungs-Herausforderungen gibt, bietet die Gesamtimplementierung wertvolle Referenzen und Werkzeuge für das Feld der astronomischen Datenverwaltung.