Implementing SIAv2 Over Rubin Observatory's Data Butler
Jenness, Voutsinas, Dubois-Felsmann et al.
The IVOA Simple Image Access version 2 protocol defines an easy way to provide community access to a collection of data. At the Vera C. Rubin Observatory we currently enable ObsTAP access to our data holdings via an ObsCore export or view of our Data Butler repositories. This approach comes with some deployment constraints, such as requiring pgsphere and compatibility with our CADC TAP implementation, so recently we decided to see whether we could instead provide an SIAv2 service that talks directly to our Data Butler. Here we describe our motivation, implementation strategies, and current deployment status, as well as discussing some metadata mismatches between the Butler data models and SIAv2.
academic
Implémentation de SIAv2 sur le Data Butler de l'Observatoire Rubin
Le protocole IVOA Simple Image Access version 2 (SIAv2) définit une méthode simple pour fournir à la communauté l'accès aux collections de données. À l'Observatoire Vera C. Rubin, nous implémentons actuellement l'accès aux données ObsTAP via l'exportation ou la vue ObsCore du référentiel Data Butler. Cependant, cette approche présente certaines contraintes de déploiement, notamment la nécessité d'un support pgsphere et la compatibilité avec l'implémentation TAP du CADC. Par conséquent, nous avons décidé d'explorer la possibilité de fournir un service SIAv2 communiquant directement avec le Data Butler. Cet article décrit nos motivations, notre stratégie d'implémentation, l'état actuel du déploiement, ainsi que certains problèmes d'inadéquation des métadonnées entre le modèle de données Butler et SIAv2.
Le système Data Butler de l'Observatoire Rubin se compose d'un registre de métadonnées et d'un stockage de données fichiers, le registre contenant suffisamment d'informations pour construire des enregistrements ObsCore. Deux approches ont été précédemment utilisées pour fournir la table ObsCore :
Exporter les enregistrements en fichiers CSV ou Parquet et les charger dans une base de données statique
Utiliser des crochets de backend de registre pour fournir une synchronisation en temps réel vers la table ObsCore
Méthode d'exportation statique: Appropriée pour les publications de données formelles et intégrable dans la base de données Qserv haute performance, mais inadaptée aux ensembles de données dynamiques tels que les produits quotidiens
Méthode ObsCore en temps réel: Nécessite un environnement de déploiement supportant pgsphere et exige une reconstruction de la table entière lors de modifications de configuration
Ces limitations ont incité l'équipe de recherche à chercher une couche de requête plus simple mais standardisée, basée directement sur le système Butler. Le protocole SIAv2 de l'IVOA s'est avéré être un choix évident car :
L'interface directe avec Butler offre une plus grande flexibilité
Les modifications de configuration ne nécessitent qu'un simple redémarrage du service
Peut fonctionner immédiatement avec n'importe quel référentiel Butler
Conception et implémentation d'une interface directe SIAv2 vers Butler: Contournement de la couche intermédiaire de table ObsCore traditionnelle
Développement d'une architecture en couches: Séparation de la couche de service du traitement des requêtes SIAv2, améliorant la testabilité
Création de la bibliothèque dax_obscore: Fourniture d'une interface en ligne de commande, facilitant l'apprentissage et l'expérimentation des utilisateurs
Déploiement d'un service prêt pour la production: Déployé sur la plateforme scientifique Rubin et disponible pour le débogage des données
Identification et analyse des problèmes d'inadéquation des modèles de données: Fourniture d'une feuille de route claire pour les améliorations futures
Mapper directement les requêtes du protocole IVOA SIAv2 au système de requêtes du Data Butler Rubin, en implémentant une interface d'accès aux données astronomiques standardisée, tout en évitant les contraintes de déploiement de la méthode traditionnelle de table ObsCore.
Faisabilité de l'implémentation: L'implémentation de SIAv2 au-dessus du Data Butler est un processus relativement simple
Avantages architecturaux: La stratégie de développement en couches permet le développement parallèle et fournit des outils en ligne de commande supplémentaires
Succès du déploiement: Le service a été déployé avec succès et est disponible pour l'environnement de production
Dowler, P., et al. (2015). IVOA Simple Image Access Version 2.0 - Définition de la norme du protocole SIAv2
Jenness, T., et al. (2022). Article fondamental sur l'architecture du système Rubin Data Butler
Louys, M., et al. (2017). Modèle de données ObsCore et norme d'implémentation TAP
Salnikov, A. (2022). Note technique sur ObsCore en tant que vue du registre Butler
Résumé: Cet article présente un cas d'étude réussi de pratique d'ingénierie, résolvant les problèmes de déploiement pratiques tout en maintenant la compatibilité avec les normes internationales. Bien que certains défis d'inadéquation des modèles de données subsistent, l'implémentation globale fournit une référence et des outils précieux pour le domaine de la gestion des données astronomiques.