Implementing SIAv2 Over Rubin Observatory's Data Butler
Jenness, Voutsinas, Dubois-Felsmann et al.
The IVOA Simple Image Access version 2 protocol defines an easy way to provide community access to a collection of data. At the Vera C. Rubin Observatory we currently enable ObsTAP access to our data holdings via an ObsCore export or view of our Data Butler repositories. This approach comes with some deployment constraints, such as requiring pgsphere and compatibility with our CADC TAP implementation, so recently we decided to see whether we could instead provide an SIAv2 service that talks directly to our Data Butler. Here we describe our motivation, implementation strategies, and current deployment status, as well as discussing some metadata mismatches between the Butler data models and SIAv2.
academic
Implementación de SIAv2 sobre el Data Butler del Observatorio Rubin
El Protocolo de Acceso Simple a Imágenes versión 2 (SIAv2) de la IVOA define un método sencillo para proporcionar acceso a colecciones de datos a la comunidad. En el Observatorio Vera C. Rubin, actualmente implementamos el acceso a datos ObsTAP mediante exportaciones u vistas de ObsCore del repositorio Data Butler. Sin embargo, este enfoque presenta algunas limitaciones de despliegue, como la necesidad de soporte pgsphere y compatibilidad con la implementación TAP de CADC. Por lo tanto, decidimos explorar si podríamos proporcionar un servicio SIAv2 que se comunique directamente con el Data Butler. Este artículo describe nuestra motivación, estrategia de implementación, estado actual del despliegue, y algunos problemas de desajuste de metadatos entre el modelo de datos Butler y SIAv2.
El sistema Data Butler del Observatorio Rubin consta de un registro de metadatos y almacenamiento de datos de archivos, donde el registro contiene información suficiente para construir registros ObsCore. Anteriormente se proporcionaban tablas ObsCore mediante dos métodos:
Exportar registros como archivos CSV o Parquet y cargarlos en una base de datos estática
Utilizar ganchos de backend del registro para proporcionar sincronización en tiempo real con tablas ObsCore
Método de exportación estática: Adecuado para publicaciones de datos formales e integración en bases de datos Qserv de alto rendimiento, pero inadecuado para conjuntos de datos dinámicos como productos nocturnos rápidos
Método ObsCore en tiempo real: Requiere que el entorno de despliegue admita pgsphere, y necesita reconstruir toda la tabla cuando cambia la configuración
Estas limitaciones impulsaron al equipo de investigación a buscar una capa de consulta más simple pero estandarizada, basada directamente en el sistema Butler. El protocolo SIAv2 de la IVOA se convirtió en la opción obvia porque:
Proporciona mayor flexibilidad al interactuar directamente con Butler
Los cambios de configuración solo requieren un reinicio simple del servicio
Funciona inmediatamente con cualquier repositorio Butler
Mapear directamente consultas del protocolo IVOA SIAv2 al sistema de consultas del Data Butler de Rubin, implementando una interfaz de acceso a datos astronómicos estandarizada, mientras se evitan las limitaciones de despliegue del método tradicional de tablas ObsCore.
Problema: El tiempo de exposición mediano de pilas coadicionadas es una cantidad derivada, desconocida cuando se define el espacio de coordenadas Butler
Solución: Planeado desarrollar soporte para almacenamiento de metadatos derivados en la hoja de ruta futura
Dowler, P., et al. (2015). IVOA Simple Image Access Version 2.0 - Define el protocolo estándar SIAv2
Jenness, T., et al. (2022). Artículo de arquitectura central del sistema Rubin Data Butler
Louys, M., et al. (2017). Modelo de datos ObsCore e implementación estándar de TAP
Salnikov, A. (2022). Nota técnica sobre ObsCore como vista del registro Butler
Resumen: Este artículo demuestra un caso exitoso de práctica de ingeniería, resolviendo problemas de despliegue real mientras se mantiene compatibilidad con estándares internacionales. Aunque existen algunos desafíos de desajuste de modelos de datos, la implementación general proporciona una referencia valiosa y herramientas para el campo de la gestión de datos astronómicos.