Implementing SIAv2 Over Rubin Observatory's Data Butler
Jenness, Voutsinas, Dubois-Felsmann et al.
The IVOA Simple Image Access version 2 protocol defines an easy way to provide community access to a collection of data. At the Vera C. Rubin Observatory we currently enable ObsTAP access to our data holdings via an ObsCore export or view of our Data Butler repositories. This approach comes with some deployment constraints, such as requiring pgsphere and compatibility with our CADC TAP implementation, so recently we decided to see whether we could instead provide an SIAv2 service that talks directly to our Data Butler. Here we describe our motivation, implementation strategies, and current deployment status, as well as discussing some metadata mismatches between the Butler data models and SIAv2.
academic
Implementazione di SIAv2 sul Data Butler dell'Osservatorio Rubin
Il Protocollo di Accesso Semplice alle Immagini IVOA versione 2 (SIAv2) definisce un metodo semplice per fornire alla comunità l'accesso alle collezioni di dati. All'Osservatorio Vera C. Rubin, attualmente implementiamo l'accesso ai dati ObsTAP attraverso esportazioni o viste ObsCore del repository Data Butler. Tuttavia, questo approccio presenta alcuni vincoli di distribuzione, come la necessità del supporto pgsphere e della compatibilità con l'implementazione TAP di CADC. Di conseguenza, abbiamo deciso di esplorare se fosse possibile fornire un servizio SIAv2 che comunichi direttamente con il Data Butler. Questo articolo descrive le nostre motivazioni, la strategia di implementazione, lo stato attuale della distribuzione e alcuni problemi di disallineamento dei metadati tra il modello dati di Butler e SIAv2.
Il sistema Data Butler dell'Osservatorio Rubin è composto da un registro dei metadati e da un archivio di dati su file, dove il registro contiene informazioni sufficienti per costruire record ObsCore. Precedentemente, due metodi fornivano la tabella ObsCore:
Esportazione di record in file CSV o Parquet e caricamento in un database statico
Utilizzo di hook di backend del registro per fornire sincronizzazione in tempo reale con la tabella ObsCore
Metodo di esportazione statica: Appropriato per rilasci di dati formali e integrabile nel database Qserv ad alte prestazioni, ma inadatto per dataset dinamici come i prodotti notturni rapidi
Metodo ObsCore in tempo reale: Richiede l'ambiente di distribuzione con supporto pgsphere e necessita della ricostruzione dell'intera tabella quando cambiano le configurazioni
Questi vincoli hanno spinto il team di ricerca a cercare un livello di interrogazione più semplice ma standardizzato, basato direttamente sul sistema Butler. Il protocollo SIAv2 dell'IVOA è diventato la scelta ovvia perché:
L'interfaccia diretta con Butler fornisce maggiore flessibilità
I cambiamenti di configurazione richiedono solo un semplice riavvio del servizio
Funziona immediatamente con qualsiasi repository Butler
Mappare direttamente le query del protocollo IVOA SIAv2 al sistema di query del Data Butler di Rubin, implementando un'interfaccia standardizzata di accesso ai dati astronomici, evitando al contempo i vincoli di distribuzione del metodo tradizionale della tabella ObsCore.
Problema: Il tempo di esposizione mediano dello stack coadd è una quantità derivata, sconosciuta quando definito nello spazio delle coordinate di Butler
Soluzione: Supporto pianificato per l'archiviazione di metadati derivati nella roadmap di sviluppo futura
Questo articolo cita le seguenti letterature chiave:
Dowler, P., et al. (2015). IVOA Simple Image Access Version 2.0 - Definisce il protocollo standard SIAv2
Jenness, T., et al. (2022). Articolo sull'architettura principale del sistema Rubin Data Butler
Louys, M., et al. (2017). Standardizzazione del modello dati ObsCore e implementazione TAP
Salnikov, A. (2022). Nota tecnica su ObsCore come vista del registro Butler
Sintesi: Questo articolo presenta un caso di studio di pratica ingegneristica di successo, risolvendo problemi di distribuzione pratica mantenendo al contempo la compatibilità con gli standard internazionali. Sebbene esistano alcune sfide di disallineamento del modello dati, l'implementazione complessiva fornisce riferimenti e strumenti preziosi per il campo della gestione dati astronomici.