Implementing SIAv2 Over Rubin Observatory's Data Butler
Jenness, Voutsinas, Dubois-Felsmann et al.
The IVOA Simple Image Access version 2 protocol defines an easy way to provide community access to a collection of data. At the Vera C. Rubin Observatory we currently enable ObsTAP access to our data holdings via an ObsCore export or view of our Data Butler repositories. This approach comes with some deployment constraints, such as requiring pgsphere and compatibility with our CADC TAP implementation, so recently we decided to see whether we could instead provide an SIAv2 service that talks directly to our Data Butler. Here we describe our motivation, implementation strategies, and current deployment status, as well as discussing some metadata mismatches between the Butler data models and SIAv2.
academic
Реализация SIAv2 поверх Data Butler обсерватории Rubin
Протокол простого доступа к изображениям IVOA версии 2 (SIAv2) определяет простой способ предоставления доступа к коллекциям данных для научного сообщества. В обсерватории Vera C. Rubin мы в настоящее время реализуем доступ к данным ObsTAP через экспорт или представление ObsCore из репозитория Data Butler. Однако этот подход имеет определённые ограничения развёртывания, такие как требование поддержки pgsphere и совместимость с реализацией CADC TAP. Поэтому мы решили исследовать возможность предоставления сервиса SIAv2, который напрямую взаимодействует с Data Butler. В данной статье описаны наша мотивация, стратегия реализации, текущий статус развёртывания и некоторые проблемы несоответствия метаданных между моделью данных Butler и SIAv2.
Система Data Butler обсерватории Rubin состоит из реестра метаданных и хранилища файловых данных, где реестр содержит достаточно информации для построения записей ObsCore. Ранее существовало два подхода к предоставлению таблицы ObsCore:
Экспорт записей в файлы CSV или Parquet и загрузка в статическую базу данных
Использование хуков бэкенда реестра для обеспечения синхронизации в реальном времени с таблицей ObsCore
Метод статического экспорта: подходит для официальных выпусков данных и может быть интегрирован в высокопроизводительную базу данных Qserv, но не подходит для динамических наборов данных, таких как быстрые продукты каждую ночь
Метод ObsCore в реальном времени: требует поддержки pgsphere в среде развёртывания и требует перестроения всей таблицы при изменении конфигурации
Эти ограничения побудили исследовательскую группу искать более простой, но стандартизированный уровень запросов, работающий непосредственно на основе системы Butler. Протокол SIAv2 IVOA стал очевидным выбором, поскольку:
Прямой интерфейс с Butler обеспечивает большую гибкость
Изменения конфигурации требуют только простого перезапуска сервиса
Может немедленно работать с любым репозиторием Butler
Прямое отображение запросов протокола IVOA SIAv2 на систему запросов Rubin Data Butler для реализации стандартизированного интерфейса доступа к астрономическим данным, избегая ограничений развёртывания традиционного метода таблиц ObsCore.
Осуществимость реализации: реализация SIAv2 поверх Data Butler является относительно простым процессом
Преимущества архитектуры: многоуровневая стратегия разработки обеспечивает параллельную разработку и предоставляет дополнительные инструменты командной строки
Успешное развёртывание: сервис успешно развёрнут и может использоваться в производственной среде
В данной статье цитируются следующие ключевые работы:
Dowler, P., et al. (2015). IVOA Simple Image Access Version 2.0 - определение стандарта протокола SIAv2
Jenness, T., et al. (2022). Основная архитектура системы Rubin Data Butler
Louys, M., et al. (2017). Стандартизация модели данных ObsCore и реализации TAP
Salnikov, A. (2022). Техническое описание ObsCore как представления реестра Butler
Резюме: Данная статья демонстрирует успешный пример инженерной практики, решающий конкретные проблемы развёртывания при сохранении совместимости с международными стандартами. Несмотря на некоторые вызовы, связанные с несоответствием моделей данных, реализация в целом предоставляет ценный справочный материал и инструменты для области управления астрономическими данными.