StatTestCalculator: A New General Tool for Statistical Analysis in High Energy Physics
Abasov, Dudko, Gorin et al.
We present StatTestCalculator (STC), a new open-source statistical analysis tool designed for analysis high energy physics experiments. STC provides both asymptotic calculations and Monte Carlo simulations for computing the exact statistical significance of a discovery or for setting upper limits on signal model parameters. We review the underlying statistical formalism, including profile likelihood ratio test statistics for discovery and exclusion hypotheses, and the asymptotic distributions that allow quick significance estimates. We explain the relevant formulas for the likelihood functions, test statistic distributions, and significance metrics (both with and without incorporating systematic uncertainties). The implementation and capabilities of STC are described, and we validate its performance against the widely-used CMS Combine tool. We find excellent agreement in both the expected discovery significances and upper limit calculations. STC is a flexible framework that can accommodate systematic uncertainties and user-defined statistical models, making it suitable for a broad range of analyses.
academic
StatTestCalculator: Новый универсальный инструмент для статистического анализа в физике высоких энергий
Название: StatTestCalculator: A New General Tool for Statistical Analysis in High Energy Physics
Авторы: Е. Абасов, Л.В. Дудко, Д.Е. Горин, О.С. Василевский (Физический факультет МГУ имени М.В. Ломоносова, Институт ядерной физики им. И.В. Курчатова)
Дата публикации/конференция: Moscow University Physics Bulletin 80(8), 2025; XXV Международный семинар-школа по физике высоких энергий и квантовой теории поля
В данной работе представлен StatTestCalculator (STC) — новый инструмент с открытым исходным кодом для статистического анализа, разработанный специально для анализа экспериментов на коллайдерах. STC предоставляет два метода расчёта: асимптотические формулы и моделирование методом Монте-Карло для вычисления точной статистической значимости открытия или установления верхних пределов на параметры модели сигнала. В статье рассмотрены лежащие в основе статистические формализмы, включая тест отношения профильного правдоподобия для гипотез открытия и исключения, а также асимптотические распределения, позволяющие быстро оценивать значимость. Авторы подробно объясняют соответствующие формулы для функции правдоподобия, распределений тестовой статистики и мер значимости (с учётом и без учёта систематических неопределённостей). В работе описаны реализация и функциональность STC, а также проведена верификация производительности путём сравнения с широко используемым инструментом CMS Combine, демонстрирующая отличное согласие как при расчёте ожидаемой значимости открытия, так и при вычислении верхних пределов.
Эксперименты в физике высоких энергий (ФВЭ) полагаются на статистический анализ наблюдаемых данных для получения выводов о новых явлениях. Поскольку результаты экспериментов на коллайдерах по своей природе являются вероятностными, необходимы строгие статистические методы для оценки параметров и оценки значимости потенциальных открытий.
Хотя существует множество сложных статистических инструментов для анализа в ФВЭ, таких как:
Фреймворки RooFit и RooStats
Инструмент CMS Combine
Theta
HistFactory
эти инструменты обычно разработаны для сложного анализа в больших масштабах и не предоставляют лёгкий в использовании универсальный инструмент для быстрых и точных статистических расчётов в различных типичных сценариях.
Разработка нового инструмента статистического анализа STC: лёгкий, основанный на Python инструмент с открытым исходным кодом, специально предназначенный для статистического анализа в ФВЭ
Предоставление двойного метода расчёта: поддержка как асимптотических формул (замкнутые приближения), так и точных расчётов методом Монте-Карло
Полная обработка систематических неопределённостей: поддержка нормального, логнормального или определяемых пользователем распределений систематических эффектов
Ограничения сложности: хотя поддерживается анализ с несколькими бинами, для чрезвычайно сложных статистических моделей может быть менее подходящим, чем специализированные инструменты
Пространство для оптимизации: производительность при обработке крупномасштабных данных может быть улучшена
Полнота документации: как новый инструмент, требует больше примеров использования и документации