StatTestCalculator: A New General Tool for Statistical Analysis in High Energy Physics
Abasov, Dudko, Gorin et al.
We present StatTestCalculator (STC), a new open-source statistical analysis tool designed for analysis high energy physics experiments. STC provides both asymptotic calculations and Monte Carlo simulations for computing the exact statistical significance of a discovery or for setting upper limits on signal model parameters. We review the underlying statistical formalism, including profile likelihood ratio test statistics for discovery and exclusion hypotheses, and the asymptotic distributions that allow quick significance estimates. We explain the relevant formulas for the likelihood functions, test statistic distributions, and significance metrics (both with and without incorporating systematic uncertainties). The implementation and capabilities of STC are described, and we validate its performance against the widely-used CMS Combine tool. We find excellent agreement in both the expected discovery significances and upper limit calculations. STC is a flexible framework that can accommodate systematic uncertainties and user-defined statistical models, making it suitable for a broad range of analyses.
academic
StatTestCalculator : Un Nouvel Outil Général pour l'Analyse Statistique en Physique des Hautes Énergies
Titre : StatTestCalculator: A New General Tool for Statistical Analysis in High Energy Physics
Auteurs : E. Abasov, L.V. Dudko, D.E. Gorin, O.S. Vasilevskii (Faculté de Physique de l'Université d'État de Moscou, Institut de Physique Nucléaire Skobeltsyn)
Date de publication/Conférence : Moscow University Physics Bulletin 80(8), 2025 ; XXVe Atelier-École International de Physique des Hautes Énergies et Théorie Quantique des Champs
Cet article présente StatTestCalculator (STC), un nouvel outil d'analyse statistique open-source conçu spécifiquement pour l'analyse expérimentale en physique des hautes énergies. STC propose deux approches : le calcul asymptotique et la simulation de Monte-Carlo, pour calculer la signification statistique précise d'une découverte ou établir des limites supérieures sur les paramètres des modèles de signal. L'article examine la formalisation statistique sous-jacente, notamment le test du rapport de vraisemblance profilée pour les hypothèses de découverte et d'exclusion, ainsi que les distributions asymptotiques permettant une estimation rapide de la signification. Les auteurs expliquent en détail les formules pertinentes concernant la fonction de vraisemblance, les distributions des statistiques de test et les mesures de signification (avec et sans incertitudes systématiques). L'article décrit l'implémentation et les fonctionnalités de STC et valide ses performances par comparaison avec l'outil CMS Combine largement utilisé, démontrant une excellente cohérence tant pour la signification de découverte attendue que pour les calculs de limites supérieures.
Les expériences de physique des hautes énergies (PHE) s'appuient sur l'analyse statistique des données observées pour tirer des conclusions concernant les phénomènes nouveaux. Puisque les résultats des expériences de collisionneur sont intrinsèquement probabilistes, des méthodes statistiques rigoureuses sont nécessaires pour estimer les paramètres et évaluer la signification des découvertes potentielles.
Bien que de nombreux outils statistiques sophistiqués existent pour l'analyse en PHE, tels que :
Les cadres RooFit et RooStats
L'outil CMS Combine
Theta
HistFactory
ces outils sont généralement conçus pour des analyses complexes à grande échelle et manquent d'un outil léger capable de fournir des calculs statistiques généraux rapides et précis pour diverses situations courantes.
Développement d'un nouvel outil d'analyse statistique STC : Outil open-source léger basé sur Python, spécialisé dans l'analyse statistique en PHE
Fourniture d'une double approche de calcul : Support des formules asymptotiques (approximations de forme fermée) et du calcul exact par simulation de Monte-Carlo
Traitement complet des incertitudes systématiques : Support des distributions d'effets systématiques normales, log-normales ou définies par l'utilisateur
Validation de la précision de l'outil : Comparaison extensive avec l'outil CMS Combine, démontrant une excellente cohérence
Fourniture d'un cadre mathématique étendu : Extension des formules d'analyse à un bin unique vers l'analyse de forme multi-bin générale
Pour une expérience de comptage avec N régions de signal, les comptages observés nᵢ sont supposés suivre une distribution de Poisson : nᵢ ~ Poisson(μsᵢ + κᵢbᵢ)
Efficacité de l'outil : STC implémente avec succès des fonctionnalités d'analyse statistique précises, montrant une excellente cohérence avec l'outil standard Combine
Complétude de la méthode : Fournit un cadre statistique complet allant des expériences de comptage simples à l'analyse de forme complexe
Valeur pratique : La conception légère le rend adapté aux analyses rapides et aux fins pédagogiques
Extensibilité : La conception modulaire supporte la personnalisation par l'utilisateur et l'extension des méthodes
Limites de complexité : Bien que supportant l'analyse multi-bin, il peut être moins performant que les outils spécialisés pour les modèles statistiques extrêmement complexes
Espace d'optimisation : Il existe une marge d'amélioration dans l'optimisation des performances lors du traitement de données à grande échelle
Complétude de la documentation : En tant qu'outil nouveau, il nécessite plus de cas d'utilisation et de documentation