StatTestCalculator: A New General Tool for Statistical Analysis in High Energy Physics
Abasov, Dudko, Gorin et al.
We present StatTestCalculator (STC), a new open-source statistical analysis tool designed for analysis high energy physics experiments. STC provides both asymptotic calculations and Monte Carlo simulations for computing the exact statistical significance of a discovery or for setting upper limits on signal model parameters. We review the underlying statistical formalism, including profile likelihood ratio test statistics for discovery and exclusion hypotheses, and the asymptotic distributions that allow quick significance estimates. We explain the relevant formulas for the likelihood functions, test statistic distributions, and significance metrics (both with and without incorporating systematic uncertainties). The implementation and capabilities of STC are described, and we validate its performance against the widely-used CMS Combine tool. We find excellent agreement in both the expected discovery significances and upper limit calculations. STC is a flexible framework that can accommodate systematic uncertainties and user-defined statistical models, making it suitable for a broad range of analyses.
academic
StatTestCalculator: Un Nuovo Strumento Generale per l'Analisi Statistica nella Fisica delle Alte Energie
Titolo: StatTestCalculator: A New General Tool for Statistical Analysis in High Energy Physics
Autori: E. Abasov, L.V. Dudko, D.E. Gorin, O.S. Vasilevskii (Facoltà di Fisica dell'Università Statale di Mosca, Istituto di Ricerca Nucleare Skobeltsyn)
Classificazione: hep-ph (Fisica delle alte energie - Fenomenologia), stat.CO (Statistica - Computazionale)
Data di Pubblicazione/Conferenza: Moscow University Physics Bulletin 80(8), 2025; XXV International Workshop-School High Energy Physics and Quantum Field Theory
Questo articolo introduce StatTestCalculator (STC), un nuovo strumento open-source per l'analisi statistica appositamente progettato per l'analisi sperimentale nella fisica delle alte energie. STC fornisce due metodologie di calcolo - formule asintotiche e simulazioni Monte Carlo - per calcolare la significatività statistica precisa di una scoperta o per stabilire limiti superiori sui parametri del modello di segnale. L'articolo esamina il formalismo statistico sottostante, incluso il test del rapporto di verosimiglianza profilato per le ipotesi di scoperta e esclusione, nonché le distribuzioni asintotiche che consentono stime rapide della significatività. Gli autori spiegano in dettaglio le formule rilevanti per la funzione di verosimiglianza, la distribuzione della statistica di test e le misure di significatività, sia con che senza incertezze sistematiche. L'articolo descrive l'implementazione e le funzionalità di STC e valida le sue prestazioni attraverso un confronto estensivo con lo strumento CMS Combine ampiamente utilizzato, dimostrando un'eccellente coerenza sia nei calcoli della significatività di scoperta attesa che nei calcoli dei limiti superiori.
Gli esperimenti di fisica delle alte energie (HEP) si affidano all'analisi statistica dei dati osservati per trarre conclusioni su fenomeni nuovi. Poiché i risultati degli esperimenti di collisione sono intrinsecamente probabilistici, sono necessari metodi statistici rigorosi per stimare i parametri e valutare la significatività di potenziali scoperte.
Sebbene esistano numerosi strumenti statistici sofisticati per l'analisi HEP, come:
Framework RooFit e RooStats
Strumento CMS Combine
Theta
HistFactory
questi strumenti sono generalmente progettati per analisi complesse su larga scala e mancano di uno strumento leggero che fornisca calcoli statistici veloci e accurati per una varietà di scenari comuni.
Sviluppo del nuovo strumento di analisi statistica STC: strumento open-source leggero basato su Python, specificamente progettato per l'analisi statistica HEP
Fornitura di metodologie di calcolo duali: supporto sia per formule asintotiche (approssimazioni in forma chiusa) che per calcoli esatti mediante simulazioni Monte Carlo
Gestione completa delle incertezze sistematiche: supporto per distribuzioni normali, lognormali o definite dall'utente degli effetti sistematici
Validazione dell'accuratezza dello strumento: confronto estensivo con lo strumento CMS Combine, dimostrando un'eccellente coerenza
Fornitura di un framework matematico esteso: generalizzazione delle formule dall'analisi a singolo bin all'analisi di forma multi-bin
Per un esperimento di conteggio con N regioni di segnale, i conteggi osservati nᵢ si assume seguano una distribuzione di Poisson: nᵢ ~ Poisson(μsᵢ + κᵢbᵢ)
Efficacia dello Strumento: STC implementa con successo funzionalità di analisi statistica accurata, mostrando un'eccellente coerenza con lo strumento standard Combine
Completezza del Metodo: fornisce un framework statistico completo dagli esperimenti di conteggio semplici all'analisi di forma complessa
Valore Pratico: il design leggero lo rende adatto per analisi rapide e scopi educativi
Estensibilità: il design modulare supporta personalizzazioni e estensioni metodologiche dell'utente
Limitazioni di Complessità: sebbene supporti analisi multi-bin, potrebbe non essere altrettanto efficace quanto strumenti specializzati per modelli statistici estremamente complessi
Spazio di Ottimizzazione: le prestazioni nel trattamento di dati su larga scala hanno ancora margini di miglioramento
Completezza della Documentazione: come nuovo strumento, richiede più casi d'uso e documentazione