StatTestCalculator: A New General Tool for Statistical Analysis in High Energy Physics
Abasov, Dudko, Gorin et al.
We present StatTestCalculator (STC), a new open-source statistical analysis tool designed for analysis high energy physics experiments. STC provides both asymptotic calculations and Monte Carlo simulations for computing the exact statistical significance of a discovery or for setting upper limits on signal model parameters. We review the underlying statistical formalism, including profile likelihood ratio test statistics for discovery and exclusion hypotheses, and the asymptotic distributions that allow quick significance estimates. We explain the relevant formulas for the likelihood functions, test statistic distributions, and significance metrics (both with and without incorporating systematic uncertainties). The implementation and capabilities of STC are described, and we validate its performance against the widely-used CMS Combine tool. We find excellent agreement in both the expected discovery significances and upper limit calculations. STC is a flexible framework that can accommodate systematic uncertainties and user-defined statistical models, making it suitable for a broad range of analyses.
academic
StatTestCalculator: Ein neues universelles Werkzeug für statistische Analysen in der Hochenergiephysik
Veröffentlichungszeit/Konferenz: Moscow University Physics Bulletin 80(8), 2025; The XXV International Workshop-School High Energy Physics and Quantum Field Theory
Dieses Papier stellt StatTestCalculator (STC) vor, ein neues Open-Source-Werkzeug für statistische Analysen, das speziell für die Analyse von Hochenergiephysik-Experimenten entwickelt wurde. STC bietet zwei Berechnungsmethoden – asymptotische Berechnungen und Monte-Carlo-Simulationen – zur Berechnung der genauen statistischen Signifikanz von Entdeckungen oder zur Festlegung von Obergrenzen für Signalmodellparameter. Das Papier überprüft die zugrunde liegende statistische Formalisierung, einschließlich des Profil-Likelihood-Verhältnis-Teststatistik für Entdeckungs- und Ausschlusshypothesen sowie asymptotischer Verteilungen, die schnelle Signifikanzschätzungen ermöglichen. Die Autoren erläutern detailliert die relevanten Formeln für Likelihood-Funktionen, Teststatistik-Verteilungen und Signifikanzmaße (mit und ohne systematische Unsicherheiten). Das Papier beschreibt die Implementierung und Funktionalität von STC und validiert seine Leistung durch einen Vergleich mit dem weit verbreiteten CMS-Combine-Werkzeug, wobei sowohl bei der erwarteten Entdeckungssignifikanz als auch bei der Obergrenzberechnung hervorragende Übereinstimmung gezeigt wird.
Hochenergiephysik-Experimente (HEP) sind auf statistische Analysen von Beobachtungsdaten angewiesen, um Schlussfolgerungen über neue Phänomene zu ziehen. Da die Ergebnisse von Collider-Experimenten von Natur aus probabilistisch sind, sind strenge statistische Methoden erforderlich, um Parameter zu schätzen und die Signifikanz potenzieller Entdeckungen zu bewerten.
Obwohl bereits viele komplexe statistische Werkzeuge für HEP-Analysen vorhanden sind, wie:
RooFit- und RooStats-Framework
CMS-Combine-Werkzeug
Theta
HistFactory
sind diese Werkzeuge typischerweise für komplexe großflächige Analysen konzipiert und es fehlt ein leichtgewichtiges Werkzeug, das schnelle und genaue allgemeine statistische Berechnungen für verschiedene häufige Szenarien bietet.
Entwicklung eines neuen statistischen Analysewerkzeugs STC: Leichtgewichtiges, Python-basiertes Open-Source-Werkzeug speziell für HEP-Statistikanalysen
Bereitstellung dualer Berechnungsmethoden: Unterstützung sowohl asymptotischer Formeln (geschlossene Näherungen) als auch exakter Monte-Carlo-Simulationen
Für ein Zählexperiment mit N Signalbereichen wird angenommen, dass die beobachteten Zählungen nᵢ einer Poisson-Verteilung folgen: nᵢ ~ Poisson(μsᵢ + κᵢbᵢ)
Werkzeugeffektivität: STC implementiert erfolgreich genaue statistische Analysefunktionen mit hervorragender Übereinstimmung mit dem Standard-Werkzeug Combine
Methodenvollständigkeit: Bietet einen vollständigen statistischen Rahmen von einfachen Zählexperimenten bis zu komplexen Formanalysen
Praktischer Wert: Das leichtgewichtige Design macht es für schnelle Analysen und Bildungszwecke geeignet
Erweiterbarkeit: Das modulare Design unterstützt benutzerdefinierte und Methodenerweiterungen
Komplexitätsgrenzen: Obwohl Multi-Bin-Analysen unterstützt werden, kann es bei extrem komplexen statistischen Modellen spezialisierteren Werkzeugen unterlegen sein
Optimierungsspielraum: Leistungsoptimierung bei der Verarbeitung großer Datenmengen hat Verbesserungspotenzial
Dokumentationsvollständigkeit: Als neues Werkzeug benötigt es mehr Anwendungsbeispiele und Dokumentation