Performance of heavy-flavour jet identification in Lorentz-boosted topologies in proton-proton collisions at $\sqrt{s}$ = 13 TeV
CMS Collaboration
Measurements in the highly Lorentz-boosted regime provoke increased interest in probing the Higgs boson properties and in searching for particles beyond the standard model at the LHC. In the CMS Collaboration, various boosted-object tagging algorithms, designed to identify hadronic jets originating from a massive particle decaying to $\mathrm{b\overline{b}}$ or $\mathrm{c\overline{c}}$, have been developed and deployed across a range of physics analyses. This paper highlights their performance on simulated events, and summarizes novel calibration techniques using proton-proton collision data collected at $\sqrt{s}$ = 13 TeV during the 2016$-$2018 LHC data-taking period. Three dedicated methods are used for the calibration in multijet events, leveraging either machine learning techniques, the presence of muons within energetic boosted jets, or the reconstruction of hadronically decaying high-energy Z bosons. The calibration results, obtained through a combination of these approaches, are presented and discussed.
academic
Performance de l'identification des jets de saveur lourde dans les topologies de Lorentz amplifiées dans les collisions proton-proton à s = 13 TeV
Titre: Performance de l'identification des jets de saveur lourde dans les topologies de Lorentz amplifiées dans les collisions proton-proton à s = 13 TeV
Auteurs: Collaboration CMS
Classification: physics.ins-det hep-ex
Date de publication: 14 octobre 2025
Journal: Journal of Instrumentation (en cours de soumission)
Cet article étudie la performance de l'identification des jets hadroniques de saveur lourde dans les topologies hautement amplifiées par Lorentz, ce qui est crucial pour explorer les propriétés du boson de Higgs et rechercher des particules au-delà du Modèle standard au LHC. La collaboration CMS a développé plusieurs algorithmes de marquage d'objets améliorés pour identifier les jets hadroniques provenant de la désintégration de particules massives en bb ou cc. L'article met l'accent sur la performance de ces algorithmes dans les événements simulés et résume les nouvelles techniques d'étalonnage basées sur les données utilisant les collisions proton-proton collectées à s = 13 TeV pendant les périodes d'exploitation du LHC 2016-2018.
Topologies amplifiées en physique des hautes énergies: À l'échelle du TeV, les produits de désintégration des particules lourdes (tels que le boson de Higgs et les particules au-delà du Modèle standard) possèdent une impulsion élevée, ce qui entraîne l'agrégation de leurs produits de désintégration dans un seul jet de grand rayon
Importance du marquage des jets de saveur lourde: L'identification précise des jets bb et cc est cruciale pour la recherche en physique du Higgs et la recherche de nouvelle physique
Besoins d'étalonnage: Il existe des différences entre l'efficacité du marquage des jets dans les événements simulés et les données réelles, nécessitant des méthodes d'étalonnage précises basées sur les données
Évaluation complète des performances: Première comparaison exhaustive des performances de sept algorithmes de marquage des jets de saveur lourde développés par CMS pendant Run 2
Méthodes d'étalonnage innovantes: Développement de trois méthodes d'étalonnage indépendantes basées sur les données:
Méthode sfBDT (sélection de jets de division de gluon basée sur l'apprentissage automatique)
Méthode de marquage μ (utilisant les muons mous intra-jets)
Méthode du boson Z amplifié (utilisant la désintégration Z→bb)
Mesure précise des facteurs d'échelle: Fourniture de facteurs de correction d'efficacité de haute précision par combinaison de plusieurs mesures via la méthode BLUE
Évaluation complète des incertitudes systématiques: Évaluation systématique des sources d'incertitude systématique et de leurs impacts
Entrées: Caractéristiques physiques des jets de grand rayon (jets AK8, R=0,8)
Sorties: Probabilités de classification de l'origine du jet (X→bb, X→cc, QCD, etc.)
Objectif: Maximiser l'efficacité du signal tout en supprimant le bruit de fond multi-jets QCD, en maintenant la décorrélation de masse
Architecture: Classificateur multi-classe basé sur des couches de convolution résiduelle 1D
Entraînement antagoniste: Utilisation d'un réseau de prédiction de masse comme terme de pénalité dans la fonction de perte pour la décorrélation de masse
Idée centrale: Utilisation du BDT pour sélectionner les jets de division de gluon bb/cc
comme proxy similaires aux jets de signal
Innovations clés:
- Définition de la variable N-substructure τ^h_31 au niveau hadronique
pour distinguer le signal du bruit de fond
- Procédure automatisée de détermination du seuil de sélection sfBDT
- 81 combinaisons de sélection différentes pour l'évaluation
des incertitudes systématiques
Principe physique: Les modes de désintégration semi-leptonique des hadrons b(c)
produisent des muons mous
Critères de sélection:
- Présence d'un muon mou avec pT > 5 GeV dans le jet
- τ21 < 0,3 (sélection de la structure de bifurcation double)
- Isolement relatif Irel > 0,15
Extraction du signal: Extraction du signal Z→bb du bruit de fond multi-jets QCD
Stratégie d'ajustement:
- Ajustement 2D (mPNet, pT)
- Modélisation du bruit de fond QCD par fonction polynomiale
- Ajustement simultané des régions passant et ne passant pas
la sélection du marqueur
ParticleNet-MD offre les meilleures performances: Atteint les meilleures performances pour les tâches de marquage X→bb et X→cc
Les réseaux de neurones surpassent les méthodes traditionnelles: Les méthodes d'apprentissage profond surpassent significativement les méthodes traditionnelles basées sur BDT
Efficacité des méthodes d'étalonnage: Les trois méthodes indépendantes fournissent des mesures cohérentes des facteurs d'échelle
Décorrélation de masse réussie: Tous les algorithmes modernes réalisent avec succès la décorrélation avec la masse du jet
Compréhension théorique limitée: Manque de compréhension physique approfondie sur les raisons pour lesquelles certaines méthodes fonctionnent mieux
Discussion insuffisante sur l'efficacité computationnelle: Compromis insuffisamment discutés entre les coûts computationnels des différents algorithmes
Évaluation limitée de la capacité de généralisation: Évaluation limitée de la capacité de généralisation des algorithmes à différents processus physiques
Limitations statistiques: Certains points de mesure sont limités par la précision statistique
Variable τ^h_31 au niveau hadronique: Première utilisation de la N-substructure basée sur les hadrons de première génération pour distinguer le signal du bruit de fond
Sélection de seuil automatisée: Développement d'un algorithme pour déterminer automatiquement la sélection sfBDT optimale
Stratégie de sélection multiple: Quantification de l'incertitude systématique dépendante de la sélection par 81 combinaisons de sélection
L'article cite 72 références importantes couvrant:
Documentation technique du détecteur CMS
Historique du développement des algorithmes de marquage des jets
Applications de l'apprentissage profond en physique des hautes énergies
Méthodes statistiques et traitement des incertitudes
Résultats d'analyses physiques connexes
Évaluation globale: Cet article est un travail de physique expérimentale de haute qualité, représentant le niveau le plus élevé actuel de la technologie de marquage des jets en physique des particules expérimentale. L'article fournit non seulement des outils techniques importants, mais pose également une base solide pour le développement futur des algorithmes et les analyses physiques. Ses innovations méthodologiques et son évaluation systématique des performances ont une valeur importante pour l'ensemble de la communauté de la physique des hautes énergies.