Performance of heavy-flavour jet identification in Lorentz-boosted topologies in proton-proton collisions at $\sqrt{s}$ = 13 TeV
CMS Collaboration
Measurements in the highly Lorentz-boosted regime provoke increased interest in probing the Higgs boson properties and in searching for particles beyond the standard model at the LHC. In the CMS Collaboration, various boosted-object tagging algorithms, designed to identify hadronic jets originating from a massive particle decaying to $\mathrm{b\overline{b}}$ or $\mathrm{c\overline{c}}$, have been developed and deployed across a range of physics analyses. This paper highlights their performance on simulated events, and summarizes novel calibration techniques using proton-proton collision data collected at $\sqrt{s}$ = 13 TeV during the 2016$-$2018 LHC data-taking period. Three dedicated methods are used for the calibration in multijet events, leveraging either machine learning techniques, the presence of muons within energetic boosted jets, or the reconstruction of hadronically decaying high-energy Z bosons. The calibration results, obtained through a combination of these approaches, are presented and discussed.
academic
Prestazioni dell'identificazione di jet con sapore pesante in topologie Lorentz-potenziate in collisioni protone-protone a s = 13 TeV
Questo articolo esamina le prestazioni dell'identificazione di jet adronici con sapore pesante in topologie altamente Lorentz-potenziate, che rivestono importanza cruciale per l'esplorazione delle proprietà del bosone di Higgs e la ricerca di particelle oltre il Modello Standard presso l'LHC. La collaborazione CMS ha sviluppato molteplici algoritmi di etichettatura di oggetti potenziati per identificare jet adronici provenienti dal decadimento di particelle massive in bb o cc. L'articolo presenta in primo luogo le prestazioni di questi algoritmi su eventi simulati e riassume le nuove tecniche di calibrazione basate sui dati utilizzando collisioni protone-protone raccolte durante il funzionamento dell'LHC 2016-2018 a s = 13 TeV.
Topologie potenziate nella fisica ad alta energia: A scale di energia TeV, i prodotti di decadimento di particelle pesanti (quali il bosone di Higgs e particelle oltre il Modello Standard) possiedono alto momento trasverso, causando l'aggregazione dei loro prodotti di decadimento in un singolo jet di grande raggio
Importanza dell'etichettatura di jet con sapore pesante: L'identificazione accurata di jet bb e cc è cruciale per la ricerca di fisica di Higgs e per la ricerca di nuova fisica
Necessità di calibrazione: Esistono discrepanze tra l'efficienza di etichettatura nei dati simulati e nei dati reali, richiedendo metodi di calibrazione precisi basati sui dati
Valutazione Prestazionale Comprensiva: Primo confronto completo delle prestazioni di sette algoritmi di etichettatura di jet con sapore pesante sviluppati da CMS durante il Run 2
Metodi di Calibrazione Innovativi: Sviluppo di tre metodi di calibrazione indipendenti basati sui dati:
Metodo sfBDT (selezione di jet da scissione di gluone basata su apprendimento automatico)
Metodo di etichettatura μ (metodo che utilizza soft muoni all'interno del jet)
Metodo del bosone Z potenziato (metodo che utilizza il decadimento Z→bb)
Misurazione Precisa dei Fattori di Scala: Fornitura di fattori di correzione dell'efficienza ad alta precisione attraverso la combinazione di molteplici misurazioni mediante il metodo BLUE
Valutazione Sistematica delle Incertezze: Valutazione completa delle fonti di incertezza sistematica e dei loro effetti
Input: Caratteristiche fisiche di jet di grande raggio (jet AK8, R=0.8)
Output: Probabilità di classificazione dell'origine del jet (X→bb, X→cc, QCD, ecc.)
Obiettivo: Massimizzazione dell'efficienza del segnale e soppressione del fondo QCD multi-jet mantenendo la decorrelazione dalla massa
Architettura: Combinazione di strati di convoluzione 1D e unità ricorrenti controllate
Ingegneria delle Caratteristiche: Utilizzo della tecnica di propagazione della rilevanza per strati per la selezione delle caratteristiche
Decorrelazione dalla Massa: Implementazione attraverso ripesoramento per far corrispondere la distribuzione di massa dei jet di segnale a quella del fondo QCD
Architettura: Classificatore multi-classe basato su strati di convoluzione residua 1D
Addestramento Avversariale: Implementazione della decorrelazione dalla massa utilizzando una rete di predizione della massa come termine di penalità nella funzione di perdita
Idea Fondamentale: Utilizzo di BDT per selezionare jet da scissione di gluone bb/cc
come proxy simili ai jet di segnale
Innovazioni Chiave:
- Definizione di variabili N-subjettiness τ^h_31 a livello adronico
per distinguere segnale e fondo
- Procedura automatizzata per la determinazione della soglia di selezione sfBDT
- 81 diverse combinazioni di selezione per la valutazione dell'incertezza sistematica
Principio Fisico: I modi di decadimento semi-leptonici di adroni b(c)
producono soft muoni
Criteri di Selezione:
- Presenza di soft muone con pT > 5 GeV all'interno del jet
- τ21 < 0.3 (selezione di struttura di jet biforcuta)
- Isolamento relativo Irel > 0.15
Estrazione del Segnale: Estrazione del segnale Z→bb dal fondo QCD multi-jet
Strategia di Adattamento:
- Adattamento 2D (mPNet, pT)
- Modellazione del fondo QCD con funzione polinomiale
- Adattamento simultaneo delle regioni che passano e non passano
la selezione dell'etichettatore
ParticleNet-MD Mostra Prestazioni Ottimali: Raggiunge le migliori prestazioni sia nei compiti di etichettatura X→bb che X→cc
Reti Neurali Superiori ai Metodi Tradizionali: I metodi di apprendimento profondo mostrano significativi miglioramenti rispetto ai metodi tradizionali basati su BDT
Efficacia dei Metodi di Calibrazione: I tre metodi indipendenti forniscono misurazioni coerenti dei fattori di scala
Decorrelazione dalla Massa Implementata con Successo: Tutti gli algoritmi moderni implementano con successo la decorrelazione dalla massa del jet
Comprensione Teorica Limitata: Manca una comprensione fisica approfondita del perché alcuni metodi funzionano meglio
Discussione Insufficiente dell'Efficienza Computazionale: Discussione inadeguata dei compromessi di costo computazionale tra diversi algoritmi
Valutazione Limitata della Capacità di Generalizzazione: Valutazione limitata della capacità di generalizzazione degli algoritmi in diversi processi fisici
Limitazioni Statistiche: Alcune misurazioni sono limitate dalla precisione statistica
L'articolo cita 72 importanti riferimenti bibliografici, che coprono:
Letteratura tecnica del rivelatore CMS
Storia dello sviluppo degli algoritmi di etichettatura di jet
Applicazioni dell'apprendimento profondo nella fisica ad alta energia
Metodi statistici e gestione dell'incertezza
Risultati di analisi fisiche correlate
Valutazione Complessiva: Questo è un articolo di fisica sperimentale di alta qualità che rappresenta il livello più alto attuale della tecnologia di etichettatura di jet nella fisica delle particelle sperimentale. L'articolo non solo fornisce importanti strumenti tecnici, ma pone anche una base solida per lo sviluppo futuro di algoritmi e analisi fisiche. L'innovazione metodologica e la valutazione sistematica delle prestazioni hanno un valore significativo per l'intera comunità della fisica ad alta energia.