2025-11-24T19:49:17.532907

Performance of heavy-flavour jet identification in Lorentz-boosted topologies in proton-proton collisions at $\sqrt{s}$ = 13 TeV

CMS Collaboration
Measurements in the highly Lorentz-boosted regime provoke increased interest in probing the Higgs boson properties and in searching for particles beyond the standard model at the LHC. In the CMS Collaboration, various boosted-object tagging algorithms, designed to identify hadronic jets originating from a massive particle decaying to $\mathrm{b\overline{b}}$ or $\mathrm{c\overline{c}}$, have been developed and deployed across a range of physics analyses. This paper highlights their performance on simulated events, and summarizes novel calibration techniques using proton-proton collision data collected at $\sqrt{s}$ = 13 TeV during the 2016$-$2018 LHC data-taking period. Three dedicated methods are used for the calibration in multijet events, leveraging either machine learning techniques, the presence of muons within energetic boosted jets, or the reconstruction of hadronically decaying high-energy Z bosons. The calibration results, obtained through a combination of these approaches, are presented and discussed.
academic

Lorentz-boosted topologies में heavy-flavour jet identification का प्रदर्शन प्रोटॉन-प्रोटॉन टकराव पर s\sqrt{s} = 13 TeV

मूल जानकारी

  • पेपर ID: 2510.10228
  • शीर्षक: Performance of heavy-flavour jet identification in Lorentz-boosted topologies in proton-proton collisions at s\sqrt{s} = 13 TeV
  • लेखक: CMS Collaboration
  • वर्गीकरण: physics.ins-det hep-ex
  • प्रकाशन समय: 14 अक्टूबर 2025
  • पत्रिका: Journal of Instrumentation (प्रस्तुत)
  • पेपर लिंक: https://arxiv.org/abs/2510.10228

सारांश

यह पेपर अत्यधिक Lorentz-boosted टोपोलॉजी में heavy-flavour हैड्रॉनिक जेट पहचान के प्रदर्शन का अध्ययन करता है, जो LHC पर हिग्स बोसॉन के गुणों की खोज और मानक मॉडल से परे कणों की खोज के लिए महत्वपूर्ण है। CMS सहयोग ने बड़े पैमाने पर कणों के bb\mathrm{b\overline{b}} या cc\mathrm{c\overline{c}} में क्षय से उत्पन्न हैड्रॉनिक जेट की पहचान के लिए कई उन्नत वस्तु टैगिंग एल्गोरिदम विकसित किए हैं। पेपर इन एल्गोरिदम के सिम्युलेटेड इवेंट में प्रदर्शन को प्रदर्शित करता है और 2016-2018 LHC रन अवधि के दौरान s\sqrt{s} = 13 TeV पर एकत्र किए गए प्रोटॉन-प्रोटॉन टकराव डेटा का उपयोग करके नई अंशांकन तकनीकों को सारांशित करता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

भौतिकी पृष्ठभूमि

  1. TeV ऊर्जा पैमाने पर boosted टोपोलॉजी: भारी कणों (जैसे हिग्स बोसॉन, मानक मॉडल से परे कण) के क्षय उत्पाद उच्च गति रखते हैं, जिससे उनके क्षय उत्पाद एक एकल बड़ी त्रिज्या जेट में एकत्रित होते हैं
  2. Heavy-flavour जेट टैगिंग की महत्ता: bb\mathrm{b\overline{b}} और cc\mathrm{c\overline{c}} जेट की सटीक पहचान हिग्स भौतिकी अनुसंधान और नई भौतिकी खोज के लिए महत्वपूर्ण है
  3. अंशांकन आवश्यकता: सिम्युलेटेड इवेंट में जेट टैगिंग दक्षता वास्तविक डेटा से भिन्न होती है, जिसके लिए सटीक डेटा-संचालित अंशांकन विधियों की आवश्यकता है

अनुसंधान प्रेरणा

  1. मानक मॉडल सटीक माप: हिग्स बोसॉन के heavy-flavour क्वार्क में क्षय का सटीक माप
  2. नई भौतिकी खोज: heavy-flavour क्वार्क जोड़ी में क्षय करने वाले नए अनुनाद अवस्थाओं की खोज
  3. डिटेक्टर प्रदर्शन अनुकूलन: boosted टोपोलॉजी में CMS डिटेक्टर के भौतिकी वस्तु पुनर्निर्माण प्रदर्शन में सुधार

मुख्य योगदान

  1. व्यापक प्रदर्शन मूल्यांकन: Run 2 के दौरान CMS द्वारा विकसित सात heavy-flavour जेट टैगिंग एल्गोरिदम के प्रदर्शन की पहली व्यापक तुलना
  2. नवीन अंशांकन विधियाँ: तीन स्वतंत्र डेटा-संचालित अंशांकन विधियों का विकास:
    • sfBDT विधि (मशीन लर्निंग-आधारित ग्लूऑन विभाजन जेट चयन)
    • μ टैगिंग विधि (जेट के अंदर नरम μ मेसॉन का उपयोग करने वाली विधि)
    • boosted Z बोसॉन विधि (Z→bb क्षय का उपयोग करने वाली विधि)
  3. सटीक स्केल फैक्टर माप: BLUE विधि के माध्यम से कई मापों को संयोजित करके उच्च सटीकता वाले दक्षता सुधार कारक प्रदान करता है
  4. व्यवस्थित अनिश्चितता मूल्यांकन: विभिन्न व्यवस्थित अनिश्चितता स्रोतों और उनके प्रभाव का व्यापक मूल्यांकन

विधि विवरण

कार्य परिभाषा

इनपुट: बड़ी त्रिज्या जेट (AK8 जेट, R=0.8) की भौतिकी विशेषताएं आउटपुट: जेट स्रोत वर्गीकरण संभावना (X→bb, X→cc, QCD आदि) लक्ष्य: द्रव्यमान de-correlation को बनाए रखते हुए संकेत दक्षता को अधिकतम करना और QCD बहु-जेट पृष्ठभूमि को दबाना

टैगिंग एल्गोरिदम आर्किटेक्चर

1. ParticleNet-MD

  • आर्किटेक्चर: ग्राफ न्यूरल नेटवर्क-आधारित कण-स्तरीय विशेषता प्रसंस्करण
  • इनपुट: कण प्रवाह उम्मीदवार और माध्यमिक शीर्ष की गतिविज्ञान और ज्यामितीय विशेषताएं
  • नवीन बिंदु: क्रमचय-अपरिवर्तनीय संवलन संचालन, η-φ स्थान में स्थानीय विशेषता निष्कर्षण
  • आउटपुट: द्रव्यमान de-correlated संभावना स्कोर

2. DeepDoubleX

  • आर्किटेक्चर: 1D संवलन परत और गेटेड पुनरावर्ती इकाई का संयोजन
  • विशेषता इंजीनियरिंग: विशेषता चयन के लिए परत-वार प्रासंगिकता प्रसार तकनीक का उपयोग
  • द्रव्यमान de-correlation: संकेत जेट को QCD पृष्ठभूमि के द्रव्यमान वितरण से मेल खाने के लिए पुनः भार देकर

3. DeepAK8-MD

  • आर्किटेक्चर: 1D अवशिष्ट संवलन परत पर आधारित बहु-वर्ग वर्गीकारक
  • प्रतिकूल प्रशिक्षण: द्रव्यमान de-correlation को लागू करने के लिए हानि फ़ंक्शन के दंड अवधि के रूप में द्रव्यमान भविष्यवाणी नेटवर्क का उपयोग

4. Double-b टैगर

  • आर्किटेक्चर: boosted निर्णय वृक्ष (BDT) पर आधारित
  • विशेषताएं: उच्च-स्तरीय ट्रैक और माध्यमिक शीर्ष निर्माण चर

अंशांकन विधियाँ

1. sfBDT विधि

मूल विचार: संकेत जेट के समान ग्लूऑन विभाजन bb/cc जेट को प्रॉक्सी के रूप में चुनने के लिए BDT का उपयोग

मुख्य नवीनता:
- हैड्रॉन-स्तरीय N-subjettiness चर τ^h_31 पर आधारित परिभाषा संकेत और पृष्ठभूमि को अलग करने के लिए
- स्वचालित sfBDT चयन थ्रेशोल्ड निर्धारण प्रक्रिया
- व्यवस्थित अनिश्चितता मूल्यांकन के लिए 81 विभिन्न चयन संयोजन

2. μ टैगिंग विधि

भौतिकी सिद्धांत: b(c) हैड्रॉन के अर्ध-हल्के क्षय मोड नरम μ मेसॉन उत्पन्न करते हैं
चयन मानदंड:
- जेट के अंदर pT > 5 GeV के साथ नरम μ मेसॉन
- τ21 < 0.3 (दोहरी-विभाजन जेट संरचना चुनने के लिए)
- सापेक्ष अलगाववाद Irel > 0.15

3. Boosted Z बोसॉन विधि

संकेत निष्कर्षण: QCD बहु-जेट पृष्ठभूमि से Z→bb संकेत शिखर निकालना
फिटिंग रणनीति:
- 2D फिटिंग (mPNet, pT)
- QCD पृष्ठभूमि बहुपद फ़ंक्शन द्वारा मॉडलिंग
- टैगर चयन पास और विफल दोनों क्षेत्रों को एक साथ फिटिंग

प्रायोगिक सेटअप

डेटासेट

  • प्रायोगिक डेटा: 2016-2018 में CMS द्वारा एकत्र प्रोटॉन-प्रोटॉन टकराव डेटा
    • 2016 pre-VFP: 19.5 fb⁻¹
    • 2016 post-VFP: 16.8 fb⁻¹
    • 2017: 41.5 fb⁻¹
    • 2018: 59.8 fb⁻¹
  • सिम्युलेटेड नमूने:
    • QCD बहु-जेट प्रक्रिया (MADGRAPH5 aMC@NLO)
    • V+jets प्रक्रिया (Z+jets, W+jets)
    • हिग्स बोसॉन उत्पादन (HJ-MINLO + PYTHIA)

मूल्यांकन मेट्रिक्स

  • संकेत दक्षता: X→bb(cc) जेट को सही तरीके से टैग करने का अनुपात
  • पृष्ठभूमि दमन दर: QCD जेट को गलत तरीके से टैग करने का अनुपात
  • स्केल फैक्टर (SF): डेटा और सिम्युलेशन दक्षता का अनुपात SF = ε_data/ε_sim
  • ROC वक्र: संकेत दक्षता बनाम पृष्ठभूमि दक्षता का व्यापार-बंद संबंध

कार्य बिंदु परिभाषा

प्रत्येक टैगिंग एल्गोरिदम तीन कार्य बिंदु परिभाषित करता है:

  • उच्च शुद्धता (HP): 40%(bb)/15%(cc) संकेत दक्षता
  • मध्यम शुद्धता (MP): 60%(bb)/30%(cc) संकेत दक्षता
  • निम्न शुद्धता (LP): 80%(bb)/50%(cc) संकेत दक्षता

प्रायोगिक परिणाम

एल्गोरिदम प्रदर्शन तुलना

एल्गोरिदमX→bb प्रदर्शनX→cc प्रदर्शनद्रव्यमान de-correlation
ParticleNet-MDइष्टतमइष्टतमउत्कृष्ट
DeepDoubleXअच्छाअच्छाअच्छा
DeepAK8-MDमध्यममध्यमअच्छा
Double-bकमजोर-मध्यम

स्केल फैक्टर माप परिणाम

ParticleNet-MD X→bb (2018 डेटा)

pT अंतराल GeVHP WPMP WPLP WP
450-5000.95±0.080.98±0.061.02±0.05
500-6000.97±0.091.00±0.071.01±0.06
>6000.94±0.110.99±0.081.03±0.07

विधि के बीच संगति

तीन अंशांकन विधियों के परिणाम अनिश्चितता सीमा के भीतर सुसंगत रहते हैं:

  • sfBDT विधि: आमतौर पर उच्च SF मान देता है
  • μ टैगिंग विधि: मध्यम SF मान, लेकिन बड़ी अनिश्चितता
  • Boosted Z बोसॉन विधि: सांख्यिकीय सीमा से प्रभावित, सबसे बड़ी अनिश्चितता

व्यवस्थित अनिश्चितता विघटन

मुख्य अनिश्चितता स्रोत (ParticleNet-MD HP WP के उदाहरण के रूप में):

  1. सांख्यिकीय अनिश्चितता: ~6%
  2. sfBDT चयन निर्भरता: ~5%
  3. पुनः भार देने की योजना प्रभाव: ~9%
  4. सैद्धांतिक अनिश्चितता (ISR/FSR): ~1-4%

संबंधित कार्य

पारंपरिक विधियाँ

  • उच्च-स्तरीय चर पर आधारित BDT: मानव-निर्मित जेट आकार चर का उपयोग
  • सरल b टैगिंग: माध्यमिक शीर्ष और ट्रैक जानकारी पर आधारित

गहन शिक्षा विधि विकास

  1. DeepCSV/DeepJet: AK4 जेट के लिए गहन शिक्षा टैगिंग
  2. CNN विधि: जेट को छवि के रूप में प्रसंस्करण
  3. ग्राफ न्यूरल नेटवर्क: कण-स्तरीय जानकारी का सीधे प्रसंस्करण
  4. Transformer आर्किटेक्चर: जेट टैगिंग में ध्यान तंत्र

अंशांकन विधि विकास

  • प्रारंभिक विधियाँ: सरल गतिविज्ञान चयन पर आधारित
  • टेम्पलेट फिटिंग: अपरिवर्तनीय द्रव्यमान स्पेक्ट्रम का उपयोग करके संकेत निष्कर्षण
  • मशीन लर्निंग सहायता: प्रॉक्सी जेट चयन में सुधार के लिए ML विधि का उपयोग

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. ParticleNet-MD सर्वोत्तम प्रदर्शन: X→bb और X→cc टैगिंग कार्य दोनों में सर्वोत्तम प्रदर्शन प्राप्त करता है
  2. तंत्रिका नेटवर्क पारंपरिक विधि से बेहतर: गहन शिक्षा विधि पारंपरिक BDT-आधारित विधि से काफी बेहतर है
  3. अंशांकन विधि प्रभावी: तीन स्वतंत्र विधियाँ सुसंगत स्केल फैक्टर माप प्रदान करती हैं
  4. द्रव्यमान de-correlation सफलतापूर्वक लागू: सभी आधुनिक एल्गोरिदम जेट द्रव्यमान के साथ de-correlation को सफलतापूर्वक लागू करते हैं

सीमाएं

  1. सांख्यिकीय सटीकता सीमा: विशेष रूप से उच्च pT क्षेत्र और उच्च शुद्धता कार्य बिंदु में
  2. व्यवस्थित अनिश्चितता: मुख्य रूप से प्रॉक्सी जेट चयन के मॉडल निर्भरता से
  3. प्रयोज्यता सीमा: अंशांकन परिणाम मुख्य रूप से समान boosted टोपोलॉजी पर लागू होते हैं
  4. कम्प्यूटेशनल जटिलता: गहन शिक्षा विधि की कम्प्यूटेशनल लागत अधिक है

भविष्य की दिशा

  1. Run 3 डेटा विश्लेषण: बड़े सांख्यिकीय मात्रा का उपयोग करके माप सटीकता में सुधार
  2. नई आर्किटेक्चर खोज: Transformer जैसी नई तंत्रिका नेटवर्क आर्किटेक्चर
  3. अंत-से-अंत अनुकूलन: डिटेक्टर संकेत से भौतिकी विश्लेषण तक पूर्ण-श्रृंखला अनुकूलन
  4. वास्तविक समय अनुप्रयोग: ट्रिगर सिस्टम में उच्च-स्तरीय जेट टैगिंग का कार्यान्वयन

गहन मूल्यांकन

शक्तियाँ

  1. व्यापकता: CMS के सभी मुख्य heavy-flavour जेट टैगिंग एल्गोरिदम की पहली व्यापक तुलना
  2. विधि नवीनता: तीन स्वतंत्र अंशांकन विधियाँ परस्पर सत्यापन प्रदान करती हैं, परिणाम विश्वसनीयता में सुधार
  3. तकनीकी उन्नति: वर्तमान जेट टैगिंग तकनीक के सर्वोच्च स्तर का प्रतिनिधित्व करता है
  4. उच्च व्यावहारिक मूल्य: CMS भौतिकी विश्लेषण के लिए महत्वपूर्ण अंशांकन उपकरण प्रदान करता है
  5. पूर्ण अनिश्चितता मूल्यांकन: विभिन्न अनिश्चितता स्रोतों का व्यवस्थित रूप से मूल्यांकन

कमियाँ

  1. सीमित सैद्धांतिक समझ: कुछ विधियों के बेहतर प्रदर्शन के कारणों की गहन भौतिकी समझ की कमी
  2. कम्प्यूटेशनल दक्षता चर्चा अपर्याप्त: विभिन्न एल्गोरिदम की कम्प्यूटेशनल लागत व्यापार-बंद पर पर्याप्त चर्चा नहीं
  3. सामान्यीकरण क्षमता मूल्यांकन सीमित: विभिन्न भौतिकी प्रक्रियाओं में एल्गोरिदम की सामान्यीकरण क्षमता का सीमित मूल्यांकन
  4. सांख्यिकीय सीमा: कुछ माप बिंदु सांख्यिकीय सटीकता सीमा से प्रभावित

प्रभाव

  1. शैक्षणिक प्रभाव: उच्च ऊर्जा भौतिकी प्रयोग में जेट टैगिंग तकनीक के लिए नया मानक स्थापित करता है
  2. व्यावहारिक मूल्य: हिग्स भौतिकी और नई भौतिकी खोज के लिए सीधे सेवा प्रदान करता है
  3. तकनीक प्रचार: विधि अन्य प्रयोगों और भौतिकी वस्तु पहचान के लिए सामान्यीकृत की जा सकती है
  4. औद्योगिक अनुप्रयोग संभावना: गहन शिक्षा तकनीक अन्य पैटर्न पहचान समस्याओं पर लागू की जा सकती है

प्रयोज्य परिदृश्य

  1. हिग्स भौतिकी अनुसंधान: H→bb, H→cc क्षय चैनल का सटीक माप
  2. नई भौतिकी खोज: heavy-flavour क्वार्क में क्षय करने वाले नए अनुनाद अवस्थाओं की खोज
  3. सटीक माप: उच्च सटीकता heavy-flavour जेट पहचान की आवश्यकता वाले विश्लेषण
  4. पद्धति अनुसंधान: जेट टैगिंग एल्गोरिदम के बेंचमार्क परीक्षण और तुलना

तकनीकी नवीनता हाइलाइट

sfBDT विधि की नवीनता

  • हैड्रॉन-स्तरीय τ^h_31 चर: संकेत और पृष्ठभूमि को अलग करने के लिए पहली पीढ़ी के हैड्रॉन पर आधारित N-subjettiness का पहली बार उपयोग
  • स्वचालित थ्रेशोल्ड चयन: इष्टतम sfBDT चयन निर्धारण के लिए स्वचालित एल्गोरिदम विकास
  • बहु-चयन रणनीति: चयन निर्भरता के व्यवस्थित अनिश्चितता को परिमाणित करने के लिए 81 चयन संयोजन

संयुक्त माप तकनीक

  • BLUE विधि विस्तार: सर्वोत्तम रैखिक निष्पक्ष अनुमान विधि को कई pT अंतराल के समवर्ती फिटिंग तक विस्तारित करता है
  • सहसंबंध प्रसंस्करण: विभिन्न विधियों के बीच व्यवस्थित अनिश्चितता सहसंबंध को सही तरीके से संभालता है
  • क्रॉस-सत्यापन: तीन स्वतंत्र विधियाँ मजबूत क्रॉस-सत्यापन प्रदान करती हैं

संदर्भ

पेपर 72 महत्वपूर्ण संदर्भों का हवाला देता है, जिसमें शामिल हैं:

  • CMS डिटेक्टर तकनीकी साहित्य
  • जेट टैगिंग एल्गोरिदम विकास इतिहास
  • उच्च ऊर्जा भौतिकी में गहन शिक्षा का अनुप्रयोग
  • सांख्यिकीय विधि और अनिश्चितता प्रसंस्करण
  • संबंधित भौतिकी विश्लेषण परिणाम

समग्र मूल्यांकन: यह एक उच्च-गुणवत्ता वाला प्रायोगिक भौतिकी पेपर है, जो वर्तमान कण भौतिकी प्रयोग में जेट टैगिंग तकनीक के सर्वोच्च स्तर का प्रतिनिधित्व करता है। पेपर न केवल महत्वपूर्ण तकनीकी उपकरण प्रदान करता है, बल्कि भविष्य के एल्गोरिदम विकास और भौतिकी विश्लेषण के लिए एक ठोस आधार भी स्थापित करता है। इसकी पद्धति नवीनता और प्रदर्शन का व्यवस्थित मूल्यांकन पूरे उच्च ऊर्जा भौतिकी समुदाय के लिए महत्वपूर्ण मूल्य रखता है।