2025-11-24T19:49:17.532907

Performance of heavy-flavour jet identification in Lorentz-boosted topologies in proton-proton collisions at $\sqrt{s}$ = 13 TeV

CMS Collaboration
Measurements in the highly Lorentz-boosted regime provoke increased interest in probing the Higgs boson properties and in searching for particles beyond the standard model at the LHC. In the CMS Collaboration, various boosted-object tagging algorithms, designed to identify hadronic jets originating from a massive particle decaying to $\mathrm{b\overline{b}}$ or $\mathrm{c\overline{c}}$, have been developed and deployed across a range of physics analyses. This paper highlights their performance on simulated events, and summarizes novel calibration techniques using proton-proton collision data collected at $\sqrt{s}$ = 13 TeV during the 2016$-$2018 LHC data-taking period. Three dedicated methods are used for the calibration in multijet events, leveraging either machine learning techniques, the presence of muons within energetic boosted jets, or the reconstruction of hadronically decaying high-energy Z bosons. The calibration results, obtained through a combination of these approaches, are presented and discussed.
academic

أداء تحديد الجسيمات الثقيلة النكهة في الطوبولوجيات المعززة بلورنتز في تصادمات البروتون-البروتون عند s\sqrt{s} = 13 TeV

المعلومات الأساسية

  • معرّف الورقة: 2510.10228
  • العنوان: أداء تحديد الجسيمات الثقيلة النكهة في الطوبولوجيات المعززة بلورنتز في تصادمات البروتون-البروتون عند s\sqrt{s} = 13 TeV
  • المؤلفون: تعاون CMS
  • التصنيف: physics.ins-det hep-ex
  • تاريخ النشر: 14 أكتوبر 2025
  • المجلة: مجلة الأجهزة (قيد الإرسال)
  • رابط الورقة: https://arxiv.org/abs/2510.10228

الملخص

تدرس هذه الورقة أداء تحديد جسيمات النكهة الثقيلة في الطوبولوجيات المعززة بشدة بلورنتز، وهو أمر ذو أهمية حاسمة لاستكشاف خصائص بوزون هيغز والبحث عن جسيمات تتجاوز النموذج القياسي في مصادم الهادرونات الكبير. طورت مجموعة CMS عدة خوارزميات تحسين الكائنات لتحديد جسيمات الهادرون الناشئة من تحلل الجسيمات الضخمة إلى bb\mathrm{b\overline{b}} أو cc\mathrm{c\overline{c}}. تركز الورقة على عرض أداء هذه الخوارزميات في الأحداث المحاكاة، وتلخص تقنيات المعايرة المبتكرة باستخدام بيانات تصادمات البروتون-البروتون المجمعة خلال فترة تشغيل مصادم الهادرونات الكبير 2016-2018 عند s\sqrt{s} = 13 TeV.

السياق البحثي والدافع

الخلفية الفيزيائية

  1. الطوبولوجيات المعززة في فيزياء الطاقة العالية: عند مقياس TeV، تمتلك منتجات تحلل الجسيمات الثقيلة (مثل بوزون هيغز وجسيمات تتجاوز النموذج القياسي) زخماً عالياً، مما يؤدي إلى تجميع منتجات التحلل في جسيم هادروني واحد بنصف قطر كبير
  2. أهمية تحديد جسيمات النكهة الثقيلة: يعتبر التحديد الدقيق لجسيمات bb\mathrm{b\overline{b}} و cc\mathrm{c\overline{c}} حاسماً لأبحاث فيزياء هيغز والبحث عن فيزياء جديدة
  3. متطلبات المعايرة: توجد اختلافات بين كفاءة تحديد الجسيمات في الأحداث المحاكاة والبيانات الفعلية، مما يتطلب طرق معايرة دقيقة مدفوعة بالبيانات

الدافع البحثي

  1. القياسات الدقيقة للنموذج القياسي: القياس الدقيق لتحلل بوزون هيغز إلى كواركات النكهة الثقيلة
  2. البحث عن فيزياء جديدة: البحث عن حالات رنين جديدة تتحلل إلى أزواج من كواركات النكهة الثقيلة
  3. تحسين أداء الكاشف: تحسين إعادة بناء الكائنات الفيزيائية في كاشف CMS في الطوبولوجيات المعززة

المساهمات الأساسية

  1. تقييم الأداء الشامل: أول مقارنة شاملة لأداء سبع خوارزميات لتحديد جسيمات النكهة الثقيلة طورتها CMS خلال المرحلة الثانية
  2. طرق معايرة مبتكرة: تطوير ثلاث طرق معايرة مستقلة مدفوعة بالبيانات:
    • طريقة sfBDT (اختيار جسيمات انقسام الغلوون بناءً على التعلم الآلي)
    • طريقة تحديد μ (الطريقة باستخدام الميونات الناعمة داخل الجسيم)
    • طريقة بوزون Z المعزز (الطريقة باستخدام تحلل Z→bb)
  3. قياس عوامل التحجيم الدقيقة: توفير عوامل تصحيح الكفاءة عالية الدقة من خلال دمج عدة قياسات باستخدام طريقة BLUE
  4. تقييم شامل للشكوك المنهجية: تقييم شامل لمصادر الشكوك المنهجية المختلفة وتأثيراتها

شرح الطرق

تعريف المهمة

المدخلات: الخصائص الفيزيائية لجسيمات نصف قطر كبير (جسيمات AK8، R=0.8) المخرجات: احتمالية تصنيف مصدر الجسيم (X→bb, X→cc, QCD وغيرها) الهدف: تعظيم كفاءة الإشارة وقمع خلفية QCD متعددة الجسيمات مع الحفاظ على عدم الارتباط بالكتلة

معمارية خوارزميات التحديد

1. ParticleNet-MD

  • المعمارية: معالجة الميزات على مستوى الجسيمات بناءً على الشبكات العصبية الرسومية
  • المدخلات: مرشحات تدفق الجسيمات والميزات الحركية والهندسية للرؤوس الثانوية
  • نقطة الابتكار: عمليات الالتفاف غير المتغيرة للتبديل، مع استخراج الميزات المحلية في فضاء η-φ
  • المخرجات: درجات احتمالية غير مرتبطة بالكتلة

2. DeepDoubleX

  • المعمارية: دمج طبقات الالتفاف أحادية البعد والوحدات المتكررة المحكومة
  • هندسة الميزات: استخدام تقنية انتشار الصلة ذات الصلة الهرمية لاختيار الميزات
  • عدم الارتباط بالكتلة: تحقيق عدم الارتباط بالكتلة من خلال إعادة الترجيح لمطابقة توزيع كتلة جسيمات الإشارة مع خلفية QCD

3. DeepAK8-MD

  • المعمارية: مصنف متعدد الفئات بناءً على طبقات الالتفاف المتبقية أحادية البعد
  • التدريب المعاكس: تحقيق عدم الارتباط بالكتلة باستخدام شبكة التنبؤ بالكتلة كحد عقوبة في دالة الخسارة

4. محدد Double-b

  • المعمارية: بناءً على أشجار القرار المعززة (BDT)
  • الميزات: متغيرات البناء على مستوى عالي للمسارات والرؤوس الثانوية

طرق المعايرة

1. طريقة sfBDT

الفكرة الأساسية: استخدام BDT لاختيار جسيمات انقسام الغلوون bb/cc 
التي تشبه جسيمات الإشارة كبديل

الابتكارات الرئيسية:
- تعريف متغير N-subjettiness على مستوى الهادرون τ^h_31 
  لتمييز الإشارة والخلفية
- إجراء آلي لتحديد عتبة اختيار sfBDT الأمثل
- 81 مجموعة اختيار مختلفة لتقييم الشكوك المنهجية

2. طريقة تحديد μ

المبدأ الفيزيائي: أنماط التحلل شبه الخفيفة للهادرونات b(c) 
تنتج ميونات ناعمة

معايير الاختيار:
- وجود ميون ناعم مع pT > 5 GeV داخل الجسيم
- τ21 < 0.3 (اختيار بنية جسيم ثنائية الانقسام)
- درجة العزلة النسبية Irel > 0.15

3. طريقة بوزون Z المعزز

استخراج الإشارة: استخراج إشارة Z→bb من خلفية QCD متعددة الجسيمات

استراتيجية المطابقة:
- مطابقة ثنائية الأبعاد (mPNet, pT)
- نمذجة خلفية QCD باستخدام دوال متعددة الحدود
- مطابقة متزامنة للمناطق التي تمر وتفشل في اختيار المحدد

الإعداد التجريبي

مجموعات البيانات

  • البيانات التجريبية: بيانات تصادمات البروتون-البروتون المجمعة بواسطة CMS 2016-2018
    • 2016 pre-VFP: 19.5 fb⁻¹
    • 2016 post-VFP: 16.8 fb⁻¹
    • 2017: 41.5 fb⁻¹
    • 2018: 59.8 fb⁻¹
  • العينات المحاكاة:
    • عمليات QCD متعددة الجسيمات (MADGRAPH5 aMC@NLO)
    • عمليات V+jets (Z+jets, W+jets)
    • إنتاج بوزون هيغز (HJ-MINLO + PYTHIA)

مؤشرات التقييم

  • كفاءة الإشارة: نسبة جسيمات X→bb(cc) المحددة بشكل صحيح
  • معدل قمع الخلفية: نسبة جسيمات QCD المحددة بشكل خاطئ
  • عامل التحجيم (SF): نسبة الكفاءة بين البيانات والمحاكاة SF = ε_data/ε_sim
  • منحنى ROC: المقايضة بين كفاءة الإشارة وكفاءة الخلفية

تعريف نقاط التشغيل

تعرّف كل خوارزمية تحديد ثلاث نقاط تشغيل:

  • النقاء العالي (HP): كفاءة إشارة 40%(bb)/15%(cc)
  • النقاء المتوسط (MP): كفاءة إشارة 60%(bb)/30%(cc)
  • النقاء المنخفض (LP): كفاءة إشارة 80%(bb)/50%(cc)

النتائج التجريبية

مقارنة أداء الخوارزميات

الخوارزميةأداء X→bbأداء X→ccعدم الارتباط بالكتلة
ParticleNet-MDالأمثلالأمثلممتاز
DeepDoubleXجيدجيدجيد
DeepAK8-MDمتوسطمتوسطجيد
Double-bضعيف-متوسط

نتائج قياس عوامل التحجيم

ParticleNet-MD X→bb (بيانات 2018)

نطاق pT GeVHP WPMP WPLP WP
450-5000.95±0.080.98±0.061.02±0.05
500-6000.97±0.091.00±0.071.01±0.06
>6000.94±0.110.99±0.081.03±0.07

الاتساق بين الطرق

تحافظ نتائج الطرق الثلاث على الاتساق ضمن نطاق الشكوك:

  • طريقة sfBDT: عادة ما تعطي قيم SF أعلى
  • طريقة تحديد μ: قيم SF متوسطة، لكن مع شكوك أكبر
  • طريقة بوزون Z المعزز: محدودة بالقيود الإحصائية، أكبر شكوك

تحليل الشكوك المنهجية

مصادر الشكوك الرئيسية (على سبيل المثال ParticleNet-MD HP WP):

  1. الشكوك الإحصائية: ~6%
  2. اعتماد اختيار sfBDT: ~5%
  3. تأثيرات مخطط إعادة الترجيح: ~9%
  4. الشكوك النظرية (ISR/FSR): ~1-4%

الأعمال ذات الصلة

الطرق التقليدية

  • BDT بناءً على متغيرات عالية المستوى: استخدام متغيرات شكل الجسيم المصنوعة يدويًا
  • تحديد b بسيط: بناءً على معلومات الرؤوس الثانوية والمسارات

تطور طرق التعلم العميق

  1. DeepCSV/DeepJet: تحديد جسيمات AK4 بالتعلم العميق
  2. طرق CNN: معالجة الجسيمات كصور
  3. الشبكات العصبية الرسومية: معالجة مباشرة لمعلومات مستوى الجسيمات
  4. معمارية Transformer: تطبيق آليات الانتباه في تحديد الجسيمات

تطور طرق المعايرة

  • الطرق المبكرة: بناءً على اختيارات حركية بسيطة
  • مطابقة القوالب: استخدام أطياف الكتلة الثابتة لاستخراج الإشارة
  • المساعدة بالتعلم الآلي: استخدام طرق ML لتحسين اختيار الجسيمات البديلة

الاستنتاجات والمناقشة

الاستنتاجات الرئيسية

  1. ParticleNet-MD يحقق أفضل أداء: يحقق أفضل أداء في مهام تحديد X→bb و X→cc
  2. الشبكات العصبية تتفوق على الطرق التقليدية: تحقق طرق التعلم العميق تحسناً كبيراً مقارنة بطرق BDT التقليدية
  3. فعالية طرق المعايرة: توفر الطرق الثلاث المستقلة قياسات متسقة لعوامل التحجيم
  4. نجاح عدم الارتباط بالكتلة: تحقق جميع الخوارزميات الحديثة بنجاح عدم الارتباط مع كتلة الجسيم

القيود

  1. حدود الدقة الإحصائية: خاصة في مناطق pT العالية ونقاط التشغيل عالية النقاء
  2. الشكوك المنهجية: تنشأ بشكل أساسي من اعتماد النموذج على اختيار الجسيمات البديلة
  3. نطاق التطبيق: تنطبق نتائج المعايرة بشكل أساسي على الطوبولوجيات المعززة المماثلة
  4. التعقيد الحسابي: تتطلب طرق التعلم العميق تكاليف حسابية أعلى

الاتجاهات المستقبلية

  1. تحليل بيانات المرحلة الثالثة: الاستفادة من إحصائيات أكبر لتحسين دقة القياس
  2. استكشاف معماريات جديدة: معماريات الشبكات العصبية الجديدة مثل Transformer
  3. التحسين من طرف إلى طرف: تحسين السلسلة الكاملة من إشارة الكاشف إلى التحليل الفيزيائي
  4. التطبيقات في الوقت الفعلي: تنفيذ تحديد جسيمات متقدم في نظام التشغيل

التقييم المتعمق

المزايا

  1. شمولية عالية: أول مقارنة شاملة لجميع خوارزميات تحديد جسيمات النكهة الثقيلة الرئيسية في CMS
  2. ابتكار الطرق: توفر ثلاث طرق معايرة مستقلة تتحقق من بعضها البعض، مما يعزز موثوقية النتائج
  3. التقنية المتقدمة: تمثل أعلى مستوى حالي في تكنولوجيا تحديد الجسيمات
  4. القيمة العملية العالية: توفر أدوات معايرة مهمة لتحليلات فيزياء CMS
  5. تقييم شامل للشكوك: تقييم منهجي لمختلف مصادر الشكوك

أوجه القصور

  1. الفهم النظري المحدود: نقص الفهم العميق لسبب تفوق بعض الطرق على غيرها
  2. نقاش كفاءة الحساب: عدم كفاية النقاش حول المقايضات في التكاليف الحسابية بين الخوارزميات المختلفة
  3. تقييم القدرة على التعميم: تقييم محدود لقدرة الخوارزميات على التعميم عبر عمليات فيزيائية مختلفة
  4. القيود الإحصائية: تتأثر بعض نقاط القياس بقيود الدقة الإحصائية

التأثير

  1. التأثير الأكاديمي: وضع معايير جديدة لتكنولوجيا تحديد الجسيمات في تجارب فيزياء الطاقة العالية
  2. القيمة العملية: خدمة مباشرة لأبحاث فيزياء هيغز والبحث عن فيزياء جديدة
  3. نشر الطرق: يمكن تعميم الطرق على التجارب الأخرى وتحديد الكائنات الفيزيائية
  4. إمكانية التطبيق الصناعي: يمكن تطبيق تقنيات التعلم العميق على مشاكل الاعتراف بالأنماط الأخرى

السيناريوهات المطبقة

  1. أبحاث فيزياء هيغز: القياس الدقيق لقنوات التحلل H→bb و H→cc
  2. البحث عن فيزياء جديدة: البحث عن حالات رنين جديدة تتحلل إلى أزواج من كواركات النكهة الثقيلة
  3. القياسات الدقيقة: التحليلات التي تتطلب تحديداً دقيقاً لجسيمات النكهة الثقيلة
  4. أبحاث المنهجية: اختبار معايير الخوارزميات ومقارنة خوارزميات تحديد الجسيمات

نقاط الابتكار التقني

ابتكار طريقة sfBDT

  • متغير τ^h_31 على مستوى الهادرون: استخدام أول لـ N-subjettiness بناءً على الهادرونات من الجيل الأول لتمييز الإشارة والخلفية
  • اختيار عتبة آلي: تطوير خوارزمية لتحديد اختيار sfBDT الأمثل تلقائياً
  • استراتيجية اختيار متعددة: تحديد الشكوك المنهجية من خلال 81 مجموعة اختيار مختلفة

تقنية القياس المدمج

  • توسيع طريقة BLUE: توسيع طريقة أفضل تقدير خطي غير منحاز إلى المطابقة المتزامنة عبر نطاقات pT متعددة
  • معالجة الارتباطات: معالجة صحيحة للارتباطات في الشكوك المنهجية بين الطرق المختلفة
  • التحقق المتقاطع: توفر ثلاث طرق مستقلة تحققاً متقاطعاً قوياً

المراجع

تستشهد الورقة بـ 72 مرجعاً مهماً، تغطي:

  • أدبيات تقنية كاشف CMS
  • تاريخ تطور خوارزميات تحديد الجسيمات
  • تطبيقات التعلم العميق في فيزياء الطاقة العالية
  • الطرق الإحصائية ومعالجة الشكوك
  • نتائج التحليلات الفيزيائية ذات الصلة

التقييم الإجمالي: هذه ورقة عالية الجودة في الفيزياء التجريبية، تمثل أعلى مستوى حالي في تكنولوجيا تحديد الجسيمات في تجارب فيزياء الجسيمات. لا توفر الورقة أدوات تقنية مهمة فحسب، بل تضع أيضاً أساساً متيناً لتطور الخوارزميات والتحليلات الفيزيائية في المستقبل. تتمتع ابتكاراتها المنهجية وتقييمها المنهجي للأداء بقيمة مهمة لمجتمع فيزياء الطاقة العالية بأكمله.