NOvA is a long-baseline neutrino oscillation experiment that detects neutrino particles from the NuMI beam at Fermilab. Before data from this experiment can be used in analyses, raw hits in the detector must be matched to their source particles, and the type of each particle must be identified. This task has commonly been done using a mix of traditional clustering approaches and convolutional neural networks (CNNs). Due to the construction of the detector, the data is presented as two sparse 2D images: an XZ and a YZ view of the detector, rather than a 3D representation. We propose a point set neural network that operates on the sparse matrices with an operation that mixes information from both views. Our model uses less than 10% of the memory required using previous methods while achieving a 96.8% AUC score, a higher score than obtained when both views are processed independently (85.4%).
- معرّف الورقة: 2510.09659
- العنوان: Heterogeneous Point Set Transformers for Segmentation of Multiple View Particle Detectors
- المؤلفون: Edgar E. Robles, Dikshant Sagar, Alejandro Yankelevich, Jianming Bian, Pierre Baldi (جامعة كاليفورنيا، إيرفاين) بالتعاون مع فريق NOvA
- التصنيف: cs.LG (التعلم الآلي)، hep-ex (فيزياء الجزيئات العالية - التجريب)
- تاريخ النشر: 7 أكتوبر 2025 (نسخة أولية)
- رابط الورقة: https://arxiv.org/abs/2510.09659v1
NOvA هي تجربة تذبذب النيوترينو ذات الخط الأساسي الطويل، مصممة للكشف عن جزيئات النيوترينو من شعاع NuMI في مختبر فيرميلاب. قبل استخدام بيانات التجربة في التحليل، يجب مطابقة إشارات الضربات الخام في الكاشف مع جزيئاتها المصدرية، وتحديد نوع كل جزيء. تقليديًا، يتم إنجاز هذه المهمة من خلال مزيج من طرق التجميع التقليدية والشبكات العصبية الالتفافية (CNN). نظرًا لخصائص بناء الكاشف، يتم تقديم البيانات كصورتين متفرقتين ثنائي الأبعاد: عرض XZ وعرض YZ للكاشف، وليس كتمثيل ثلاثي الأبعاد. تقترح هذه الورقة شبكة عصبية لمجموعة النقاط تعمل على المصفوفات المتفرقة وتعالج البيانات من خلال عمليات تمزج معلومات العرضين. يستخدم النموذج أقل من 10% من ذاكرة الطرق السابقة، بينما يحقق درجة AUC بنسبة 96.8%، وهي أعلى من درجة 85.4% التي تم الحصول عليها عند معالجة العرضين بشكل مستقل.
المشكلة الأساسية التي يعالجها هذا البحث هي مهام تقسيم وتصنيف مسارات الجزيئات في تجربة NOvA للنيوترينو. وتشمل بشكل محدد:
- التقسيم على مستوى الحالات: مطابقة إشارات الضربات الخام في الكاشف مع جزيئاتها المصدرية المقابلة، وفصل مسارات الجزيئات المختلفة (prongs)
- التقسيم الدلالي: تحديد نوع كل جزيء (مثل الميون، الإلكترون، البروتون، الفوتون، الميزون π، إلخ)
- تجربة NOvA هي تجربة فيزياء نيوترينو مهمة تتطلب معالجة كميات كبيرة من البيانات المتفرقة
- التعرف الدقيق على الجزيئات وتقسيمها هو أساس التحليل الفيزيائي اللاحق
- الطرق التقليدية تواجه اختناقات في الموارد الحسابية والدقة
- طرق CNN التقليدية: تتطلب تحويل المصفوفات المتفرقة إلى مصفوفات كثيفة، مما يؤدي إلى استهلاك كبير للذاكرة
- معالجة العروض المستقلة: تعالج الطرق الموجودة عروض XZ و YZ من خلال شبكات CNN مستقلة، أو تعامل كل عرض كقناة صورة، مما يفشل في دمج معلومات العروض المختلفة بشكل فعال
- الكفاءة الحسابية: حتى عند استخدام عمليات الالتفاف المتفرقة مثل MinkowskiEngine، لا تزال هناك حاجة إلى تقريب الالتفاف لتوفير الذاكرة
البناء الفريد لكاشف NOvA يؤدي إلى أن البيانات لا يمكن تقديمها إلا في مستويين ثنائي الأبعاد، وليس كتمثيل ثلاثي الأبعاد كامل. الطرق الموجودة لم تستفد بشكل كافٍ من المعلومات المتكاملة عبر العروض، وتهدف هذه الورقة إلى تصميم معمارية شبكة عصبية يمكنها دمج معلومات متعددة العروض بشكل فعال.
- اقتراح محولات مجموعة النقاط غير المتجانسة (HPST): أول توسيع لمحولات مجموعة النقاط لمعالجة بيانات كاشفات الجزيئات متعددة العروض
- تصميم آلية انتباه غير متجانسة: تطبيق مبتكر لدمج المعلومات عبر العروض، مما يسمح بتدفق المعلومات بين العروض المختلفة
- تحسين كبير في الأداء والكفاءة:
- ارتفاع AUC من 85.4% إلى 96.8%
- تقليل استهلاك الذاكرة إلى أقل من 10% من الطريقة السابقة
- توفير إطار عمل تعلم متعدد المهام كامل: معالجة متزامنة لمهام التقسيم على مستوى الحالات والتقسيم الدلالي
بالنظر إلى مجموعة بيانات كاشف NOvA X، تحتوي على N عينة، حيث تمثل كل عينة X^(i) حدث كشف جزيء واحد. ينقسم كل حدث إلى M=2 عرض (XZ و YZ)، ويحتوي كل عرض X^(i,j) على عدد متغير من الكشوفات K^(i,j). يوصف كل كشف بإحداثيات x_k^(i,j) ∈ R^c وقيمة v_k^(i,j) ∈ R^d.
الأهداف:
- التقسيم على مستوى الحالات: تجميع نقاط الكشف في مسارات جزيئات مختلفة
- التقسيم الدلالي: تعيين تسميات نوع الجزيء لكل نقطة كشف
تعتمد HPST على بنية مشفر-فاك تشبه UNet:
- المشفر: n مرحلة، تحتوي كل مرحلة على m كتلة انتباه، متبوعة بعملية تجميع
- فاك: n مرحلة، تتبع كل مرحلة بعملية تجميع عكسي وتوصيلات قفزية
- أبعاد الميزات: تتضاعف تدريجيًا في مرحلة الترميز، وتنخفض تدريجيًا في مرحلة فك الترميز
الابتكار الأساسي يكمن في آلية الانتباه غير المتجانسة، والتي تشمل:
- الانتباه داخل العرض: آلية الانتباه الذاتي التقليدية، معالجة النقاط داخل نفس العرض
- الانتباه عبر العروض: المكون الرئيسي لدمج المعلومات عبر العروض
حساب الانتباه عبر العروض:
- الاستعلام: Q_k^(i,j'→j) استعلام النقطة k من العرض j' إلى العرض j
- المفاتيح والقيم: K_{k'}^(i,j'→j) و V_{k'}^(i,j'→j) المفاتيح والقيم المقابلة
- أوزان الانتباه: w_{kk'}^(i,j'→j) = Q_k^(i,j'→j)T K_{k'}^(i,j'→j)
- الإخراج: h'k^(i,j) = Σ{k'} softmax(w_{kk'}^(i,j'→j))V_{k'}^(i,j'→j)
- المسافة داخل العرض: d_(x_k^(i,j), x_{k'}^(i,j)) مسافة النقاط داخل نفس العرض
- المسافة عبر العروض: d_{jj'}(x_k^(i,j), x_{k'}^(i,j'}) مسافة النقاط بين العروض المختلفة
- بناء توصيلات الرسم البياني بناءً على k أقرب جار
- التجميع: طريقة تجميع الفوكسل، إنشاء شبكة داخل نفس العرض وحساب متوسط قيم النقاط داخل الشبكة
- فك التجميع: استخدام التوصيلات القفزية، أخذ عينات من النقاط إلى الإحداثيات السابقة
- دمج المعلومات عبر العروض: أول تطبيق فعال لآلية انتباه مجموعة النقاط متعددة العروض في مجال فيزياء الجزيئات
- معالجة فعالة للبيانات المتفرقة: العمل مباشرة على تمثيل السحابة النقطية، تجنب تحويل المصفوفات المتفرقة إلى كثيفة
- تعلم الميزات متعددة المقاييس: تحقيق خلط المعلومات من المحلي إلى العام من خلال معمارية UNet
- إطار عمل التحسين المشترك: معالجة موحدة لمهام التقسيم والتصنيف
- مصدر البيانات: بيانات محاكاة التفاعلات النيوترينية التي تم إنشاؤها بواسطة فريق التعاون NOvA
- حجم البيانات: 9,246,712 حدث
- خصائص البيانات:
- متوسط 70 نقطة ضربة لكل حدث
- حجم الصورة: 2×80×100
- توزيع بيانات متفرق جدًا
- أداء التصنيف:
- AUC (المساحة تحت المنحنى)
- OVR AUC (AUC الواحد مقابل الباقي)
- أداء التقسيم:
- الكفاءة (الاستدعاء): نسبة مسارات الجزيئات المكتشفة بشكل صحيح
- النقاء (الدقة): دقة مسارات التنبؤ
- دقة التقسيم
- الكفاءة الحسابية:
- استهلاك الذاكرة (MiB)
- وقت معالجة العينة الواحدة (ثانية)
- Mask R-CNN: شبكة عصبية التفافية قائمة على المناطق
- GAT (شبكات الانتباه البياني): شبكات الانتباه البياني
- HPST: محولات مجموعة النقاط غير المتجانسة المقترحة في هذه الورقة
- بيئة الأجهزة: Intel Xeon E5-2640 v4 @ 2.40GHz، 503G RAM، 4×NVIDIA Titan V
- البحث عن المعاملات الفائقة:
- عدد الجيران المتصلين: {4, 8}
- عدد مراحل الشبكة: {2, 3, 4}
- أبعاد التضمين: {128, 256, 512}
- معدل التعلم: 1e-4 إلى 1e-1
- إعدادات التدريب:
- البحث عن المعاملات الفائقة: 8 حقب، 1% من البيانات
- التدريب النهائي: 24 حقبة
| النموذج | استهلاك الذاكرة (MiB) | وقت العينة الواحدة (ثانية) | OVR AUC | دقة التقسيم |
|---|
| R-CNN | 282.4±37.43 | 265.33±2.01 | 0.732 | 0.343 |
| GAT | 29.8±0.40 | 1.74±0.001 | 0.854 | 0.659 |
| HPST | 34.7±1.00 | 7.05±0.001 | 0.968 | 0.835 |
النتائج الرئيسية:
- تتفوق HPST بشكل كبير على طرق الأساس في جميع مؤشرات الأداء
- بالمقارنة مع معالجة العرضين بشكل مستقل (85.4% AUC)، يرفع دمج HPST عبر العروض AUC إلى 96.8%
- استهلاك الذاكرة يمثل فقط حوالي 12% من Mask R-CNN
الكفاءة:
- الميون: 0.95 (الأفضل)
- الإلكترون: 0.93
- البروتون: 0.82
- الفوتون: 0.75
- ميزون π: 0.71 (الأكثر تحديًا)
النقاء:
- الميون: 0.90
- الإلكترون: 0.88
- البروتون: 0.78
- الفوتون: 0.72
- ميزون π: 0.69
التحليل: أنواع الجزيئات الرئيسية (الميون والإلكترون) تحقق أفضل نتائج التقسيم، بينما الجزيئات الثانوية أكثر تحديًا بسبب عدد نقاط الضربات القليل.
تعرض الورقة حدث تفاعل نيوترينو نموذجي، يتضمن:
- تجمع إلكترون رئيسي
- عدة جزيئات ثانوية
- مقارنة التنبؤات HPST مع التسميات الحقيقية توضح تأثيرًا تصنيفيًا جيدًا، مع التباس قليل فقط في الجزيئات الثانوية ذات نقاط الضربات القليلة جدًا
- الطرق التقليدية: خوارزميات التجميع مع الميزات اليدوية
- تطبيقات CNN:
- مصنف أحداث النيوترينو من قبل Aurisano وآخرين
- شبكة CNN الانحدار لإعادة بناء الطاقة من قبل Baldi وآخرين
- تحديد الجزيئات المحسّن بالسياق من قبل Psihas وآخرين
- الالتفاف المتفرق: أطر عمل مثل MinkowskiEngine
- طرق السحابة النقطية: تطبيقات Point Transformers في الرؤية ثلاثية الأبعاد
- الشبكات العصبية البيانية: GAT وغيرها على البيانات غير المنتظمة
تعتمد طرق NOvA الموجودة بشكل أساسي على معالجة CNN المستقلة أو دمج القنوات، وتطبق هذه الورقة لأول مرة آلية انتباه حقيقية عبر العروض.
- فعالية محولات مجموعة النقاط غير المتجانسة: نجحت HPST في حل مشكلة التقسيم والتصنيف لبيانات كاشفات الجزيئات متعددة العروض
- أهمية دمج المعلومات عبر العروض: بالمقارنة مع المعالجة المستقلة، يؤدي دمج المعلومات عبر العروض إلى تحسن أداء كبير
- تفوق الكفاءة الحسابية: مع تحسين الأداء، تقليل كبير في استهلاك الذاكرة
- الاعتماد على البيانات: قد تختفي مزايا الكفاءة للتمثيل المتفرق عندما تكون كثافة البيانات أعلى
- التعقيد الحسابي: قد يؤدي تعقيد عمليات مجموعة النقاط مع زيادة عدد النقاط إلى إبطاء الخوارزمية
- الخصوصية المجالية: تم تصميم الطريقة للبنية ثنائية العرض المحددة لتجربة NOvA
- التوسع إلى تجارب كاشفات جزيئات أخرى متعددة العروض
- استكشاف آليات انتباه عبر عروض أكثر تعقيدًا
- دمج المعرفة السابقة الفيزيائية لتحسين الأداء بشكل أكبر
- ابتكار قوي: أول تطبيق لآلية الانتباه غير المتجانسة في معالجة بيانات فيزياء الجزيئات
- قيمة عملية عالية: تحسن الأداء الكبير وتحسين الكفاءة ذو أهمية كبيرة للتجارب العملية
- تجارب شاملة: تجارب مقارنة شاملة وتحليل أداء مفصل
- كتابة واضحة: وصف دقيق للتفاصيل التقنية، رسوم توضيحية للمعمارية واضحة وسهلة الفهم
- تحليل نظري محدود: نقص التحليل النظري العميق لسبب فعالية الانتباه عبر العروض
- تجارب الاستئصال غير كافية: لم يتم تحليل مساهمات المكونات المختلفة (مثل تعريفات المسافة المختلفة، آليات الانتباه، إلخ) بشكل كافٍ
- التحقق من القابلية للتعميم: تم التحقق فقط على بيانات NOvA، مع نقص التحقق على مهام مماثلة أخرى
- القيمة الأكاديمية: توفير حل جديد لمعالجة البيانات المتفرقة متعددة العروض
- القيمة العملية: يمكن تطبيقها مباشرة على خط أنابيب معالجة البيانات في تجربة NOvA
- القيمة الإلهامية: توفير مرجع لمعالجة البيانات في تجارب فيزياء جزيئات أخرى
- معالجة بيانات كاشفات الجزيئات متعددة العروض
- إعادة بناء البيانات ثنائية الأبعاد متعددة العروض من البيانات ثلاثية الأبعاد المتفرقة
- مهام تحليل السحابة النقطية التي تتطلب دمج المعلومات عبر العروض
- معالجة البيانات العلمية الكبيرة الحجم مع موارد حسابية محدودة
تستشهد الورقة بأعمال مهمة في مجالات فيزياء الجزيئات والتعلم الآلي ورؤية الحاسوب، بما في ذلك التقارير التقنية ذات الصلة بتجربة NOvA، وتطبيقات التعلم العميق في العلوم، والأوراق الكلاسيكية في الشبكات العصبية البيانية وآليات الانتباه. من الجدير بالملاحظة بشكل خاص الاستشهادات بتقنيات ذات صلة مثل MinkowskiEngine و Mask R-CNN و Graph Attention Networks، مما يعكس فهم المؤلفين العميق لحالة المجال.