2025-11-18T21:19:13.596005

Optimised neural networks for online processing of ATLAS calorimeter data on FPGAs

Aad, Bertrand, Laatu et al.
A study of neural network architectures for the reconstruction of the energy deposited in the cells of the ATLAS liquid-argon calorimeters under high pile-up conditions expected at the HL-LHC is presented. These networks are designed to run on the FPGA-based readout hardware of the calorimeters under strict size and latency constraints. Several architectures, including Dense, Recurrent (RNN), and Convolutional (CNN) neural networks, are optimised using a Bayesian procedure that balances energy resolution against network size. The optimised Dense, CNN, and combined Dense+RNN architectures achieve a transverse energy resolution of approximately 80 MeV, outperforming both the optimal filtering (OF) method currently in use and RNNs of similar complexity. A detailed comparison across the full dynamic range shows that Dense, CNN, and Dense+RNN accurately reproduce the energy scale, while OF and RNNs underestimate the energy. Deep Evidential Regression is implemented within the Dense architecture to address the need for reliable per-event energy uncertainties. This approach provides predictive uncertainty estimates with minimal increase in network size. The predicted uncertainty is found to be consistent, on average, with the difference between the true deposited energy and the predicted energy.
academic

Réseaux de neurones optimisés pour le traitement en ligne des données du calorimètre ATLAS sur FPGAs

Informations de base

  • ID de l'article: 2510.11469
  • Titre: Optimised neural networks for online processing of ATLAS calorimeter data on FPGAs
  • Auteurs: Georges Aad, Raphaël Bertrand, Lauri Laatu, Emmanuel Monnier, Arno Straessner, Nairit Sur, Johann C. Voigt
  • Classification: physics.ins-det (Physique - Instrumentation et Détecteurs)
  • Date de publication: 13 octobre 2025
  • Lien de l'article: https://arxiv.org/abs/2510.11469v1

Résumé

Cette étude approfondit les architectures de réseaux de neurones pour la reconstruction de l'énergie déposée dans les cellules du calorimètre à argon liquide d'ATLAS dans les conditions d'empilement élevé attendues au Grand Collisionneur de hadrons de haute luminosité (HL-LHC). Ces réseaux sont conçus pour fonctionner sur le matériel de lecture basé sur FPGA du calorimètre sous des contraintes strictes de taille et de latence. Grâce à une procédure d'optimisation bayésienne, plusieurs architectures ont été optimisées, notamment les réseaux denses (Dense), les réseaux de neurones récurrents (RNN) et les réseaux de neurones convolutifs (CNN), en équilibrant la résolution énergétique et la taille du réseau. Les architectures Dense, CNN et la combinaison Dense+RNN optimisées ont atteint une résolution énergétique transverse d'environ 80 MeV, surpassant significativement la méthode du filtre optimal (OF) actuellement utilisée et les RNN de complexité similaire. Une comparaison détaillée sur l'ensemble de la plage dynamique montre que les architectures Dense, CNN et Dense+RNN reproduisent fidèlement l'échelle énergétique, tandis que OF et RNN sous-estiment l'énergie. De plus, une régression par preuve profonde a été implémentée dans l'architecture Dense pour satisfaire les exigences d'incertitude énergétique fiable par événement.

Contexte et motivation de la recherche

Contexte du problème

  1. Défis du HL-LHC: Le HL-LHC produira jusqu'à 200 collisions proton-proton simultanées après sa mise à niveau en 2026-2030, entraînant des problèmes graves d'empilement de signaux
  2. Contraintes matérielles: Le calorimètre à argon liquide d'ATLAS contient 182 468 cellules, générant des centaines de téraoctets de données par seconde, nécessitant des cartes électroniques spécialisées
  3. Exigences de latence: L'algorithme de reconstruction d'énergie doit être complété en 125 ns pour satisfaire les exigences de réponse rapide du système de déclenchement
  4. Limitations des méthodes existantes: L'algorithme de filtre optimal (OF) actuellement utilisé voit ses performances diminuer significativement dans les conditions d'empilement élevé

Motivation de la recherche

  • L'amélioration des capacités de traitement des FPGAs offre une opportunité unique de mettre en œuvre des algorithmes d'apprentissage automatique modernes aux premiers stades de la chaîne de traitement des données
  • Nécessité de développer de nouvelles méthodes fonctionnant sous des contraintes matérielles strictes et surpassant l'algorithme OF
  • Réaliser l'estimation de l'incertitude énergétique par événement pour améliorer la précision des étapes ultérieures d'acquisition et de reconstruction des données

Contributions principales

  1. Optimisation multi-architectures: Proposition et optimisation de quatre architectures de réseaux de neurones (Dense, RNN, CNN, Dense+RNN), atteignant le meilleur équilibre entre résolution énergétique et taille du réseau par optimisation bayésienne
  2. Fonction objectif avec contraintes matérielles: Conception d'une fonction objectif avec pénalité par étapes tenant compte du nombre d'unités MAC, contrôlant efficacement la taille du réseau
  3. Amélioration des performances: Les architectures optimales réalisent une résolution énergétique transverse d'environ 80 MeV, améliorant l'algorithme OF d'environ 8%
  4. Quantification de l'incertitude: Première implémentation de la régression par preuve profonde (DER) sous contraintes FPGA, fournissant une estimation de l'incertitude énergétique par événement
  5. Validation sur plage dynamique complète: Vérification de l'efficacité de la méthode et de la précision de l'échelle énergétique dans la plage 0-130 GeV

Détails méthodologiques

Définition de la tâche

Entrée: Séquence d'échantillons d'impulsions numérisées des cellules du calorimètre

  • 4 échantillons après le dépôt (à partir du croisement de faisceaux (BC) du dépôt d'énergie cible)
  • Jusqu'à 28 échantillons avant le dépôt (pour corriger les distorsions causées par les dépôts d'énergie antérieurs)

Sortie: Énergie transverse vraie ETtrueE_T^{true} au BC spécifique Contraintes: Taille du réseau < 500 unités MAC, latence < 125 ns

Architectures de modèles

1. Architecture CNN

  • Structure: Deux couches convolutives + couches d'entrée-sortie
  • Première couche: 5 filtres 1D parallèles, taille de noyau 7, glissant sur 25 échantillons d'entrée
  • Deuxième couche: 6 filtres 2D, taille de noyau 11×5, entrée 19×5
  • Couche de sortie: Filtre unique, taille de noyau 9×6
  • Avantages: Mode fenêtre glissante, réutilisation des calculs antérieurs, réduction de la latence

2. Architecture RNN

  • Structure: Séquence de 5 unités RNN + couche dense finale
  • Unités: Unités vanilla simples, dimension 8, activation ReLU
  • Caractéristiques: Calcul synchronisé avec l'arrivée des échantillons de données, partage de paramètres mais réutilisation limitée

3. Architecture Dense+RNN

  • Conception innovante: Couche dense traitant les échantillons avant le dépôt pour initialiser les unités RNN
  • Avantages: Conserve les avantages du RNN tout en réduisant le coût de calcul pour les longues séquences
  • Structure: Couche dense (avant dépôt) → Séquence RNN (après dépôt) → Couche dense finale

4. Architecture Dense par étapes

  • Conception en deux étapes:
    • Première étape: Correction de la distorsion d'impulsion par les échantillons avant dépôt
    • Deuxième étape: Combinaison avec les échantillons après dépôt pour capturer la forme d'impulsion
  • Optimisation de latence: La première étape peut être pré-calculée

Points d'innovation technique

1. Fonction objectif avec contraintes matérielles

f(M,σ) = {
  σ̃                           si M ≤ 500
  σ̃ + 0.3(M̃ - 0.3)          si M ∈ ]500; 850]
  σ̃ + 0.3(M̃ - 0.3) + e^(M̃-0.65) - 1  sinon
}
  • Mécanisme de pénalité par étapes garantissant que le réseau respecte les contraintes FPGA
  • Équilibre entre résolution énergétique et complexité de calcul

2. Régression par preuve profonde (DER)

  • Paramétrisation de distribution NIG: γ (valeur attendue), ν (variance cognitive), α, β (paramètres de variance aléatoire)
  • Décomposition de l'incertitude: Incertitude aléatoire + incertitude cognitive
  • Implémentation: Remplacement de la couche dense finale par une couche DenseNormalGamma

Configuration expérimentale

Ensemble de données

  • Outil de simulation: Suite d'outils AREUS
  • Ensemble d'entraînement: 1 million d'événements
  • Ensemble de validation: 1,5 million d'événements
  • Ensemble de test: 2,5 millions d'événements
  • Évaluation finale: 13 millions d'événements indépendants
  • Plage énergétique: Distribution uniforme 0-130 GeV (couvrant 80% de la plage dynamique de lecture à haut gain)
  • Conditions d'empilement: 200 collisions simultanées en moyenne (⟨μ⟩=200)

Métriques d'évaluation

  • Métrique principale: Résolution énergétique transverse σ(E_T^pred - E_T^true)
  • Échelle énergétique: ⟨E_T^pred - E_T^true⟩ vs E_T^true
  • Évaluation de l'incertitude: Distribution de tirage (E_T^pred - E_T^true)/δ_pred

Méthodes de comparaison

  • Ligne de base: Algorithme de filtre optimal (OF)
  • Comparaison entre réseaux: RNN, Dense, CNN, Dense+RNN

Détails d'implémentation

  • Framework: TensorFlow Keras
  • Optimisation: Optimisation bayésienne, 30-100 itérations
  • Modèle de substitution: Processus gaussien avec noyau Matérn 5/2
  • Fonction d'acquisition: Critère d'amélioration attendue

Résultats expérimentaux

Résultats principaux

Comparaison de la résolution énergétique

ArchitectureRésolution énergétique (MeV)Unités MACAmélioration relative OF
OF~90--
RNN~903680%
Dense~80240~11%
CNN~80419~11%
Dense+RNN~80392~11%

Précision de l'échelle énergétique

  • Dense, CNN, Dense+RNN: Reproduction fidèle de l'échelle énergétique, écart proche de zéro
  • OF: Sous-estimation systématique de l'énergie (attendue par conception, ne comprenant pas la composante d'empilement simultané moyen)
  • RNN: Légère sous-estimation aux basses énergies, écart augmentant aux hautes énergies

Études d'ablation

Importance des échantillons avant dépôt

  • Tous les réseaux optimisés (sauf RNN) utilisent > 20 échantillons avant dépôt
  • Démontre l'importance de capturer les distorsions causées par les dépôts d'énergie antérieurs
  • Le RNN est limité par le coût de calcul élevé pour les longues séquences

Optimisation de la taille du réseau

Le processus d'optimisation bayésienne montre:

  • Réduction significative de la taille du réseau après 10 évaluations aléatoires initiales
  • Récupération de la résolution énergétique et stabilisation de la taille du réseau après 20 évaluations
  • Améliorations mineures seulement lors des 100 évaluations suivantes

Analyse de l'incertitude DER

Caractéristiques de la distribution de tirage

  • Moyenne: -0,06 (proche de zéro, tendance légère à la surestimation)
  • Écart-type: 0,75 (surestimation légère de l'incertitude)
  • Globalement, l'estimation de l'incertitude est cohérente avec les écarts réels

Décomposition de l'incertitude

  • Incertitude cognitive: Dominante (72-79 MeV)
  • Incertitude aléatoire: Plus faible (30-42 MeV)
  • 99% des événements dans une bande étroite, indiquant une prédiction de modèle stable

Travaux connexes

Applications de réseaux de neurones sur FPGA

  • Croissance rapide des applications de réseaux de neurones FPGA dans les expériences du LHC
  • Cas de succès existants de remplacement d'algorithmes de déclenchement
  • Applications émergentes du traitement des données de détecteur brut

Reconstruction d'énergie du calorimètre

  • Dégradation des performances de l'algorithme OF traditionnel dans les conditions d'empilement élevé
  • Études antérieures limitées à la plage 0-5 GeV et à des simulations simplifiées
  • Ce travail s'étend à une plage dynamique plus grande et à des simulations plus réalistes

Quantification de l'incertitude

  • Coût de calcul élevé des réseaux de neurones bayésiens
  • DER fournit une méthode pratique d'estimation de l'incertitude
  • Première application sous contraintes FPGA

Conclusions et discussion

Conclusions principales

  1. Amélioration des performances: Les architectures Dense et CNN réalisent une amélioration de la résolution énergétique d'environ 8%
  2. Faisabilité matérielle: Tous les réseaux optimisés < 500 unités MAC, satisfaisant les contraintes FPGA
  3. Échelle énergétique: Les réseaux de neurones reproduisent fidèlement l'échelle énergétique sur toute la plage dynamique
  4. Incertitude: DER fournit avec succès une estimation de l'incertitude par événement

Limitations

  1. Cellule unique: L'étude est limitée à une seule cellule du calorimètre
  2. Déclenchement idéal: Hypothèse d'une détection d'événement de diffusion dure parfaite
  3. Haut gain: Considération uniquement de la configuration de lecture à haut gain
  4. Détection d'anomalies: L'estimation actuelle de l'incertitude a du mal à identifier les événements de reconstruction anormaux

Directions futures

  1. Extension multi-cellules: Extension au traitement conjoint de plusieurs cellules du calorimètre
  2. Intégration de déclenchement: Combinaison avec les fonctionnalités d'allocation de croisement de faisceaux
  3. Détection d'anomalies: Exploration du traitement des rafales de bruit et des structures de faisceaux non uniformes
  4. Optimisation d'architecture: Ensembles de données d'entraînement plus importants et architectures affinées

Évaluation approfondie

Points forts

  1. Forte praticité: Directement orienté vers les besoins réels du HL-LHC, tenant compte des contraintes matérielles strictes
  2. Approche complète: Comparaison systématique de plusieurs architectures, optimisation bayésienne garantissant une comparaison équitable
  3. Conception innovante: L'architecture Dense+RNN équilibre intelligemment les performances et le coût de calcul
  4. Quantification de l'incertitude: Première implémentation de DER sous contraintes FPGA, valeur pratique importante
  5. Vérification suffisante: Vérification sur plage dynamique complète, ensemble de test indépendant à grande échelle

Insuffisances

  1. Portée limitée: Ciblage uniquement d'une cellule de calorimètre à un emplacement spécifique
  2. Hypothèses simplifiées: L'hypothèse de déclenchement idéal peut différer des applications réelles
  3. Traitement des anomalies: Capacité limitée à traiter les événements de reconstruction anormaux
  4. Généralisation: Capacité de généralisation insuffisamment vérifiée pour différents emplacements et conditions

Impact

  1. Contribution technique: Fournit une nouvelle solution pour le traitement des données en temps réel dans les expériences de physique des hautes énergies
  2. Méthodologie: La méthode d'optimisation sous contraintes matérielles peut être généralisée à d'autres applications FPGA
  3. Valeur pratique: Service direct à la mise à niveau de l'expérience ATLAS, valeur d'ingénierie importante
  4. Interdisciplinarité: Favorise la fusion profonde de l'apprentissage automatique et de l'instrumentation en physique des hautes énergies

Scénarios d'application

  1. Physique des hautes énergies: Tâches similaires de reconstruction d'énergie du calorimètre
  2. Systèmes en temps réel: Applications de traitement de signal nécessitant une faible latence et une haute précision
  3. Applications FPGA: Déploiement de réseaux de neurones dans des environnements aux ressources limitées
  4. Quantification de l'incertitude: Applications d'ingénierie nécessitant une estimation d'incertitude en temps réel

Références

Cet article cite 28 références importantes couvrant la conception de l'expérience ATLAS, les plans de mise à niveau du LHC, l'implémentation de réseaux de neurones sur FPGA, la théorie de la régression par preuve profonde et d'autres domaines clés, fournissant une base théorique et technique solide à la recherche.


Évaluation globale: Il s'agit d'un article de recherche appliquée de haute qualité qui a atteint un bon équilibre entre l'innovation théorique et la pratique d'ingénierie. La recherche répond directement aux besoins de mise à niveau des grands instruments scientifiques, avec une conception méthodologique rationnelle et une vérification expérimentale suffisante, possédant une valeur importante pour les domaines de la physique des hautes énergies et des applications FPGA.