2025-11-18T21:19:13.596005

Optimised neural networks for online processing of ATLAS calorimeter data on FPGAs

Aad, Bertrand, Laatu et al.

A study of neural network architectures for the reconstruction of the energy deposited in the cells of the ATLAS liquid-argon calorimeters under high pile-up conditions expected at the HL-LHC is presented. These networks are designed to run on the FPGA-based readout hardware of the calorimeters under strict size and latency constraints. Several architectures, including Dense, Recurrent (RNN), and Convolutional (CNN) neural networks, are optimised using a Bayesian procedure that balances energy resolution against network size. The optimised Dense, CNN, and combined Dense+RNN architectures achieve a transverse energy resolution of approximately 80 MeV, outperforming both the optimal filtering (OF) method currently in use and RNNs of similar complexity. A detailed comparison across the full dynamic range shows that Dense, CNN, and Dense+RNN accurately reproduce the energy scale, while OF and RNNs underestimate the energy. Deep Evidential Regression is implemented within the Dense architecture to address the need for reliable per-event energy uncertainties. This approach provides predictive uncertainty estimates with minimal increase in network size. The predicted uncertainty is found to be consistent, on average, with the difference between the true deposited energy and the predicted energy.

academic

Réseaux de neurones optimisés pour le traitement en ligne des données du calorimètre ATLAS sur FPGAs

Informations de base

ID de l'article: 2510.11469
Titre: Optimised neural networks for online processing of ATLAS calorimeter data on FPGAs
Auteurs: Georges Aad, Raphaël Bertrand, Lauri Laatu, Emmanuel Monnier, Arno Straessner, Nairit Sur, Johann C. Voigt
Classification: physics.ins-det (Physique - Instrumentation et Détecteurs)
Date de publication: 13 octobre 2025
Lien de l'article: https://arxiv.org/abs/2510.11469v1

Résumé

Cette étude approfondit les architectures de réseaux de neurones pour la reconstruction de l'énergie déposée dans les cellules du calorimètre à argon liquide d'ATLAS dans les conditions d'empilement élevé attendues au Grand Collisionneur de hadrons de haute luminosité (HL-LHC). Ces réseaux sont conçus pour fonctionner sur le matériel de lecture basé sur FPGA du calorimètre sous des contraintes strictes de taille et de latence. Grâce à une procédure d'optimisation bayésienne, plusieurs architectures ont été optimisées, notamment les réseaux denses (Dense), les réseaux de neurones récurrents (RNN) et les réseaux de neurones convolutifs (CNN), en équilibrant la résolution énergétique et la taille du réseau. Les architectures Dense, CNN et la combinaison Dense+RNN optimisées ont atteint une résolution énergétique transverse d'environ 80 MeV, surpassant significativement la méthode du filtre optimal (OF) actuellement utilisée et les RNN de complexité similaire. Une comparaison détaillée sur l'ensemble de la plage dynamique montre que les architectures Dense, CNN et Dense+RNN reproduisent fidèlement l'échelle énergétique, tandis que OF et RNN sous-estiment l'énergie. De plus, une régression par preuve profonde a été implémentée dans l'architecture Dense pour satisfaire les exigences d'incertitude énergétique fiable par événement.

Contexte et motivation de la recherche

Contexte du problème

Défis du HL-LHC: Le HL-LHC produira jusqu'à 200 collisions proton-proton simultanées après sa mise à niveau en 2026-2030, entraînant des problèmes graves d'empilement de signaux
Contraintes matérielles: Le calorimètre à argon liquide d'ATLAS contient 182 468 cellules, générant des centaines de téraoctets de données par seconde, nécessitant des cartes électroniques spécialisées
Exigences de latence: L'algorithme de reconstruction d'énergie doit être complété en 125 ns pour satisfaire les exigences de réponse rapide du système de déclenchement
Limitations des méthodes existantes: L'algorithme de filtre optimal (OF) actuellement utilisé voit ses performances diminuer significativement dans les conditions d'empilement élevé

Motivation de la recherche

L'amélioration des capacités de traitement des FPGAs offre une opportunité unique de mettre en œuvre des algorithmes d'apprentissage automatique modernes aux premiers stades de la chaîne de traitement des données
Nécessité de développer de nouvelles méthodes fonctionnant sous des contraintes matérielles strictes et surpassant l'algorithme OF
Réaliser l'estimation de l'incertitude énergétique par événement pour améliorer la précision des étapes ultérieures d'acquisition et de reconstruction des données

Contributions principales

Optimisation multi-architectures: Proposition et optimisation de quatre architectures de réseaux de neurones (Dense, RNN, CNN, Dense+RNN), atteignant le meilleur équilibre entre résolution énergétique et taille du réseau par optimisation bayésienne
Fonction objectif avec contraintes matérielles: Conception d'une fonction objectif avec pénalité par étapes tenant compte du nombre d'unités MAC, contrôlant efficacement la taille du réseau
Amélioration des performances: Les architectures optimales réalisent une résolution énergétique transverse d'environ 80 MeV, améliorant l'algorithme OF d'environ 8%
Quantification de l'incertitude: Première implémentation de la régression par preuve profonde (DER) sous contraintes FPGA, fournissant une estimation de l'incertitude énergétique par événement
Validation sur plage dynamique complète: Vérification de l'efficacité de la méthode et de la précision de l'échelle énergétique dans la plage 0-130 GeV

Détails méthodologiques

Définition de la tâche

Entrée: Séquence d'échantillons d'impulsions numérisées des cellules du calorimètre

4 échantillons après le dépôt (à partir du croisement de faisceaux (BC) du dépôt d'énergie cible)
Jusqu'à 28 échantillons avant le dépôt (pour corriger les distorsions causées par les dépôts d'énergie antérieurs)

Sortie: Énergie transverse vraie $E_T^{true}$ au BC spécifique Contraintes: Taille du réseau < 500 unités MAC, latence < 125 ns

Architectures de modèles

1. Architecture CNN

Structure: Deux couches convolutives + couches d'entrée-sortie
Première couche: 5 filtres 1D parallèles, taille de noyau 7, glissant sur 25 échantillons d'entrée
Deuxième couche: 6 filtres 2D, taille de noyau 11×5, entrée 19×5
Couche de sortie: Filtre unique, taille de noyau 9×6
Avantages: Mode fenêtre glissante, réutilisation des calculs antérieurs, réduction de la latence

2. Architecture RNN

Structure: Séquence de 5 unités RNN + couche dense finale
Unités: Unités vanilla simples, dimension 8, activation ReLU
Caractéristiques: Calcul synchronisé avec l'arrivée des échantillons de données, partage de paramètres mais réutilisation limitée

3. Architecture Dense+RNN

Conception innovante: Couche dense traitant les échantillons avant le dépôt pour initialiser les unités RNN
Avantages: Conserve les avantages du RNN tout en réduisant le coût de calcul pour les longues séquences
Structure: Couche dense (avant dépôt) → Séquence RNN (après dépôt) → Couche dense finale

4. Architecture Dense par étapes

Conception en deux étapes:
- Première étape: Correction de la distorsion d'impulsion par les échantillons avant dépôt
- Deuxième étape: Combinaison avec les échantillons après dépôt pour capturer la forme d'impulsion
Optimisation de latence: La première étape peut être pré-calculée

Points d'innovation technique

1. Fonction objectif avec contraintes matérielles

f(M,σ) = {
  σ̃                           si M ≤ 500
  σ̃ + 0.3(M̃ - 0.3)          si M ∈ ]500; 850]
  σ̃ + 0.3(M̃ - 0.3) + e^(M̃-0.65) - 1  sinon
}

Mécanisme de pénalité par étapes garantissant que le réseau respecte les contraintes FPGA
Équilibre entre résolution énergétique et complexité de calcul

2. Régression par preuve profonde (DER)

Paramétrisation de distribution NIG: γ (valeur attendue), ν (variance cognitive), α, β (paramètres de variance aléatoire)
Décomposition de l'incertitude: Incertitude aléatoire + incertitude cognitive
Implémentation: Remplacement de la couche dense finale par une couche DenseNormalGamma

Configuration expérimentale

Ensemble de données

Outil de simulation: Suite d'outils AREUS
Ensemble d'entraînement: 1 million d'événements
Ensemble de validation: 1,5 million d'événements
Ensemble de test: 2,5 millions d'événements
Évaluation finale: 13 millions d'événements indépendants
Plage énergétique: Distribution uniforme 0-130 GeV (couvrant 80% de la plage dynamique de lecture à haut gain)
Conditions d'empilement: 200 collisions simultanées en moyenne (⟨μ⟩=200)

Métriques d'évaluation

Métrique principale: Résolution énergétique transverse σ(E_T^pred - E_T^true)
Échelle énergétique: ⟨E_T^pred - E_T^true⟩ vs E_T^true
Évaluation de l'incertitude: Distribution de tirage (E_T^pred - E_T^true)/δ_pred

Méthodes de comparaison

Ligne de base: Algorithme de filtre optimal (OF)
Comparaison entre réseaux: RNN, Dense, CNN, Dense+RNN

Détails d'implémentation

Framework: TensorFlow Keras
Optimisation: Optimisation bayésienne, 30-100 itérations
Modèle de substitution: Processus gaussien avec noyau Matérn 5/2
Fonction d'acquisition: Critère d'amélioration attendue

Résultats expérimentaux

Résultats principaux

Comparaison de la résolution énergétique

Architecture	Résolution énergétique (MeV)	Unités MAC	Amélioration relative OF
OF	~90	-	-
RNN	~90	368	0%
Dense	~80	240	~11%
CNN	~80	419	~11%
Dense+RNN	~80	392	~11%

Précision de l'échelle énergétique

Dense, CNN, Dense+RNN: Reproduction fidèle de l'échelle énergétique, écart proche de zéro
OF: Sous-estimation systématique de l'énergie (attendue par conception, ne comprenant pas la composante d'empilement simultané moyen)
RNN: Légère sous-estimation aux basses énergies, écart augmentant aux hautes énergies

Études d'ablation

Importance des échantillons avant dépôt

Tous les réseaux optimisés (sauf RNN) utilisent > 20 échantillons avant dépôt
Démontre l'importance de capturer les distorsions causées par les dépôts d'énergie antérieurs
Le RNN est limité par le coût de calcul élevé pour les longues séquences

Optimisation de la taille du réseau

Le processus d'optimisation bayésienne montre:

Réduction significative de la taille du réseau après 10 évaluations aléatoires initiales
Récupération de la résolution énergétique et stabilisation de la taille du réseau après 20 évaluations
Améliorations mineures seulement lors des 100 évaluations suivantes

Analyse de l'incertitude DER

Caractéristiques de la distribution de tirage

Moyenne: -0,06 (proche de zéro, tendance légère à la surestimation)
Écart-type: 0,75 (surestimation légère de l'incertitude)
Globalement, l'estimation de l'incertitude est cohérente avec les écarts réels

Décomposition de l'incertitude

Incertitude cognitive: Dominante (72-79 MeV)
Incertitude aléatoire: Plus faible (30-42 MeV)
99% des événements dans une bande étroite, indiquant une prédiction de modèle stable

Travaux connexes

Applications de réseaux de neurones sur FPGA

Croissance rapide des applications de réseaux de neurones FPGA dans les expériences du LHC
Cas de succès existants de remplacement d'algorithmes de déclenchement
Applications émergentes du traitement des données de détecteur brut

Reconstruction d'énergie du calorimètre

Dégradation des performances de l'algorithme OF traditionnel dans les conditions d'empilement élevé
Études antérieures limitées à la plage 0-5 GeV et à des simulations simplifiées
Ce travail s'étend à une plage dynamique plus grande et à des simulations plus réalistes

Quantification de l'incertitude

Coût de calcul élevé des réseaux de neurones bayésiens
DER fournit une méthode pratique d'estimation de l'incertitude
Première application sous contraintes FPGA

Conclusions et discussion

Conclusions principales

Amélioration des performances: Les architectures Dense et CNN réalisent une amélioration de la résolution énergétique d'environ 8%
Faisabilité matérielle: Tous les réseaux optimisés < 500 unités MAC, satisfaisant les contraintes FPGA
Échelle énergétique: Les réseaux de neurones reproduisent fidèlement l'échelle énergétique sur toute la plage dynamique
Incertitude: DER fournit avec succès une estimation de l'incertitude par événement

Limitations

Cellule unique: L'étude est limitée à une seule cellule du calorimètre
Déclenchement idéal: Hypothèse d'une détection d'événement de diffusion dure parfaite
Haut gain: Considération uniquement de la configuration de lecture à haut gain
Détection d'anomalies: L'estimation actuelle de l'incertitude a du mal à identifier les événements de reconstruction anormaux

Directions futures

Extension multi-cellules: Extension au traitement conjoint de plusieurs cellules du calorimètre
Intégration de déclenchement: Combinaison avec les fonctionnalités d'allocation de croisement de faisceaux
Détection d'anomalies: Exploration du traitement des rafales de bruit et des structures de faisceaux non uniformes
Optimisation d'architecture: Ensembles de données d'entraînement plus importants et architectures affinées

Évaluation approfondie

Points forts

Forte praticité: Directement orienté vers les besoins réels du HL-LHC, tenant compte des contraintes matérielles strictes
Approche complète: Comparaison systématique de plusieurs architectures, optimisation bayésienne garantissant une comparaison équitable
Conception innovante: L'architecture Dense+RNN équilibre intelligemment les performances et le coût de calcul
Quantification de l'incertitude: Première implémentation de DER sous contraintes FPGA, valeur pratique importante
Vérification suffisante: Vérification sur plage dynamique complète, ensemble de test indépendant à grande échelle

Insuffisances

Portée limitée: Ciblage uniquement d'une cellule de calorimètre à un emplacement spécifique
Hypothèses simplifiées: L'hypothèse de déclenchement idéal peut différer des applications réelles
Traitement des anomalies: Capacité limitée à traiter les événements de reconstruction anormaux
Généralisation: Capacité de généralisation insuffisamment vérifiée pour différents emplacements et conditions

Impact

Contribution technique: Fournit une nouvelle solution pour le traitement des données en temps réel dans les expériences de physique des hautes énergies
Méthodologie: La méthode d'optimisation sous contraintes matérielles peut être généralisée à d'autres applications FPGA
Valeur pratique: Service direct à la mise à niveau de l'expérience ATLAS, valeur d'ingénierie importante
Interdisciplinarité: Favorise la fusion profonde de l'apprentissage automatique et de l'instrumentation en physique des hautes énergies

Scénarios d'application

Physique des hautes énergies: Tâches similaires de reconstruction d'énergie du calorimètre
Systèmes en temps réel: Applications de traitement de signal nécessitant une faible latence et une haute précision
Applications FPGA: Déploiement de réseaux de neurones dans des environnements aux ressources limitées
Quantification de l'incertitude: Applications d'ingénierie nécessitant une estimation d'incertitude en temps réel

Références

Cet article cite 28 références importantes couvrant la conception de l'expérience ATLAS, les plans de mise à niveau du LHC, l'implémentation de réseaux de neurones sur FPGA, la théorie de la régression par preuve profonde et d'autres domaines clés, fournissant une base théorique et technique solide à la recherche.

Évaluation globale: Il s'agit d'un article de recherche appliquée de haute qualité qui a atteint un bon équilibre entre l'innovation théorique et la pratique d'ingénierie. La recherche répond directement aux besoins de mise à niveau des grands instruments scientifiques, avec une conception méthodologique rationnelle et une vérification expérimentale suffisante, possédant une valeur importante pour les domaines de la physique des hautes énergies et des applications FPGA.