Optimised neural networks for online processing of ATLAS calorimeter data on FPGAs
Aad, Bertrand, Laatu et al.
A study of neural network architectures for the reconstruction of the energy deposited in the cells of the ATLAS liquid-argon calorimeters under high pile-up conditions expected at the HL-LHC is presented. These networks are designed to run on the FPGA-based readout hardware of the calorimeters under strict size and latency constraints. Several architectures, including Dense, Recurrent (RNN), and Convolutional (CNN) neural networks, are optimised using a Bayesian procedure that balances energy resolution against network size. The optimised Dense, CNN, and combined Dense+RNN architectures achieve a transverse energy resolution of approximately 80 MeV, outperforming both the optimal filtering (OF) method currently in use and RNNs of similar complexity. A detailed comparison across the full dynamic range shows that Dense, CNN, and Dense+RNN accurately reproduce the energy scale, while OF and RNNs underestimate the energy. Deep Evidential Regression is implemented within the Dense architecture to address the need for reliable per-event energy uncertainties. This approach provides predictive uncertainty estimates with minimal increase in network size. The predicted uncertainty is found to be consistent, on average, with the difference between the true deposited energy and the predicted energy.
academic
Réseaux de neurones optimisés pour le traitement en ligne des données du calorimètre ATLAS sur FPGAs
Cette étude approfondit les architectures de réseaux de neurones pour la reconstruction de l'énergie déposée dans les cellules du calorimètre à argon liquide d'ATLAS dans les conditions d'empilement élevé attendues au Grand Collisionneur de hadrons de haute luminosité (HL-LHC). Ces réseaux sont conçus pour fonctionner sur le matériel de lecture basé sur FPGA du calorimètre sous des contraintes strictes de taille et de latence. Grâce à une procédure d'optimisation bayésienne, plusieurs architectures ont été optimisées, notamment les réseaux denses (Dense), les réseaux de neurones récurrents (RNN) et les réseaux de neurones convolutifs (CNN), en équilibrant la résolution énergétique et la taille du réseau. Les architectures Dense, CNN et la combinaison Dense+RNN optimisées ont atteint une résolution énergétique transverse d'environ 80 MeV, surpassant significativement la méthode du filtre optimal (OF) actuellement utilisée et les RNN de complexité similaire. Une comparaison détaillée sur l'ensemble de la plage dynamique montre que les architectures Dense, CNN et Dense+RNN reproduisent fidèlement l'échelle énergétique, tandis que OF et RNN sous-estiment l'énergie. De plus, une régression par preuve profonde a été implémentée dans l'architecture Dense pour satisfaire les exigences d'incertitude énergétique fiable par événement.
Défis du HL-LHC: Le HL-LHC produira jusqu'à 200 collisions proton-proton simultanées après sa mise à niveau en 2026-2030, entraînant des problèmes graves d'empilement de signaux
Contraintes matérielles: Le calorimètre à argon liquide d'ATLAS contient 182 468 cellules, générant des centaines de téraoctets de données par seconde, nécessitant des cartes électroniques spécialisées
Exigences de latence: L'algorithme de reconstruction d'énergie doit être complété en 125 ns pour satisfaire les exigences de réponse rapide du système de déclenchement
Limitations des méthodes existantes: L'algorithme de filtre optimal (OF) actuellement utilisé voit ses performances diminuer significativement dans les conditions d'empilement élevé
L'amélioration des capacités de traitement des FPGAs offre une opportunité unique de mettre en œuvre des algorithmes d'apprentissage automatique modernes aux premiers stades de la chaîne de traitement des données
Nécessité de développer de nouvelles méthodes fonctionnant sous des contraintes matérielles strictes et surpassant l'algorithme OF
Réaliser l'estimation de l'incertitude énergétique par événement pour améliorer la précision des étapes ultérieures d'acquisition et de reconstruction des données
Optimisation multi-architectures: Proposition et optimisation de quatre architectures de réseaux de neurones (Dense, RNN, CNN, Dense+RNN), atteignant le meilleur équilibre entre résolution énergétique et taille du réseau par optimisation bayésienne
Fonction objectif avec contraintes matérielles: Conception d'une fonction objectif avec pénalité par étapes tenant compte du nombre d'unités MAC, contrôlant efficacement la taille du réseau
Amélioration des performances: Les architectures optimales réalisent une résolution énergétique transverse d'environ 80 MeV, améliorant l'algorithme OF d'environ 8%
Quantification de l'incertitude: Première implémentation de la régression par preuve profonde (DER) sous contraintes FPGA, fournissant une estimation de l'incertitude énergétique par événement
Validation sur plage dynamique complète: Vérification de l'efficacité de la méthode et de la précision de l'échelle énergétique dans la plage 0-130 GeV
Contribution technique: Fournit une nouvelle solution pour le traitement des données en temps réel dans les expériences de physique des hautes énergies
Méthodologie: La méthode d'optimisation sous contraintes matérielles peut être généralisée à d'autres applications FPGA
Valeur pratique: Service direct à la mise à niveau de l'expérience ATLAS, valeur d'ingénierie importante
Interdisciplinarité: Favorise la fusion profonde de l'apprentissage automatique et de l'instrumentation en physique des hautes énergies
Cet article cite 28 références importantes couvrant la conception de l'expérience ATLAS, les plans de mise à niveau du LHC, l'implémentation de réseaux de neurones sur FPGA, la théorie de la régression par preuve profonde et d'autres domaines clés, fournissant une base théorique et technique solide à la recherche.
Évaluation globale: Il s'agit d'un article de recherche appliquée de haute qualité qui a atteint un bon équilibre entre l'innovation théorique et la pratique d'ingénierie. La recherche répond directement aux besoins de mise à niveau des grands instruments scientifiques, avec une conception méthodologique rationnelle et une vérification expérimentale suffisante, possédant une valeur importante pour les domaines de la physique des hautes énergies et des applications FPGA.