Optimised neural networks for online processing of ATLAS calorimeter data on FPGAs
Aad, Bertrand, Laatu et al.
A study of neural network architectures for the reconstruction of the energy deposited in the cells of the ATLAS liquid-argon calorimeters under high pile-up conditions expected at the HL-LHC is presented. These networks are designed to run on the FPGA-based readout hardware of the calorimeters under strict size and latency constraints. Several architectures, including Dense, Recurrent (RNN), and Convolutional (CNN) neural networks, are optimised using a Bayesian procedure that balances energy resolution against network size. The optimised Dense, CNN, and combined Dense+RNN architectures achieve a transverse energy resolution of approximately 80 MeV, outperforming both the optimal filtering (OF) method currently in use and RNNs of similar complexity. A detailed comparison across the full dynamic range shows that Dense, CNN, and Dense+RNN accurately reproduce the energy scale, while OF and RNNs underestimate the energy. Deep Evidential Regression is implemented within the Dense architecture to address the need for reliable per-event energy uncertainties. This approach provides predictive uncertainty estimates with minimal increase in network size. The predicted uncertainty is found to be consistent, on average, with the difference between the true deposited energy and the predicted energy.
academic
Optimierte neuronale Netze zur Online-Verarbeitung von ATLAS-Kalorimeterdaten auf FPGAs
Diese Studie untersucht tiefgreifend neuronale Netzwerk-Architekturen zur Rekonstruktion der Energiedeposition in ATLAS-Flüssigargonalorimetern unter den für den Hochleuchtkraft-LHC (HL-LHC) erwarteten Hochstapelungsbedingungen. Diese Netze sind für den Betrieb auf FPGA-basierter Auslesehardware des Kalorimeters unter strikten Größen- und Latenzeinschränkungen konzipiert. Durch ein Bayes'sches Optimierungsverfahren werden mehrere Architekturen, einschließlich dichter Netze (Dense), rekurrenter neuronaler Netze (RNN) und Faltungsneuronaler Netze (CNN), optimiert, um ein Gleichgewicht zwischen Energieauflösung und Netzgröße zu erreichen. Die optimierten Dense-, CNN- und Dense+RNN-Kombinationsarchitekturen erzielen eine transversale Energieauflösung von etwa 80 MeV, was erheblich besser ist als die derzeit verwendete optimale Filterung (OF) und ähnlich komplexe RNNs. Ein detaillierter Vergleich über den gesamten dynamischen Bereich zeigt, dass Dense-, CNN- und Dense+RNN-Architekturen die Energieskala genau reproduzieren, während OF und RNN die Energie unterschätzen. Darüber hinaus wurde tiefe evidenzbasierte Regression in der Dense-Architektur implementiert, um zuverlässige ereignisspezifische Energieunsicherheitsanforderungen zu erfüllen.
HL-LHC-Herausforderungen: Der HL-LHC wird nach der Aufrüstung 2026-2030 bis zu 200 gleichzeitige Proton-Proton-Kollisionen erzeugen, was zu schwerwiegenden Signalstapelungsproblemen führt
Hardwareeinschränkungen: Das ATLAS-Flüssigargonalorimeter enthält 182.468 Zellen und erzeugt Hunderte von Terabyte Daten pro Sekunde, die spezialisierte elektronische Platinen verarbeiten müssen
Latenzanforderungen: Der Energierekonstruktionsalgorithmus muss innerhalb von 125 ns abgeschlossen sein, um die schnelle Reaktion des Triggersystems zu erfüllen
Einschränkungen bestehender Methoden: Der derzeit verwendete OF-Algorithmus zeigt unter Hochstapelungsbedingungen eine deutlich verschlechterte Leistung
Die verbesserte FPGA-Verarbeitungskapazität bietet eine einzigartige Gelegenheit, moderne Algorithmen des maschinellen Lernens in frühen Phasen der Datenverarbeitungskette zu implementieren
Notwendigkeit, neue Methoden zu entwickeln, die unter strikten Hardwareeinschränkungen funktionieren und den OF-Algorithmus übertreffen
Implementierung ereignisspezifischer Energieunsicherheitsschätzung zur Verbesserung der Genauigkeit nachgelagerter Datenerfassungs- und Rekonstruktionsschritte
Multi-Architektur-Optimierung: Vier neuronale Netzwerk-Architekturen (Dense, RNN, CNN, Dense+RNN) werden vorgeschlagen und optimiert, wobei durch Bayes'sche Optimierung ein optimales Gleichgewicht zwischen Energieauflösung und Netzgröße erreicht wird
Hardwareeinschränkungs-Zielfunktion: Eine segmentierte Strafzielfunktion, die die Anzahl der MAC-Einheiten berücksichtigt, wird entworfen, um die Netzgröße effektiv zu kontrollieren
Leistungsverbesserung: Optimale Architekturen erzielen eine transversale Energieauflösung von etwa 80 MeV, was eine Verbesserung von etwa 8% gegenüber dem OF-Algorithmus darstellt
Unsicherheitsquantifizierung: Erste Implementierung der tiefgreifenden evidenzgestützten Regression (DER) unter FPGA-Einschränkungen, die ereignisspezifische Energieunsicherheitsschätzungen bereitstellt
Validierung über den gesamten dynamischen Bereich: Validierung der Methode im Energiebereich von 0-130 GeV und Überprüfung der Genauigkeit der Energieskala
Dieses Papier zitiert 28 wichtige Referenzen, die ATLAS-Experimentdesign, LHC-Aufrüstungspläne, FPGA-Neuronale-Netzwerk-Implementierung, Theorie der tiefgreifenden evidenzgestützten Regression und andere Schlüsselbereiche abdecken und eine solide theoretische und technische Grundlage für die Forschung bieten.
Gesamtbewertung: Dies ist ein hochqualitatives angewandtes Forschungspapier, das ein gutes Gleichgewicht zwischen theoretischer Innovation und Ingenieurpraxis erreicht. Die Forschung dient direkt den Aufrüstungsanforderungen großer wissenschaftlicher Geräte, die Methodengestaltung ist vernünftig, die experimentelle Validierung ist umfassend, und sie hat wichtige Werte für sowohl Hochenergiephysik-Experimente als auch FPGA-Anwendungsfelder.