Optimised neural networks for online processing of ATLAS calorimeter data on FPGAs
Aad, Bertrand, Laatu et al.
A study of neural network architectures for the reconstruction of the energy deposited in the cells of the ATLAS liquid-argon calorimeters under high pile-up conditions expected at the HL-LHC is presented. These networks are designed to run on the FPGA-based readout hardware of the calorimeters under strict size and latency constraints. Several architectures, including Dense, Recurrent (RNN), and Convolutional (CNN) neural networks, are optimised using a Bayesian procedure that balances energy resolution against network size. The optimised Dense, CNN, and combined Dense+RNN architectures achieve a transverse energy resolution of approximately 80 MeV, outperforming both the optimal filtering (OF) method currently in use and RNNs of similar complexity. A detailed comparison across the full dynamic range shows that Dense, CNN, and Dense+RNN accurately reproduce the energy scale, while OF and RNNs underestimate the energy. Deep Evidential Regression is implemented within the Dense architecture to address the need for reliable per-event energy uncertainties. This approach provides predictive uncertainty estimates with minimal increase in network size. The predicted uncertainty is found to be consistent, on average, with the difference between the true deposited energy and the predicted energy.
academic
Redes neuronales optimizadas para el procesamiento en línea de datos del calorímetro ATLAS en FPGAs
Este estudio investiga en profundidad arquitecturas de redes neuronales para la reconstrucción de la deposición de energía en celdas del calorímetro de argón líquido ATLAS bajo las condiciones de alta amontonamiento esperadas en el Gran Colisionador de Hadrones de Alta Luminosidad (HL-LHC). Estas redes están diseñadas para funcionar en hardware de lectura basado en FPGA del calorímetro bajo restricciones estrictas de tamaño y latencia. Mediante un procedimiento de optimización bayesiana, se optimizaron múltiples arquitecturas incluyendo redes densas (Dense), redes neuronales recurrentes (RNN) y redes neuronales convolucionales (CNN), logrando un equilibrio entre la resolución energética y el tamaño de la red. Las arquitecturas Dense, CNN y la combinación Dense+RNN optimizadas alcanzaron una resolución de energía transversal de aproximadamente 80 MeV, superando significativamente el método de filtro óptimo (OF) actualmente utilizado y las RNN de complejidad similar. Las comparaciones detalladas en el rango dinámico completo muestran que las arquitecturas Dense, CNN y Dense+RNN reproducen con precisión la escala de energía, mientras que OF y RNN subestiman la energía. Además, se implementó regresión de evidencia profunda en la arquitectura Dense para satisfacer requisitos confiables de incertidumbre energética por evento.
Desafíos del HL-LHC: El HL-LHC producirá hasta 200 colisiones protón-protón simultáneas después de su actualización en 2026-2030, causando problemas graves de amontonamiento de señales
Restricciones de Hardware: El calorímetro de argón líquido ATLAS contiene 182,468 celdas, generando cientos de terabytes de datos por segundo, requiriendo placas electrónicas especializadas para el procesamiento
Requisitos de Latencia: Los algoritmos de reconstrucción de energía deben completarse en 125 ns para satisfacer las necesidades de respuesta rápida del sistema de disparo
Limitaciones de Métodos Existentes: El algoritmo de filtro óptimo (OF) actualmente utilizado muestra un rendimiento significativamente reducido bajo condiciones de alto amontonamiento
El aumento de la capacidad de procesamiento de FPGA proporciona una oportunidad única para implementar algoritmos modernos de aprendizaje automático en las primeras etapas de la cadena de procesamiento de datos
Necesidad de desarrollar nuevos métodos que funcionen bajo restricciones de hardware estrictas y superen el rendimiento del algoritmo OF
Implementación de estimación de incertidumbre energética por evento para mejorar la precisión de pasos posteriores de adquisición de datos y reconstrucción
Optimización Multiarquitectura: Se propusieron y optimizaron cuatro arquitecturas de redes neuronales (Dense, RNN, CNN, Dense+RNN), logrando el mejor equilibrio entre resolución energética y tamaño de red mediante optimización bayesiana
Función Objetivo con Restricciones de Hardware: Se diseñó una función objetivo con penalización por segmentos que considera el número de unidades MAC, controlando efectivamente el tamaño de la red
Mejora de Rendimiento: Las arquitecturas óptimas alcanzaron una resolución de energía transversal de aproximadamente 80 MeV, mejorando el algoritmo OF en aproximadamente 8%
Cuantificación de Incertidumbre: Primera implementación de regresión de evidencia profunda (DER) bajo restricciones de FPGA, proporcionando estimación de incertidumbre energética por evento
Validación en Rango Dinámico Completo: Se verificó la efectividad del método y la precisión de la escala de energía en el rango de 0-130 GeV
Este artículo cita 28 referencias importantes que cubren diseño del experimento ATLAS, planes de actualización del LHC, implementación de redes neuronales en FPGA, teoría de regresión de evidencia profunda y otros campos clave, proporcionando una base teórica y técnica sólida para la investigación.
Evaluación General: Este es un artículo de investigación aplicada de alta calidad que logra un buen equilibrio entre innovación teórica y práctica de ingeniería. La investigación sirve directamente a necesidades de actualización de equipos científicos importantes, con diseño de métodos razonable y verificación experimental suficiente, teniendo valor importante tanto para experimentos de física de altas energías como para aplicaciones de FPGA.