2025-11-18T21:19:13.596005

Optimised neural networks for online processing of ATLAS calorimeter data on FPGAs

Aad, Bertrand, Laatu et al.

A study of neural network architectures for the reconstruction of the energy deposited in the cells of the ATLAS liquid-argon calorimeters under high pile-up conditions expected at the HL-LHC is presented. These networks are designed to run on the FPGA-based readout hardware of the calorimeters under strict size and latency constraints. Several architectures, including Dense, Recurrent (RNN), and Convolutional (CNN) neural networks, are optimised using a Bayesian procedure that balances energy resolution against network size. The optimised Dense, CNN, and combined Dense+RNN architectures achieve a transverse energy resolution of approximately 80 MeV, outperforming both the optimal filtering (OF) method currently in use and RNNs of similar complexity. A detailed comparison across the full dynamic range shows that Dense, CNN, and Dense+RNN accurately reproduce the energy scale, while OF and RNNs underestimate the energy. Deep Evidential Regression is implemented within the Dense architecture to address the need for reliable per-event energy uncertainties. This approach provides predictive uncertainty estimates with minimal increase in network size. The predicted uncertainty is found to be consistent, on average, with the difference between the true deposited energy and the predicted energy.

academic

Redes neuronales optimizadas para el procesamiento en línea de datos del calorímetro ATLAS en FPGAs

Información Básica

ID del Artículo: 2510.11469
Título: Optimised neural networks for online processing of ATLAS calorimeter data on FPGAs
Autores: Georges Aad, Raphaël Bertrand, Lauri Laatu, Emmanuel Monnier, Arno Straessner, Nairit Sur, Johann C. Voigt
Clasificación: physics.ins-det (Física - Instrumentación y Detectores)
Fecha de Publicación: 13 de octubre de 2025
Enlace del Artículo: https://arxiv.org/abs/2510.11469v1

Resumen

Este estudio investiga en profundidad arquitecturas de redes neuronales para la reconstrucción de la deposición de energía en celdas del calorímetro de argón líquido ATLAS bajo las condiciones de alta amontonamiento esperadas en el Gran Colisionador de Hadrones de Alta Luminosidad (HL-LHC). Estas redes están diseñadas para funcionar en hardware de lectura basado en FPGA del calorímetro bajo restricciones estrictas de tamaño y latencia. Mediante un procedimiento de optimización bayesiana, se optimizaron múltiples arquitecturas incluyendo redes densas (Dense), redes neuronales recurrentes (RNN) y redes neuronales convolucionales (CNN), logrando un equilibrio entre la resolución energética y el tamaño de la red. Las arquitecturas Dense, CNN y la combinación Dense+RNN optimizadas alcanzaron una resolución de energía transversal de aproximadamente 80 MeV, superando significativamente el método de filtro óptimo (OF) actualmente utilizado y las RNN de complejidad similar. Las comparaciones detalladas en el rango dinámico completo muestran que las arquitecturas Dense, CNN y Dense+RNN reproducen con precisión la escala de energía, mientras que OF y RNN subestiman la energía. Además, se implementó regresión de evidencia profunda en la arquitectura Dense para satisfacer requisitos confiables de incertidumbre energética por evento.

Contexto e Motivación de la Investigación

Contexto del Problema

Desafíos del HL-LHC: El HL-LHC producirá hasta 200 colisiones protón-protón simultáneas después de su actualización en 2026-2030, causando problemas graves de amontonamiento de señales
Restricciones de Hardware: El calorímetro de argón líquido ATLAS contiene 182,468 celdas, generando cientos de terabytes de datos por segundo, requiriendo placas electrónicas especializadas para el procesamiento
Requisitos de Latencia: Los algoritmos de reconstrucción de energía deben completarse en 125 ns para satisfacer las necesidades de respuesta rápida del sistema de disparo
Limitaciones de Métodos Existentes: El algoritmo de filtro óptimo (OF) actualmente utilizado muestra un rendimiento significativamente reducido bajo condiciones de alto amontonamiento

Motivación de la Investigación

El aumento de la capacidad de procesamiento de FPGA proporciona una oportunidad única para implementar algoritmos modernos de aprendizaje automático en las primeras etapas de la cadena de procesamiento de datos
Necesidad de desarrollar nuevos métodos que funcionen bajo restricciones de hardware estrictas y superen el rendimiento del algoritmo OF
Implementación de estimación de incertidumbre energética por evento para mejorar la precisión de pasos posteriores de adquisición de datos y reconstrucción

Contribuciones Principales

Optimización Multiarquitectura: Se propusieron y optimizaron cuatro arquitecturas de redes neuronales (Dense, RNN, CNN, Dense+RNN), logrando el mejor equilibrio entre resolución energética y tamaño de red mediante optimización bayesiana
Función Objetivo con Restricciones de Hardware: Se diseñó una función objetivo con penalización por segmentos que considera el número de unidades MAC, controlando efectivamente el tamaño de la red
Mejora de Rendimiento: Las arquitecturas óptimas alcanzaron una resolución de energía transversal de aproximadamente 80 MeV, mejorando el algoritmo OF en aproximadamente 8%
Cuantificación de Incertidumbre: Primera implementación de regresión de evidencia profunda (DER) bajo restricciones de FPGA, proporcionando estimación de incertidumbre energética por evento
Validación en Rango Dinámico Completo: Se verificó la efectividad del método y la precisión de la escala de energía en el rango de 0-130 GeV

Descripción Detallada de Métodos

Definición de la Tarea

Entrada: Secuencia de muestras de pulsos digitalizados de celdas del calorímetro

4 muestras posteriores a la deposición (comenzando desde el cruce de haz del depósito de energía objetivo)
Hasta 28 muestras anteriores a la deposición (para corregir distorsiones causadas por depósitos de energía previos)

Salida: Energía transversal verdadera $E_T^{true}$ en el cruce de haz específico Restricciones: Tamaño de red < 500 unidades MAC, latencia < 125 ns

Arquitecturas de Modelos

1. Arquitectura CNN

Estructura: Dos capas convolucionales + capas de entrada/salida
Primera Capa: 5 filtros 1D paralelos, tamaño de núcleo 7, deslizándose sobre 25 muestras de entrada
Segunda Capa: 6 filtros 2D, tamaño de núcleo 11×5, entrada 19×5
Capa de Salida: Un filtro único, tamaño de núcleo 9×6
Ventajas: Patrón de ventana deslizante, reutilización de resultados de cálculos previos, reducción de latencia

2. Arquitectura RNN

Estructura: Secuencia de 5 unidades RNN + capa densa final
Unidades: Unidades vanilla simples, dimensión 8, activación ReLU
Características: Cálculo sincronizado con la llegada de muestras de datos, compartición de parámetros pero reutilización limitada

3. Arquitectura Dense+RNN

Diseño Innovador: Capa densa que procesa muestras anteriores a la deposición para inicializar unidades RNN
Ventajas: Mantiene ventajas de RNN mientras reduce costos de cálculo para secuencias largas
Estructura: Capa densa (anteriores) → Secuencia RNN (posteriores) → Capa densa final

4. Arquitectura Dense por Etapas

Diseño de Dos Etapas:
- Primera etapa: Corrección de distorsión de pulso de muestras anteriores
- Segunda etapa: Combinación de muestras posteriores para capturar forma de pulso
Optimización de Latencia: La primera etapa puede precalcularse

Puntos de Innovación Técnica

1. Función Objetivo con Restricciones de Hardware

f(M,σ) = {
  σ̃                           si M ≤ 500
  σ̃ + 0.3(M̃ - 0.3)          si M ∈ ]500; 850]
  σ̃ + 0.3(M̃ - 0.3) + e^(M̃-0.65) - 1  en otro caso
}

Mecanismo de penalización por segmentos asegura que la red esté dentro de restricciones de FPGA
Equilibra resolución energética con complejidad computacional

2. Regresión de Evidencia Profunda (DER)

Parametrización de Distribución NIG: γ (valor esperado), ν (varianza cognitiva), α, β (parámetros de varianza aleatoria)
Descomposición de Incertidumbre: Incertidumbre aleatoria + incertidumbre cognitiva
Implementación: Reemplazo de capa densa final por capa DenseNormalGamma

Configuración Experimental

Conjunto de Datos

Herramienta de Simulación: Paquete AREUS
Conjunto de Entrenamiento: 1 millón de eventos
Conjunto de Validación: 1.5 millones de eventos
Conjunto de Prueba: 2.5 millones de eventos
Evaluación Final: 13 millones de eventos independientes
Rango de Energía: Distribución uniforme 0-130 GeV (cubriendo 80% del rango dinámico de lectura de ganancia alta)
Condiciones de Amontonamiento: Promedio de 200 colisiones simultáneas (⟨μ⟩=200)

Métricas de Evaluación

Métrica Principal: Resolución de energía transversal σ(E_T^pred - E_T^true)
Escala de Energía: ⟨E_T^pred - E_T^true⟩ vs E_T^true
Evaluación de Incertidumbre: Distribución Pull (E_T^pred - E_T^true)/δ_pred

Métodos de Comparación

Línea Base: Algoritmo de filtro óptimo (OF)
Comparación entre Redes: RNN, Dense, CNN, Dense+RNN

Detalles de Implementación

Marco: TensorFlow Keras
Optimización: Optimización bayesiana, 30-100 iteraciones
Modelo Sustituto: Proceso gaussiano con núcleo Matérn 5/2
Función de Adquisición: Criterio de Mejora Esperada

Resultados Experimentales

Resultados Principales

Comparación de Resolución Energética

Arquitectura	Resolución Energética (MeV)	Unidades MAC	Mejora Relativa OF
OF	~90	-	-
RNN	~90	368	0%
Dense	~80	240	~11%
CNN	~80	419	~11%
Dense+RNN	~80	392	~11%

Precisión de Escala Energética

Dense, CNN, Dense+RNN: Reproducen con precisión la escala de energía, desviación cercana a 0
OF: Subestimación sistemática de energía (esperada por diseño, no incluye componente de amontonamiento simultáneo promedio)
RNN: Ligera subestimación en energías bajas, desviación aumentada en energías altas

Experimentos de Ablación

Importancia de Muestras Anteriores a la Deposición

Todas las redes optimizadas (excepto RNN) utilizan > 20 muestras anteriores a la deposición
Demuestra la importancia de capturar distorsiones de depósitos de energía previos
RNN está limitada por costos de cálculo de secuencias largas

Optimización del Tamaño de Red

El proceso de optimización bayesiana muestra:

Reducción significativa del tamaño de red después de 10 evaluaciones aleatorias iniciales
Recuperación de resolución energética y estabilización del tamaño de red después de 20 evaluaciones
Solo mejoras marginales en las 100 evaluaciones posteriores

Análisis de Incertidumbre DER

Características de Distribución Pull

Media: -0.06 (cercana a 0, tendencia ligera de sobreestimación)
Desviación Estándar: 0.75 (sobreestimación ligera de incertidumbre)
En general, la estimación de incertidumbre es consistente con desviaciones reales

Descomposición de Incertidumbre

Incertidumbre Cognitiva: Dominante (72-79 MeV)
Incertidumbre Aleatoria: Menor (30-42 MeV)
99% de eventos dentro de rango estrecho, indicando predicciones de modelo estables

Trabajo Relacionado

Aplicaciones de Redes Neuronales en FPGA

Crecimiento rápido de aplicaciones de redes neuronales en FPGA en experimentos del LHC
Casos de éxito en reemplazo de algoritmos de disparo
Aplicaciones emergentes en procesamiento de datos de detectores crudos

Reconstrucción de Energía del Calorímetro

Rendimiento reducido del algoritmo OF tradicional bajo condiciones de alto amontonamiento
Investigaciones previas limitadas a rango 0-5 GeV y simulaciones simplificadas
Este trabajo extiende a rango dinámico más grande y simulaciones más realistas

Cuantificación de Incertidumbre

Costo computacional excesivo de redes neuronales bayesianas
DER proporciona método práctico de estimación de incertidumbre
Primera aplicación bajo restricciones de FPGA

Conclusiones y Discusión

Conclusiones Principales

Mejora de Rendimiento: Las arquitecturas Dense y CNN logran mejora de resolución energética de ~8%
Viabilidad de Hardware: Todas las redes optimizadas < 500 unidades MAC, satisfaciendo restricciones de FPGA
Escala de Energía: Las redes neuronales reproducen con precisión la escala de energía en rango dinámico completo
Incertidumbre: DER proporciona exitosamente estimación de incertidumbre por evento

Limitaciones

Celda Única: Investigación limitada a una celda individual del calorímetro
Disparo Ideal: Asume detección perfecta de eventos de dispersión dura
Ganancia Alta: Solo considera configuración de lectura de ganancia alta
Detección de Anomalías: La estimación de incertidumbre actual tiene dificultad identificando eventos de reconstrucción anómala

Direcciones Futuras

Extensión Multicelda: Extensión a procesamiento conjunto de múltiples celdas del calorímetro
Integración de Disparo: Combinación con funcionalidades de asignación de cruce de haz
Detección de Anomalías: Exploración del manejo de ráfagas de ruido y estructura de haz no uniforme
Optimización de Arquitectura: Conjuntos de datos de entrenamiento más grandes y arquitecturas refinadas

Evaluación Profunda

Fortalezas

Practicidad Fuerte: Directamente orientado a necesidades reales del HL-LHC, considerando restricciones de hardware estrictas
Metodología Integral: Comparación sistemática de múltiples arquitecturas, optimización bayesiana asegura comparación justa
Diseño Innovador: Arquitectura Dense+RNN equilibra ingeniosamente rendimiento con costo computacional
Cuantificación de Incertidumbre: Primera implementación de DER bajo restricciones de FPGA, valor práctico importante
Verificación Suficiente: Validación en rango dinámico completo, conjunto de prueba independiente de gran escala

Deficiencias

Alcance Limitado: Solo para celda individual del calorímetro en ubicación específica
Suposiciones Simplificadas: Suposición de disparo ideal puede diferir de aplicación real
Manejo de Anomalías: Capacidad limitada para manejar eventos de reconstrucción anómala
Generalización: Capacidad de generalización bajo diferentes ubicaciones y condiciones no completamente verificada

Impacto

Contribución Técnica: Proporciona nueva solución para procesamiento de datos en tiempo real en experimentos de física de altas energías
Metodología: Método de optimización con restricciones de hardware generalizable a otras aplicaciones de FPGA
Valor Práctico: Servicio directo a actualización del experimento ATLAS, valor de ingeniería importante
Interdisciplinariedad: Promueve fusión profunda de aprendizaje automático e instrumentación de física de altas energías

Escenarios Aplicables

Física de Altas Energías: Tareas similares de reconstrucción de energía del calorímetro
Sistemas en Tiempo Real: Aplicaciones de procesamiento de señales que requieren baja latencia y alta precisión
Aplicaciones de FPGA: Despliegue de redes neuronales en entornos con recursos limitados
Cuantificación de Incertidumbre: Aplicaciones de ingeniería que requieren estimación de incertidumbre en tiempo real

Referencias

Este artículo cita 28 referencias importantes que cubren diseño del experimento ATLAS, planes de actualización del LHC, implementación de redes neuronales en FPGA, teoría de regresión de evidencia profunda y otros campos clave, proporcionando una base teórica y técnica sólida para la investigación.

Evaluación General: Este es un artículo de investigación aplicada de alta calidad que logra un buen equilibrio entre innovación teórica y práctica de ingeniería. La investigación sirve directamente a necesidades de actualización de equipos científicos importantes, con diseño de métodos razonable y verificación experimental suficiente, teniendo valor importante tanto para experimentos de física de altas energías como para aplicaciones de FPGA.