2025-11-18T21:19:13.596005

Optimised neural networks for online processing of ATLAS calorimeter data on FPGAs

Aad, Bertrand, Laatu et al.
A study of neural network architectures for the reconstruction of the energy deposited in the cells of the ATLAS liquid-argon calorimeters under high pile-up conditions expected at the HL-LHC is presented. These networks are designed to run on the FPGA-based readout hardware of the calorimeters under strict size and latency constraints. Several architectures, including Dense, Recurrent (RNN), and Convolutional (CNN) neural networks, are optimised using a Bayesian procedure that balances energy resolution against network size. The optimised Dense, CNN, and combined Dense+RNN architectures achieve a transverse energy resolution of approximately 80 MeV, outperforming both the optimal filtering (OF) method currently in use and RNNs of similar complexity. A detailed comparison across the full dynamic range shows that Dense, CNN, and Dense+RNN accurately reproduce the energy scale, while OF and RNNs underestimate the energy. Deep Evidential Regression is implemented within the Dense architecture to address the need for reliable per-event energy uncertainties. This approach provides predictive uncertainty estimates with minimal increase in network size. The predicted uncertainty is found to be consistent, on average, with the difference between the true deposited energy and the predicted energy.
academic

Redes neuronales optimizadas para el procesamiento en línea de datos del calorímetro ATLAS en FPGAs

Información Básica

  • ID del Artículo: 2510.11469
  • Título: Optimised neural networks for online processing of ATLAS calorimeter data on FPGAs
  • Autores: Georges Aad, Raphaël Bertrand, Lauri Laatu, Emmanuel Monnier, Arno Straessner, Nairit Sur, Johann C. Voigt
  • Clasificación: physics.ins-det (Física - Instrumentación y Detectores)
  • Fecha de Publicación: 13 de octubre de 2025
  • Enlace del Artículo: https://arxiv.org/abs/2510.11469v1

Resumen

Este estudio investiga en profundidad arquitecturas de redes neuronales para la reconstrucción de la deposición de energía en celdas del calorímetro de argón líquido ATLAS bajo las condiciones de alta amontonamiento esperadas en el Gran Colisionador de Hadrones de Alta Luminosidad (HL-LHC). Estas redes están diseñadas para funcionar en hardware de lectura basado en FPGA del calorímetro bajo restricciones estrictas de tamaño y latencia. Mediante un procedimiento de optimización bayesiana, se optimizaron múltiples arquitecturas incluyendo redes densas (Dense), redes neuronales recurrentes (RNN) y redes neuronales convolucionales (CNN), logrando un equilibrio entre la resolución energética y el tamaño de la red. Las arquitecturas Dense, CNN y la combinación Dense+RNN optimizadas alcanzaron una resolución de energía transversal de aproximadamente 80 MeV, superando significativamente el método de filtro óptimo (OF) actualmente utilizado y las RNN de complejidad similar. Las comparaciones detalladas en el rango dinámico completo muestran que las arquitecturas Dense, CNN y Dense+RNN reproducen con precisión la escala de energía, mientras que OF y RNN subestiman la energía. Además, se implementó regresión de evidencia profunda en la arquitectura Dense para satisfacer requisitos confiables de incertidumbre energética por evento.

Contexto e Motivación de la Investigación

Contexto del Problema

  1. Desafíos del HL-LHC: El HL-LHC producirá hasta 200 colisiones protón-protón simultáneas después de su actualización en 2026-2030, causando problemas graves de amontonamiento de señales
  2. Restricciones de Hardware: El calorímetro de argón líquido ATLAS contiene 182,468 celdas, generando cientos de terabytes de datos por segundo, requiriendo placas electrónicas especializadas para el procesamiento
  3. Requisitos de Latencia: Los algoritmos de reconstrucción de energía deben completarse en 125 ns para satisfacer las necesidades de respuesta rápida del sistema de disparo
  4. Limitaciones de Métodos Existentes: El algoritmo de filtro óptimo (OF) actualmente utilizado muestra un rendimiento significativamente reducido bajo condiciones de alto amontonamiento

Motivación de la Investigación

  • El aumento de la capacidad de procesamiento de FPGA proporciona una oportunidad única para implementar algoritmos modernos de aprendizaje automático en las primeras etapas de la cadena de procesamiento de datos
  • Necesidad de desarrollar nuevos métodos que funcionen bajo restricciones de hardware estrictas y superen el rendimiento del algoritmo OF
  • Implementación de estimación de incertidumbre energética por evento para mejorar la precisión de pasos posteriores de adquisición de datos y reconstrucción

Contribuciones Principales

  1. Optimización Multiarquitectura: Se propusieron y optimizaron cuatro arquitecturas de redes neuronales (Dense, RNN, CNN, Dense+RNN), logrando el mejor equilibrio entre resolución energética y tamaño de red mediante optimización bayesiana
  2. Función Objetivo con Restricciones de Hardware: Se diseñó una función objetivo con penalización por segmentos que considera el número de unidades MAC, controlando efectivamente el tamaño de la red
  3. Mejora de Rendimiento: Las arquitecturas óptimas alcanzaron una resolución de energía transversal de aproximadamente 80 MeV, mejorando el algoritmo OF en aproximadamente 8%
  4. Cuantificación de Incertidumbre: Primera implementación de regresión de evidencia profunda (DER) bajo restricciones de FPGA, proporcionando estimación de incertidumbre energética por evento
  5. Validación en Rango Dinámico Completo: Se verificó la efectividad del método y la precisión de la escala de energía en el rango de 0-130 GeV

Descripción Detallada de Métodos

Definición de la Tarea

Entrada: Secuencia de muestras de pulsos digitalizados de celdas del calorímetro

  • 4 muestras posteriores a la deposición (comenzando desde el cruce de haz del depósito de energía objetivo)
  • Hasta 28 muestras anteriores a la deposición (para corregir distorsiones causadas por depósitos de energía previos)

Salida: Energía transversal verdadera ETtrueE_T^{true} en el cruce de haz específico Restricciones: Tamaño de red < 500 unidades MAC, latencia < 125 ns

Arquitecturas de Modelos

1. Arquitectura CNN

  • Estructura: Dos capas convolucionales + capas de entrada/salida
  • Primera Capa: 5 filtros 1D paralelos, tamaño de núcleo 7, deslizándose sobre 25 muestras de entrada
  • Segunda Capa: 6 filtros 2D, tamaño de núcleo 11×5, entrada 19×5
  • Capa de Salida: Un filtro único, tamaño de núcleo 9×6
  • Ventajas: Patrón de ventana deslizante, reutilización de resultados de cálculos previos, reducción de latencia

2. Arquitectura RNN

  • Estructura: Secuencia de 5 unidades RNN + capa densa final
  • Unidades: Unidades vanilla simples, dimensión 8, activación ReLU
  • Características: Cálculo sincronizado con la llegada de muestras de datos, compartición de parámetros pero reutilización limitada

3. Arquitectura Dense+RNN

  • Diseño Innovador: Capa densa que procesa muestras anteriores a la deposición para inicializar unidades RNN
  • Ventajas: Mantiene ventajas de RNN mientras reduce costos de cálculo para secuencias largas
  • Estructura: Capa densa (anteriores) → Secuencia RNN (posteriores) → Capa densa final

4. Arquitectura Dense por Etapas

  • Diseño de Dos Etapas:
    • Primera etapa: Corrección de distorsión de pulso de muestras anteriores
    • Segunda etapa: Combinación de muestras posteriores para capturar forma de pulso
  • Optimización de Latencia: La primera etapa puede precalcularse

Puntos de Innovación Técnica

1. Función Objetivo con Restricciones de Hardware

f(M,σ) = {
  σ̃                           si M ≤ 500
  σ̃ + 0.3(M̃ - 0.3)          si M ∈ ]500; 850]
  σ̃ + 0.3(M̃ - 0.3) + e^(M̃-0.65) - 1  en otro caso
}
  • Mecanismo de penalización por segmentos asegura que la red esté dentro de restricciones de FPGA
  • Equilibra resolución energética con complejidad computacional

2. Regresión de Evidencia Profunda (DER)

  • Parametrización de Distribución NIG: γ (valor esperado), ν (varianza cognitiva), α, β (parámetros de varianza aleatoria)
  • Descomposición de Incertidumbre: Incertidumbre aleatoria + incertidumbre cognitiva
  • Implementación: Reemplazo de capa densa final por capa DenseNormalGamma

Configuración Experimental

Conjunto de Datos

  • Herramienta de Simulación: Paquete AREUS
  • Conjunto de Entrenamiento: 1 millón de eventos
  • Conjunto de Validación: 1.5 millones de eventos
  • Conjunto de Prueba: 2.5 millones de eventos
  • Evaluación Final: 13 millones de eventos independientes
  • Rango de Energía: Distribución uniforme 0-130 GeV (cubriendo 80% del rango dinámico de lectura de ganancia alta)
  • Condiciones de Amontonamiento: Promedio de 200 colisiones simultáneas (⟨μ⟩=200)

Métricas de Evaluación

  • Métrica Principal: Resolución de energía transversal σ(E_T^pred - E_T^true)
  • Escala de Energía: ⟨E_T^pred - E_T^true⟩ vs E_T^true
  • Evaluación de Incertidumbre: Distribución Pull (E_T^pred - E_T^true)/δ_pred

Métodos de Comparación

  • Línea Base: Algoritmo de filtro óptimo (OF)
  • Comparación entre Redes: RNN, Dense, CNN, Dense+RNN

Detalles de Implementación

  • Marco: TensorFlow Keras
  • Optimización: Optimización bayesiana, 30-100 iteraciones
  • Modelo Sustituto: Proceso gaussiano con núcleo Matérn 5/2
  • Función de Adquisición: Criterio de Mejora Esperada

Resultados Experimentales

Resultados Principales

Comparación de Resolución Energética

ArquitecturaResolución Energética (MeV)Unidades MACMejora Relativa OF
OF~90--
RNN~903680%
Dense~80240~11%
CNN~80419~11%
Dense+RNN~80392~11%

Precisión de Escala Energética

  • Dense, CNN, Dense+RNN: Reproducen con precisión la escala de energía, desviación cercana a 0
  • OF: Subestimación sistemática de energía (esperada por diseño, no incluye componente de amontonamiento simultáneo promedio)
  • RNN: Ligera subestimación en energías bajas, desviación aumentada en energías altas

Experimentos de Ablación

Importancia de Muestras Anteriores a la Deposición

  • Todas las redes optimizadas (excepto RNN) utilizan > 20 muestras anteriores a la deposición
  • Demuestra la importancia de capturar distorsiones de depósitos de energía previos
  • RNN está limitada por costos de cálculo de secuencias largas

Optimización del Tamaño de Red

El proceso de optimización bayesiana muestra:

  • Reducción significativa del tamaño de red después de 10 evaluaciones aleatorias iniciales
  • Recuperación de resolución energética y estabilización del tamaño de red después de 20 evaluaciones
  • Solo mejoras marginales en las 100 evaluaciones posteriores

Análisis de Incertidumbre DER

Características de Distribución Pull

  • Media: -0.06 (cercana a 0, tendencia ligera de sobreestimación)
  • Desviación Estándar: 0.75 (sobreestimación ligera de incertidumbre)
  • En general, la estimación de incertidumbre es consistente con desviaciones reales

Descomposición de Incertidumbre

  • Incertidumbre Cognitiva: Dominante (72-79 MeV)
  • Incertidumbre Aleatoria: Menor (30-42 MeV)
  • 99% de eventos dentro de rango estrecho, indicando predicciones de modelo estables

Trabajo Relacionado

Aplicaciones de Redes Neuronales en FPGA

  • Crecimiento rápido de aplicaciones de redes neuronales en FPGA en experimentos del LHC
  • Casos de éxito en reemplazo de algoritmos de disparo
  • Aplicaciones emergentes en procesamiento de datos de detectores crudos

Reconstrucción de Energía del Calorímetro

  • Rendimiento reducido del algoritmo OF tradicional bajo condiciones de alto amontonamiento
  • Investigaciones previas limitadas a rango 0-5 GeV y simulaciones simplificadas
  • Este trabajo extiende a rango dinámico más grande y simulaciones más realistas

Cuantificación de Incertidumbre

  • Costo computacional excesivo de redes neuronales bayesianas
  • DER proporciona método práctico de estimación de incertidumbre
  • Primera aplicación bajo restricciones de FPGA

Conclusiones y Discusión

Conclusiones Principales

  1. Mejora de Rendimiento: Las arquitecturas Dense y CNN logran mejora de resolución energética de ~8%
  2. Viabilidad de Hardware: Todas las redes optimizadas < 500 unidades MAC, satisfaciendo restricciones de FPGA
  3. Escala de Energía: Las redes neuronales reproducen con precisión la escala de energía en rango dinámico completo
  4. Incertidumbre: DER proporciona exitosamente estimación de incertidumbre por evento

Limitaciones

  1. Celda Única: Investigación limitada a una celda individual del calorímetro
  2. Disparo Ideal: Asume detección perfecta de eventos de dispersión dura
  3. Ganancia Alta: Solo considera configuración de lectura de ganancia alta
  4. Detección de Anomalías: La estimación de incertidumbre actual tiene dificultad identificando eventos de reconstrucción anómala

Direcciones Futuras

  1. Extensión Multicelda: Extensión a procesamiento conjunto de múltiples celdas del calorímetro
  2. Integración de Disparo: Combinación con funcionalidades de asignación de cruce de haz
  3. Detección de Anomalías: Exploración del manejo de ráfagas de ruido y estructura de haz no uniforme
  4. Optimización de Arquitectura: Conjuntos de datos de entrenamiento más grandes y arquitecturas refinadas

Evaluación Profunda

Fortalezas

  1. Practicidad Fuerte: Directamente orientado a necesidades reales del HL-LHC, considerando restricciones de hardware estrictas
  2. Metodología Integral: Comparación sistemática de múltiples arquitecturas, optimización bayesiana asegura comparación justa
  3. Diseño Innovador: Arquitectura Dense+RNN equilibra ingeniosamente rendimiento con costo computacional
  4. Cuantificación de Incertidumbre: Primera implementación de DER bajo restricciones de FPGA, valor práctico importante
  5. Verificación Suficiente: Validación en rango dinámico completo, conjunto de prueba independiente de gran escala

Deficiencias

  1. Alcance Limitado: Solo para celda individual del calorímetro en ubicación específica
  2. Suposiciones Simplificadas: Suposición de disparo ideal puede diferir de aplicación real
  3. Manejo de Anomalías: Capacidad limitada para manejar eventos de reconstrucción anómala
  4. Generalización: Capacidad de generalización bajo diferentes ubicaciones y condiciones no completamente verificada

Impacto

  1. Contribución Técnica: Proporciona nueva solución para procesamiento de datos en tiempo real en experimentos de física de altas energías
  2. Metodología: Método de optimización con restricciones de hardware generalizable a otras aplicaciones de FPGA
  3. Valor Práctico: Servicio directo a actualización del experimento ATLAS, valor de ingeniería importante
  4. Interdisciplinariedad: Promueve fusión profunda de aprendizaje automático e instrumentación de física de altas energías

Escenarios Aplicables

  1. Física de Altas Energías: Tareas similares de reconstrucción de energía del calorímetro
  2. Sistemas en Tiempo Real: Aplicaciones de procesamiento de señales que requieren baja latencia y alta precisión
  3. Aplicaciones de FPGA: Despliegue de redes neuronales en entornos con recursos limitados
  4. Cuantificación de Incertidumbre: Aplicaciones de ingeniería que requieren estimación de incertidumbre en tiempo real

Referencias

Este artículo cita 28 referencias importantes que cubren diseño del experimento ATLAS, planes de actualización del LHC, implementación de redes neuronales en FPGA, teoría de regresión de evidencia profunda y otros campos clave, proporcionando una base teórica y técnica sólida para la investigación.


Evaluación General: Este es un artículo de investigación aplicada de alta calidad que logra un buen equilibrio entre innovación teórica y práctica de ingeniería. La investigación sirve directamente a necesidades de actualización de equipos científicos importantes, con diseño de métodos razonable y verificación experimental suficiente, teniendo valor importante tanto para experimentos de física de altas energías como para aplicaciones de FPGA.