2025-11-18T21:19:13.596005

Optimised neural networks for online processing of ATLAS calorimeter data on FPGAs

Aad, Bertrand, Laatu et al.

A study of neural network architectures for the reconstruction of the energy deposited in the cells of the ATLAS liquid-argon calorimeters under high pile-up conditions expected at the HL-LHC is presented. These networks are designed to run on the FPGA-based readout hardware of the calorimeters under strict size and latency constraints. Several architectures, including Dense, Recurrent (RNN), and Convolutional (CNN) neural networks, are optimised using a Bayesian procedure that balances energy resolution against network size. The optimised Dense, CNN, and combined Dense+RNN architectures achieve a transverse energy resolution of approximately 80 MeV, outperforming both the optimal filtering (OF) method currently in use and RNNs of similar complexity. A detailed comparison across the full dynamic range shows that Dense, CNN, and Dense+RNN accurately reproduce the energy scale, while OF and RNNs underestimate the energy. Deep Evidential Regression is implemented within the Dense architecture to address the need for reliable per-event energy uncertainties. This approach provides predictive uncertainty estimates with minimal increase in network size. The predicted uncertainty is found to be consistent, on average, with the difference between the true deposited energy and the predicted energy.

academic

ATLAS 카로리미터 데이터의 FPGA 온라인 처리를 위한 최적화된 신경망

기본 정보

논문 ID: 2510.11469
제목: Optimised neural networks for online processing of ATLAS calorimeter data on FPGAs
저자: Georges Aad, Raphaël Bertrand, Lauri Laatu, Emmanuel Monnier, Arno Straessner, Nairit Sur, Johann C. Voigt
분류: physics.ins-det (물리학 - 계측 및 검출기)
발표 시간: 2025년 10월 13일
논문 링크: https://arxiv.org/abs/2510.11469v1

초록

본 연구는 고광도 대형 강입자 충돌기(HL-LHC)의 예상되는 높은 중첩 조건 하에서 ATLAS 액체 아르곤 카로리미터 셀 에너지 침적 재구성을 위한 신경망 아키텍처를 심층 연구한다. 이러한 네트워크는 엄격한 크기 및 지연 제약 조건 하에서 카로리미터 FPGA 기반 읽기 하드웨어에서 작동하도록 설계되었다. 베이지안 최적화 절차를 통해 밀집 네트워크(Dense), 순환 신경망(RNN) 및 합성곱 신경망(CNN)을 포함한 다양한 아키텍처를 최적화하여 에너지 분해능과 네트워크 규모 간의 균형을 달성했다. 최적화된 Dense, CNN 및 Dense+RNN 조합 아키텍처는 약 80 MeV의 횡단 에너지 분해능을 달성하여 현재 사용 중인 최적 필터(OF) 방법과 유사한 복잡도의 RNN을 크게 능가한다. 전체 동적 범위에 대한 상세 비교는 Dense, CNN 및 Dense+RNN이 에너지 스케일을 정확히 재현하는 반면, OF와 RNN은 에너지를 과소평가함을 보여준다. 또한 Dense 아키텍처에서 심층 증거 회귀를 구현하여 신뢰할 수 있는 사건별 에너지 불확실성 요구사항을 충족했다.

연구 배경 및 동기

문제 배경

고광도 LHC 과제: HL-LHC는 2026-2030년 업그레이드 후 최대 200개의 동시 양성자-양성자 충돌을 생성하여 심각한 신호 중첩 문제 야기
하드웨어 제약: ATLAS 액체 아르곤 카로리미터는 182,468개 셀을 포함하며 초당 수백 TB의 데이터를 생성하여 전문 전자 보드 처리 필요
지연 요구사항: 에너지 재구성 알고리즘은 트리거 시스템의 빠른 응답 요구사항을 충족하기 위해 125 ns 내에 완료되어야 함
기존 방법의 한계: 현재 사용 중인 최적 필터(OF) 알고리즘은 높은 중첩 조건에서 성능이 크게 저하됨

연구 동기

FPGA 처리 능력의 향상으로 데이터 처리 체인 초기 단계에서 현대 기계학습 알고리즘 구현의 독특한 기회 제공
엄격한 하드웨어 제약 하에서 작동하면서 OF 알고리즘을 능가하는 성능의 새로운 방법 개발 필요
사건별 에너지 불확실성 추정 구현으로 후속 데이터 획득 및 재구성 단계의 정확도 향상

핵심 기여

다중 아키텍처 최적화: 베이지안 최적화를 통해 네 가지 신경망 아키텍처(Dense, RNN, CNN, Dense+RNN)를 제안 및 최적화하여 에너지 분해능과 네트워크 규모 간 최적 균형 달성
하드웨어 제약 목적 함수: MAC 단위 수를 고려한 분할 페널티 목적 함수 설계로 네트워크 규모 효과적 제어
성능 향상: 최적 아키텍처가 약 80 MeV 횡단 에너지 분해능 달성으로 OF 알고리즘 대비 약 8% 개선
불확실성 정량화: FPGA 제약 하에서 심층 증거 회귀(DER) 최초 구현으로 사건별 에너지 불확실성 추정 제공
전체 동적 범위 검증: 0-130 GeV 에너지 범위에서 방법의 유효성 및 에너지 스케일 정확성 검증

방법론 상세

작업 정의

입력: 카로리미터 셀의 디지털화된 펄스 샘플 시퀀스

4개의 침적 후 샘플(목표 에너지 침적의 BC부터 시작)
최대 28개의 침적 전 샘플(이전 에너지 침적으로 인한 왜곡 보정용)

출력: 특정 BC에서의 참 횡단 에너지 $E_T^{true}$ 제약: 네트워크 규모 <500 MAC 단위, 지연 <125 ns

모델 아키텍처

1. CNN 아키텍처

구조: 2개 합성곱 층 + 입출력 층
첫 번째 층: 5개 병렬 1D 필터, 커널 크기 7, 25개 입력 샘플에서 슬라이딩
두 번째 층: 6개 2D 필터, 커널 크기 11×5, 입력 19×5
출력층: 단일 필터, 커널 크기 9×6
장점: 슬라이딩 윈도우 패턴으로 이전 계산 결과 재사용 가능하여 지연 감소

2. RNN 아키텍처

구조: 5개 RNN 단위 시퀀스 + 최종 밀집 층
단위: 단순 바닐라 단위, 차원 8, ReLU 활성화
특징: 데이터 샘플 도착과 동기화된 계산, 매개변수 공유이지만 재사용 제한적

3. Dense+RNN 아키텍처

혁신 설계: 밀집 층이 침적 전 샘플을 처리하여 RNN 단위 초기화
장점: RNN의 장점 유지하면서 긴 시퀀스 계산 비용 감소
구조: 밀집 층(침적 전) → RNN 시퀀스(침적 후) → 최종 밀집 층

4. 단계별 Dense 아키텍처

2단계 설계:
- 1단계: 침적 전 샘플로 펄스 왜곡 보정
- 2단계: 침적 후 샘플과 결합하여 펄스 형태 포착
지연 최적화: 1단계는 사전 계산 가능

기술 혁신점

1. 하드웨어 제약 목적 함수

f(M,σ) = {
  σ̃                           if M ≤ 500
  σ̃ + 0.3(M̃ - 0.3)          if M ∈ ]500; 850]
  σ̃ + 0.3(M̃ - 0.3) + e^(M̃-0.65) - 1  else
}

분할 페널티 메커니즘으로 FPGA 제약 내 네트워크 보장
에너지 분해능과 계산 복잡도 균형

2. 심층 증거 회귀(DER)

NIG 분포 매개변수화: γ(기댓값), ν(인식론적 분산), α, β(무작위 분산 매개변수)
불확실성 분해: 무작위 불확실성 + 인식론적 불확실성
구현: 최종 밀집 층을 DenseNormalGamma 층으로 대체

실험 설정

데이터셋

시뮬레이션 도구: AREUS 도구 모음
훈련 세트: 100만 사건
검증 세트: 150만 사건
테스트 세트: 250만 사건
최종 평가: 1,300만 독립 사건
에너지 범위: 0-130 GeV 균등 분포(80% 고이득 읽기 동적 범위 커버)
중첩 조건: 평균 200개 동시 충돌(⟨μ⟩=200)

평가 지표

주요 지표: 횡단 에너지 분해능 σ(E_T^pred - E_T^true)
에너지 스케일: ⟨E_T^pred - E_T^true⟩ vs E_T^true
불확실성 평가: Pull 분포 (E_T^pred - E_T^true)/δ_pred

비교 방법

기준선: 최적 필터(OF) 알고리즘
네트워크 간 비교: RNN, Dense, CNN, Dense+RNN

구현 세부사항

프레임워크: TensorFlow Keras
최적화: 베이지안 최적화, 30-100 반복
대리 모델: 5/2 Matérn 커널 가우스 프로세스
획득 함수: Expected Improvement 기준

실험 결과

주요 결과

에너지 분해능 비교

아키텍처	에너지 분해능 (MeV)	MAC 단위	OF 대비 상대 개선
OF	~90	-	-
RNN	~90	368	0%
Dense	~80	240	~11%
CNN	~80	419	~11%
Dense+RNN	~80	392	~11%

에너지 스케일 정확성

Dense, CNN, Dense+RNN: 에너지 스케일을 정확히 재현하며 편차 거의 0
OF: 체계적 에너지 과소평가(설계 예상, 평균 동시 중첩 성분 미포함)
RNN: 저에너지에서 경미한 과소평가, 고에너지에서 편차 증가

절제 실험

침적 전 샘플의 중요성

최적화된 모든 네트워크(RNN 제외)가 >20개 침적 전 샘플 사용
이전 에너지 침적 왜곡 포착의 중요성 입증
RNN은 긴 시퀀스 계산 비용으로 인해 제한됨

네트워크 규모 최적화

베이지안 최적화 프로세스 표시:

처음 10회 무작위 평가 후 네트워크 규모 대폭 감소
20회 평가 후 에너지 분해능 회복 및 네트워크 규모 안정화
후속 100회 평가에서 미미한 개선만 달성

DER 불확실성 분석

Pull 분포 특징

평균: -0.06 (0에 가까우며 경미한 과대평가 경향)
표준편차: 0.75 (불확실성 약간 과대평가)
전반적으로 불확실성 추정이 참 편차와 일치

불확실성 분해

인식론적 불확실성: 우세(72-79 MeV)
무작위 불확실성: 더 작음(30-42 MeV)
99% 사건이 좁은 범위 내에 있어 모델 예측 안정성 표시

결론 및 논의

주요 결론

성능 향상: Dense 및 CNN 아키텍처가 ~8% 에너지 분해능 개선 달성
하드웨어 실현 가능성: 모든 최적화 네트워크가 <500 MAC 단위로 FPGA 제약 충족
에너지 스케일: 신경망이 전체 동적 범위에서 에너지 스케일 정확히 재현
불확실성: DER이 사건별 불확실성 추정 성공적 제공

한계

단일 셀: 연구가 단일 카로리미터 셀로 제한
이상적 트리거: 완벽한 하드 산란 사건 검출 가정
고이득: 고이득 읽기 설정만 고려
이상 검출: 현재 불확실성 추정이 재구성 이상 사건 식별 어려움

향후 방향

다중 셀 확장: 여러 카로리미터 셀의 결합 처리로 확장
트리거 통합: 묶음 교차 할당 기능과 결합
이상 검출: 노이즈 버스트 및 비균등 묶음 구조 처리 탐색
아키텍처 최적화: 더 큰 훈련 데이터셋 및 정제된 아키텍처

심층 평가

장점

실용성 강함: HL-LHC 실제 요구사항에 직접 대응하며 엄격한 하드웨어 제약 고려
방법 포괄적: 다양한 아키텍처 체계적 비교, 베이지안 최적화로 공정한 비교 보장
혁신 설계: Dense+RNN 아키텍처가 성능과 계산 비용을 교묘히 균형
불확실성 정량화: FPGA 제약 하에서 DER 최초 구현으로 중요한 실용 가치 제공
검증 충분: 전체 동적 범위 검증, 대규모 독립 테스트 세트

부족점

범위 제한: 특정 위치의 단일 카로리미터 셀만 대상
단순화 가정: 이상적 트리거 가정이 실제 응용과 차이 가능
이상 처리: 재구성 이상 사건 처리 능력 제한
일반화: 다양한 위치, 조건에서의 일반화 능력 충분히 검증되지 않음

영향력

기술 기여: 고에너지 물리학 실험의 실시간 데이터 처리에 새로운 솔루션 제공
방법론: 하드웨어 제약 최적화 방법을 다른 FPGA 응용으로 확대 가능
실용 가치: ATLAS 실험 업그레이드에 직접 기여하며 중요한 공학적 가치 보유
학제 간 융합: 기계학습과 고에너지 물리학 계측의 심층 융합 촉진

적용 분야

고에너지 물리학: 유사한 카로리미터 에너지 재구성 작업
실시간 시스템: 저지연, 고정확도 신호 처리 응용
FPGA 응용: 자원 제한 환경에서의 신경망 배포
불확실성 정량화: 실시간 불확실성 추정이 필요한 공학 응용

참고문헌

본 논문은 ATLAS 실험 설계, LHC 업그레이드 계획, FPGA 신경망 구현, 심층 증거 회귀 이론 등 핵심 분야를 포괄하는 28편의 중요 참고문헌을 인용하여 연구에 견고한 이론 및 기술 기초를 제공한다.

종합 평가: 이는 이론 혁신과 공학 실천 간 양호한 균형을 달성한 고품질 응용 연구 논문이다. 연구는 주요 과학 장비 업그레이드 요구사항에 직접 기여하며, 방법 설계가 합리적이고 실험 검증이 충분하여 고에너지 물리학 실험 및 FPGA 응용 분야 모두에 중요한 가치를 지닌다.