2025-11-22T21:28:16.108948

Forecasting Generative Amplification

Bahl, Diefenbacher, Elmer et al.
Generative networks are perfect tools to enhance the speed and precision of LHC simulations. It is important to understand their statistical precision, especially when generating events beyond the size of the training dataset. We present two complementary methods to estimate the amplification factor without large holdout datasets. Averaging amplification uses Bayesian networks or ensembling to estimate amplification from the precision of integrals over given phase-space volumes. Differential amplification uses hypothesis testing to quantify amplification without any resolution loss. Applied to state-of-the-art event generators, both methods indicate that amplification is possible in specific regions of phase space, but not yet across the entire distribution.
academic

Прогнозирование генеративной амплификации

Основная информация

  • ID статьи: 2509.08048
  • Название: Forecasting Generative Amplification
  • Авторы: Henning Bahl, Sascha Diefenbacher, Nina Elmer, Tilman Plehn, Jonas Spinner
  • Классификация: hep-ph cs.LG
  • Дата подачи: 17 октября 2025 г. в SciPost Physics
  • Ссылка на статью: https://arxiv.org/abs/2509.08048

Аннотация

Генеративные сети являются идеальным инструментом для повышения скорости и точности моделирования на БАК. Особенно важно понимать их статистическую точность при генерировании событий, выходящих за пределы масштаба обучающего набора данных. В данной работе предложены два взаимодополняющих метода для оценки коэффициента амплификации без использования больших резервных наборов данных. Средняя амплификация использует байесовские сети или ансамблевые методы для оценки амплификации на основе точности, интегрированной по заданному объёму фазового пространства. Дифференциальная амплификация использует проверку гипотез для количественной оценки амплификации без потери разрешения. При применении к современным генераторам событий оба метода показывают, что амплификация может быть достигнута в определённых областях фазового пространства.

Исследовательский контекст и мотивация

Предпосылки проблемы

  1. Вычислительные вызовы: Высоколюминесцентный БАК (HL-LHC) увеличит объём данных на порядок, требуя соответствующего увеличения точности и количества смоделированных данных, однако вычислительный бюджет далеко не достаточен.
  2. Концепция генеративной амплификации: Генеративная амплификация означает, что набор данных, полученный путём выборки из генеративной сети, может обеспечить лучшее описание истинного распределения по сравнению с обучающими данными. Это явление основано на способности генеративной сети интерполировать базовую плотность.
  3. Ограничения существующих методов оценки:
    • Зависимость от известного истинного распределения
    • Требование больших резервных наборов данных
    • Непрактичность в реальных физических приложениях

Исследовательская мотивация

  • Предоставить систематическую основу для количественной оценки статистической амплификации генеративных сетей без больших резервных наборов данных
  • Обеспечить надёжное количественное определение неопределённости для приложений генеративных сетей в физике БАК
  • Решить две основные проблемы: понимание того, как использовать генеративные сети для моделирования, и предоставление нижней границы статистической неопределённости для сгенерированных наборов данных

Основные вклады

  1. Предложение двух взаимодополняющих методов оценки коэффициента амплификации:
    • Коэффициент средней амплификации: оценка на основе точности, интегрированной по объёму фазового пространства
    • Коэффициент дифференциальной амплификации: оценка на основе проверки гипотез без потери разрешения
  2. Основа оценки без больших резервных наборов данных: использование байесовских сетей или ансамблевых методов для оценки неопределённости модели
  3. Проверка в практических приложениях физики БАК: применение к современным генераторам событий для производства пар топ-кварков
  4. Систематическая теоретическая основа: математически строгое определение и методы оценки генеративной амплификации

Подробное описание методов

Определение задачи

Учитывая обучающий набор данных Dtruentrainptrue(x)D^{n_{train}}_{true} \sim p_{true}(x), генеративная сеть изучает плотность pgen(x)p_{gen}(x). Коэффициент амплификации определяется как: G=nequivntrainG = \frac{n_{equiv}}{n_{train}} где nequivn_{equiv} — число эквивалентных событий, удовлетворяющих: M[Dtruenequiv,ptrue]=limngenM[Dgenngen,ptrue]M[D^{n_{equiv}}_{true}, p_{true}] = \lim_{n_{gen} \to \infty} M[D^{n_{gen}}_{gen}, p_{true}]

Метод средней амплификации

Основная идея

Измерение согласованности сгенерированных данных с истинным распределением путём интегрирования по определённому объёму фазового пространства VV: I(ptrue)=Vdxptrue(x)I(p_{true}) = \int_V dx \, p_{true}(x)

Разложение неопределённости

Общая неопределённость содержит две части: MI[Dgenngen,ptrue]={σstat2(ngen)если pgen=ptrueσstat2(ngen)+σmodel2(pgen,ptrue)если pgenptrueM_I[D^{n_{gen}}_{gen}, p_{true}] = \begin{cases} \sigma^2_{stat}(n_{gen}) & \text{если } p_{gen} = p_{true} \\ \sigma^2_{stat}(n_{gen}) + \sigma^2_{model}(p_{gen}, p_{true}) & \text{если } p_{gen} \neq p_{true} \end{cases}

Реализация байесовской сети

Использование байесовской генеративной сети для оценки неопределённости модели: σmodel2(pgen,ptrue)=Iˉ2θIˉθ2Iˉθ(1Iˉθ)ngen\sigma^2_{model}(p_{gen}, p_{true}) = \langle \bar{I}^2 \rangle_\theta - \langle \bar{I} \rangle^2_\theta - \frac{\langle \bar{I} \rangle_\theta (1 - \langle \bar{I} \rangle_\theta)}{n_{gen}}

Метод дифференциальной амплификации

Тест Колмогорова-Смирнова

Использование статистики теста КС: MKS[D1,D2]=supyF(y,D1)F(y,D2)M_{KS}[D_1, D_2] = \sup_y |F(y, D_1) - F(y, D_2)|

Асимптотическое поведение

Для двух наборов данных из одного распределения статистика КС имеет известное асимптотическое поведение: n1n2n1+n2MKS[D1,D2]=KpK(K)\sqrt{\frac{n_1 n_2}{n_1 + n_2}} M_{KS}[D_1, D_2] = K \sim p_K(K)

Классификатор отношения правдоподобия

Использование выходных данных обученного классификатора в качестве одномерной сводной статистики, которая согласно лемме Неймана-Пирсона является наиболее мощной сводной статистикой.

Экспериментальная установка

Игрушечные наборы данных

  • Распределение гауссовского кольца: 2D и 4D, радиальное распределение pR(x)=N(R;1,0.12)p_R(x) = \mathcal{N}(R; 1, 0.1^2)
  • Архитектура сети: автарегрессивный трансформер с параметризацией условной вероятности смесью гауссианов

Наборы данных физических приложений

  • Производство пар топ-кварков: генерация с использованием MadGraph5_AMC@NLO 3.5.1
  • Два набора данных:
    • ttˉ+0jt\bar{t} + 0j: обучающий набор ~5×10⁵, тестовый набор ~8×10⁶
    • ttˉ+4jt\bar{t} + 4j: обучающий набор ~2×10⁵, тестовый набор ~2×10⁵

Архитектура генеративной сети

  • Генератор условного потокового соответствия (CFM)
  • Три архитектуры:
    • Стандартный трансформер
    • L-GATr (трансформер геометрической алгебры, эквивариантный по Лоренцу)
    • LLoCa трансформер (локальная нормализация по Лоренцу)

Результаты экспериментов

Результаты на игрушечных наборах данных

Средняя амплификация

  • 2D гауссовское кольцо: G=2.6G = 2.6 в области 2, G=7.0G = 7.0 в объединённой области
  • 4D гауссовское кольцо: G=1.9G = 1.9 в области 2, G=2.8G = 2.8 в объединённой области
  • Хвостовые области: коэффициент амплификации значительно снижается, G=0.9G = 0.9 для 2D и G=0.03G = 0.03 для 4D

Дифференциальная амплификация

  • Чувствительность сводной статистики: радиальная сводная статистика RR показывает более высокий коэффициент амплификации (G22G \approx 22), в то время как статистика отношения правдоподобия не показывает амплификации
  • Эффект размерности: эффект амплификации ослабевает в 4D случае, отражая сложность обучения в высоких размерностях

Результаты физических приложений

Производство ttˉ+0jt\bar{t} + 0j

Средняя амплификация:

  • Трансформер: Gest=0.3G_{est} = 0.3, Gtruth=0.3G_{truth} = 0.3
  • L-GATr: Gest=0.8G_{est} = 0.8, Gtruth=0.7G_{truth} = 0.7
  • LLoCa-Tr: Gest=1.7G_{est} = 1.7, Gtruth=1.2G_{truth} = 1.2

Дифференциальная амплификация:

  • Полное фазовое пространство: все архитектуры G0.010.1G \approx 0.01-0.1
  • Область высокой mttˉm_{t\bar{t}}: LLoCa трансформер достигает G2G \approx 2

Производство ttˉ+4jt\bar{t} + 4j

Средняя амплификация (область высокой mttˉm_{t\bar{t}}):

  • Трансформер: Gest=2.3G_{est} = 2.3
  • L-GATr: Gest=10.9G_{est} = 10.9
  • LLoCa-Tr: Gest=12.0G_{est} = 12.0

Дифференциальная амплификация:

  • Область высокой mttˉm_{t\bar{t}}: все архитектуры G5G \approx 5

Ключевые находки

  1. Преимущества эквивариантности по Лоренцу: L-GATr и LLoCa трансформер значительно превосходят стандартный трансформер
  2. Зависимость от области: амплификация легче достигается в определённых областях фазового пространства (например, в хвостах высокой массы)
  3. Взаимодополняемость методов: средний и дифференциальный методы обеспечивают различные перспективы оценки амплификации

Связанные работы

Исследования генеративной амплификации

  • Ранние работы в основном проверяли эффект амплификации в синтетических данных и моделировании детекторов
  • Существующие методы зависят от известного истинного распределения или больших резервных наборов данных для проверки

Генерация событий на БАК

  • Выборка фазового пространства, сквозная генерация событий, адронизация и моделирование детектора с использованием генеративных сетей
  • Изученные гладкие амплитудные прокси и тестирование на основе классификаторов

Количественное определение неопределённости

  • Использование байесовских нейронных сетей и ансамблевых методов в физических приложениях
  • Количественное определение неопределённости генеративных сетей как важный компонент надёжной амплификации

Заключение и обсуждение

Основные выводы

  1. Проверка осуществимости: в определённых областях фазового пространства современные генеративные сети действительно могут достичь статистической амплификации
  2. Эффективность методов: оба предложенных метода эффективно оценивают коэффициент амплификации без больших резервных наборов данных
  3. Важность архитектуры: архитектуры, эквивариантные по Лоренцу, показывают лучшую производительность в генерации событий на БАК

Ограничения

  1. Ограничение по областям: амплификация в основном достигается в определённых областях фазового пространства, не охватывая всё распределение
  2. Вызовы высокой размерности: эффект амплификации ослабевает в высокомерных случаях
  3. Различие методов: два метода дают несколько различающиеся коэффициенты амплификации, отражая различную чувствительность к разрешению

Направления будущих исследований

  1. Расширение на более сложные процессы БАК и более высокие размерности
  2. Улучшение архитектур генеративных сетей для достижения более широкой амплификации
  3. Интеграция других методов количественного определения неопределённости

Глубокая оценка

Преимущества

  1. Теоретическая строгость: обеспечивает математически строгое определение и основу оценки генеративной амплификации
  2. Практическая ценность: решает ключевые потребности в практических физических приложениях без больших резервных наборов данных
  3. Методологические инновации: два взаимодополняющих метода имеют свои преимущества, средний метод прост и интуитивен, дифференциальный метод сохраняет разрешение
  4. Достаточная проверка: систематическая проверка от простых игрушечных моделей к сложным физическим процессам

Недостатки

  1. Ограниченный диапазон амплификации: в настоящее время амплификация достигается только в определённых областях, глобальная амплификация ещё далека
  2. Вычислительные затраты: байесовские сети и ансамблевые методы увеличивают вычислительные затраты
  3. Ограничения теста КС: дифференциальный метод ограничен одномерной статистикой теста

Влияние

  1. Научный вклад: обеспечивает важную теоретическую основу для приложений генеративных сетей в физике высоких энергий
  2. Практическая ценность: предоставляет осуществимое решение для вычислительных вызовов HL-LHC
  3. Универсальность методов: предложенные методы могут быть расширены на другие области научных вычислений

Применимые сценарии

  1. Моделирование физики высоких энергий: генерация событий на БАК и моделирование детектора
  2. Научные вычисления: физические задачи, требующие большого количества моделирования методом Монте-Карло
  3. Оценка генеративных моделей: любые приложения, требующие количественной оценки качества генерации и статистической надёжности

Библиография

Статья содержит богатую библиографию, охватывающую приложения машинного обучения в физике БАК, генеративные сети, байесовские методы и количественное определение неопределённости в соответствующих областях. Особого внимания заслуживают пионерские работы авторского коллектива по GANplification и последние исследования архитектур сетей, эквивариантных по Лоренцу.