2025-11-14T00:28:11.716967

An extraction of the Collins-Soper kernel from a joint analysis of experimental and lattice data

Avkhadiev, Bertone, Bissolotti et al.
We present a first joint extraction of the Collins-Soper kernel (CSK) combining experimental and lattice QCD data in the context of an analysis of transverse-momentum-dependent distributions (TMDs). Based on a neural-network parametrization, we perform a Bayesian reweighting of an existing fits of TMDs using lattice data, as well as a joint TMD fit to lattice and experimental data. We consistently find that the inclusion of lattice information shifts the central value of the CSK by approximately 10% and reduces its uncertainty by 40-50%, highlighting the potential of lattice inputs to improve TMD extractions.
academic

An extraction of the Collins-Soper kernel from a joint analysis of experimental and lattice data

基本信息

  • 论文ID: 2510.26489
  • 标题: An extraction of the Collins-Soper kernel from a joint analysis of experimental and lattice data
  • 作者: Artur Avkhadiev, Valerio Bertone, Chiara Bissolotti, Matteo Cerutti, Yang Fu, Simone Rodini, Phiala Shanahan, Michael Wagman, Yong Zhao
  • 机构: MIT, Argonne National Laboratory, CEA Saclay, DESY, University of Pavia, Fermilab
  • 分类: hep-ph (高能物理-唯象学), hep-ex (高能物理-实验), hep-lat (高能物理-格点)
  • 发表时间: 2025年10月30日
  • 论文链接: https://arxiv.org/abs/2510.26489

摘要

本文首次将实验数据和格点QCD数据联合用于提取Collins-Soper核(CSK),在横向动量依赖分布(TMDs)分析框架下进行。基于神经网络参数化方法,研究者对现有TMD拟合进行贝叶斯重加权,并执行了联合拟合。研究一致发现,纳入格点信息使CSK中心值偏移约10%,不确定度降低40-50%,凸显了格点输入改进TMD提取的潜力。

研究背景与动机

研究问题

Collins-Soper核(CSK)是描述横向动量依赖分布(TMDs)演化的关键非微扰物理量,它编码了QCD真空的信息而非强子内部结构。CSK在大横向距离b(非微扰区域)的行为无法通过微扰QCD计算,必须从数据中提取。

问题重要性

  1. TMD精度提升:精确确定CSK对于减少TMD演化中的模型依赖性至关重要
  2. 多过程预测:改进的CSK可提高QCD对多种过程的预测精度
  3. 因子化检验:可用于测试非微扰区域的因子化有效性
  4. 无直接实验观测:没有实验观测量直接敏感于CSK,格点QCD成为唯一的直接信息来源

现有方法局限

  1. 纯唯象提取:传统方法仅从实验数据(如Drell-Yan过程)间接提取CSK,不确定度较大
  2. 模型依赖:非微扰部分通常采用简单参数化(如g_K(b) = 2g_2²b²),缺乏第一性原理约束
  3. 格点数据未利用:虽然格点QCD可直接计算CSK,但此前未被系统纳入唯象分析

研究动机

借鉴部分子分布函数(PDFs)提取中成功结合格点和实验数据的经验,本文首次将这一策略应用于TMD提取,特别是CSK的确定。

核心贡献

  1. 首次联合分析:首次将格点QCD数据系统性地纳入TMD唯象提取,实现实验与格点数据的联合分析
  2. 双重方法论验证
    • 贝叶斯重加权(Bayesian reweighting)现有拟合
    • 实验与格点数据的同时拟合(simultaneous fit)
    • 两种方法结果高度一致,验证了方法的稳健性
  3. 显著精度提升
    • CSK非微扰参数g₂的中心值偏移约10%
    • 不确定度降低40-50%
    • 从 g₂^Baseline = 0.186±0.033 提升到 g₂^Fit = 0.167±0.015
  4. 无张力验证:证明了格点数据与实验数据之间不存在张力,两者可以自洽结合
  5. 方法论创新:处理有限格点间距数据的系统方法,包括连续极限外推的同时进行

方法详解

任务定义

输入

  • 实验数据:482个Drell-Yan过程数据点(固定靶、RHIC、Tevatron、LHCb、CMS、ATLAS)
  • 格点数据:21个CSK数据点,来自3个不同格点间距(a₁=0.15 fm, a₂=0.12 fm, a₃=0.09 fm)

输出

  • CSK的非微扰参数g₂及其不确定度
  • 完整的TMD分布函数

约束条件

  • 保持对实验数据的描述质量
  • 正确处理格点间距效应
  • 满足微扰QCD在小b区域的约束

Collins-Soper核的理论框架

CSK满足重整化群方程: K(b,μ)lnμ=γK(αs(μ))\frac{\partial K(b,\mu)}{\partial \ln\mu} = -\gamma_K(\alpha_s(\mu))

其中γ_K是尖点反常维度,已知到四圈精度。解为:

K(b,μ)=K(b,μb)μbμdμμγK(αs(μ))gK(b)K(b,\mu) = K(b_*,\mu_{b_*}) - \int_{\mu_{b_*}}^{\mu} \frac{d\mu'}{\mu'}\gamma_K(\alpha_s(\mu')) - g_K(b)

关键组成部分

  1. 微扰部分:K(b_,μ_{b_})和积分项,可精确计算
  2. 非微扰部分:g_K(b),本文采用参数化 gK(b)=2g22b2g_K(b) = 2g_2^2 b^2
  3. b_*处方:确保微扰计算在可靠区域(μ_{b_} = 2e^{-γ_E}/b_

基线TMD拟合

基于Ref. 32的框架:

  • 理论精度:N³LL(次次次领头对数)
  • 参数化:神经网络(NN)用于非微扰部分
  • 数据集:comprehensive Drell-Yan数据
  • 基线结果:g₂^Baseline = 0.186±0.033
  • MC样本:N=250个蒙特卡洛复制品

格点数据处理

两种处理方式

  1. 连续极限外推数据
    • n=21个数据点{K_j±σ_j}
    • 无点间相关性
    • χ²计算: χα2=j=1n(KjK(α)(bj)σj)2\chi_\alpha^2 = \sum_{j=1}^{n} \left(\frac{K_j - K^{(\alpha)}(b_j)}{\sigma_j}\right)^2
  2. 有限格点间距数据
    • 三个子集(n₁=6, n₂=7, n₃=8个点)
    • 每个子集有协方差矩阵Σᵢ
    • 需要修正格点间距效应: gK(b)=2g22b2k1abk2a2b2g_K(b) = 2g_2^2 b^2 - k_1\frac{a}{b} - k_2\frac{a^2}{b^2}
    • χ²计算包含相关性: χα2=i=13ji,li=1ni(KjiK(α)(bji))(Σi1)ji,li(KliK(α)(bli))\chi_\alpha^2 = \sum_{i=1}^{3}\sum_{j_i,l_i=1}^{n_i}(K_{j_i}-K^{(\alpha)}(b_{j_i}))(\Sigma_i^{-1})_{j_i,l_i}(K_{l_i}-K^{(\alpha)}(b_{l_i}))

贝叶斯重加权方法

原理:根据格点数据的似然度为现有拟合的MC复制品赋权重

权重计算wα=N(χα2)n/21eχα2/2w_\alpha = \mathcal{N}\left(\chi_\alpha^2\right)^{n/2-1}e^{-\chi_\alpha^2/2}

其中N为归一化常数,使得∑w_α = N

加权统计量g2=α=1Nwαg2(α),σg22=α=1Nwα(g2(α)g2)2\langle g_2\rangle = \sum_{\alpha=1}^{N}w_\alpha g_2^{(\alpha)}, \quad \sigma_{g_2}^2 = \sum_{\alpha=1}^{N}w_\alpha(g_2^{(\alpha)}-\langle g_2\rangle)^2

有效复制品数:N_eff ≈ 150(原始N=250),表明重加权成功

同时拟合方法

设置

  • 总数据点:503(482 DY + 21格点)
  • 训练-验证划分:实验数据50%-50%,格点数据全部用于训练
  • 完全相同的NN参数化和拟合框架
  • 格点数据通过协方差矩阵处理相关性

拟合参数

  • g₂:CSK非微扰参数
  • k₁, k₂:格点间距修正参数(先验:k₁=0.22±0.08, k₂=0±0.1)

实验设置

数据集详情

实验数据(482点)

  • 固定靶实验:233点
  • RHIC:7点
  • Tevatron:71点
  • LHCb:21点
  • CMS:78点
  • ATLAS:72点

格点QCD数据(21点)

  • 来源:Refs. 53, 54,首个具有完全系统误差控制的CSK格点计算
  • 包含连续极限外推(a→0)
  • 三个格点间距:
    • a₁ = 0.15 fm(6点)
    • a₂ = 0.12 fm(7点)
    • a₃ = 0.09 fm(8点)
  • 横向距离范围:b ∈ 0, 5 GeV⁻¹
  • 重整化标度:μ = 2 GeV

评价指标

  1. χ²统计量:衡量理论预测与数据的符合程度
  2. 平均χ²:⟨χ²⟩在MC ensemble上的平均
  3. 参数不确定度:通过MC复制品分布确定
  4. 有效复制品数:N_eff,评估重加权效果

对比方法

  1. Baseline:纯实验数据拟合(Ref. 32
  2. Reweighting-continuum:使用连续极限外推格点数据重加权
  3. Reweighting-finite:使用有限格点间距数据重加权
  4. Simultaneous fit:实验与格点数据联合拟合

实现细节

  • 神经网络架构:与Ref. 32完全一致
  • MC样本数:N=250(基线),10⁴(重加权中用于k₁,k₂采样)
  • 微扰阶数:N³LL精度
  • b_*处方:标准选择,保证微扰可靠性
  • 先验分布:k₁∼Normal(0.22, 0.08), k₂∼Normal(0, 0.1)

实验结果

主要结果

g₂参数提取结果对比

方法g₂值中心值偏移不确定度降低
Baseline(实验)0.186±0.033--
Lattice only0.152±0.027--
Reweighting-continuum0.164±0.020~12%~40%
Reweighting-finite0.165±0.020~11%~40%
Simultaneous fit0.167±0.015~10%~55%

关键发现

  1. 两种重加权方法结果完全一致,验证了方法稳健性
  2. 同时拟合给出略小的不确定度(0.015 vs 0.020)
  3. 格点数据系统性地将g₂向较小值拉动
  4. 不确定度显著降低,精度提升近一倍

χ²分析

表I:各数据子集的⟨χ²⟩值

实验/格点N_datBaselineReweightingFit
Fixed-target233239.67234.09242.29
RHIC77.067.117.62
Tevatron7161.3359.9165.31
LHCb2122.9421.8822.77
CMS7830.7429.8529.48
ATLAS7295.3595.6095.71
Lattice a₁631.1311.512.56
Lattice a₂76.304.671.77
Lattice a₃88.503.886.01

重要观察

  1. 实验数据稳定性:所有DY数据的χ²在三种配置下保持稳定,表明无张力
  2. 格点数据改善:格点数据的χ²显著降低(从31.13→12.56,6.30→1.77,8.50→6.01)
  3. 约束力证明:尽管格点数据点数少,但对CSK有强约束作用

可视化分析

图1:g₂的MC分布

  • 红色(Baseline):分布较宽,中心在0.186
  • 绿色(Reweighting):分布收窄,中心偏移至0.165
  • 蓝色(Fit):分布最窄,中心在0.167
  • 清晰展示了格点数据的约束效果

图2:CSK随b的变化(μ=2 GeV)

  • 小b区域(b<2 GeV⁻¹):三种方法预测基本一致,由微扰QCD主导
  • 大b区域(b>2.5 GeV⁻¹)
    • Baseline预测不确定度大
    • 重加权和拟合结果不确定度显著减小
    • 底部插图显示相对基线的比率,格点数据使预测降低约20-30%
  • 与格点数据点(黑点)符合良好

消融分析

虽然论文未明确进行消融实验,但通过不同方法的对比可以分析各组分贡献:

  1. 格点数据的独立约束力
    • 纯格点拟合:g₂^Lattice = 0.152±0.027
    • 与实验基线有~18%差异,但在不确定度范围内兼容
  2. 连续极限 vs 有限间距
    • 两种处理方式结果一致(0.164 vs 0.165)
    • 验证了格点间距修正的有效性
  3. 重加权 vs 同时拟合
    • 中心值高度一致(0.165 vs 0.167)
    • 同时拟合不确定度略小(0.015 vs 0.020)
    • 表明直接拟合能更充分利用数据信息

TMD分布的稳定性

重要发现:尽管g₂有显著变化,但TMD PDFs本身保持稳定。这表明:

  1. CSK的改变主要影响演化行为
  2. 对最终物理观测量的影响被其他参数吸收
  3. 格点数据提供了额外的物理约束而非简单的参数调整

相关工作

格点与实验数据联合分析的先例

PDF提取

  1. 无极化PDFs:Lin et al. (2018), Cichy et al. (2019), Del Debbio et al. (2020-2021)
  2. 极化PDFs:Bringewatt et al. (2021), Barry et al. (2022), Hou et al. (2023)
  3. 横向性PDFs:Karpie et al. (2024)
  4. 广义PDFs:Guo et al. (2023), Cichy et al. (2024)

这些工作证明了格点QCD数据在改进PDF确定中的价值。

CSK的格点QCD计算

理论发展

  • 原始提议:Ji et al. (2015), Ebert et al. (2019), Ji et al. (2020-2022)
  • 准TMD束函数方法:Shanahan et al. (2020-2021)
  • 准TMD波函数方法:Zhang et al. (2020), Chu et al. (2022)
  • Coulomb规范方法:Bollweg et al. (2024-2025)

本文使用的数据

  • Avkhadiev et al. (2023-2024):首个包含连续极限外推的完整系统误差控制计算
  • 三个格点间距,完整协方差矩阵

TMD唯象分析

近期进展

  • MAP合作组:Bacchetta et al. (2020-2024),多维分析框架
  • Moos et al. (2024-2025):先进的TMD提取
  • Aslan et al. (2024):不同g_K参数化
  • Camarda et al. (2024):高精度Drell-Yan分析

本文创新:首次将格点数据系统纳入TMD唯象提取

与Ref. 17的关系

Cridge et al. (2025)也探索了类似方向,但本文:

  1. 首次完成完整的联合提取
  2. 使用神经网络参数化
  3. 提供了重加权和同时拟合两种独立验证

结论与讨论

主要结论

  1. 技术可行性:首次成功将格点QCD数据纳入TMD唯象分析,两种独立方法(重加权和同时拟合)给出一致结果
  2. 显著精度提升
    • g₂中心值偏移~10%:从0.186降至0.167
    • 不确定度降低40-55%:从±0.033降至±0.015
    • CSK在非微扰区域的约束显著改善
  3. 数据兼容性:实验与格点数据无张力,可自洽结合
  4. 方法稳健性
    • 连续极限和有限间距数据处理结果一致
    • 重加权(N_eff≈150)和同时拟合结果一致
    • 对DY数据的描述质量保持稳定
  5. 物理洞察:格点数据对CSK提供直接约束,弥补了实验数据的间接性

局限性

  1. 格点数据量有限
    • 仅21个数据点(vs 482个实验点)
    • 来自单一格点合作组的计算
    • 未来需要更多独立格点计算验证
  2. 参数化简单性
    • 采用最简单的g_K(b)=2g₂²b²形式
    • 论文提到"未发现需要更复杂形式的证据",但可能限制了灵活性
  3. 格点间距修正
    • k₁, k₂参数的先验来自格点分析
    • 理想情况应在联合分析中完全独立确定
  4. 物理点外推
    • 格点计算在非物理pion质量下进行
    • 连续极限外推的系统误差已包含,但可能仍有残余效应
  5. TMD稳定性的深入理解
    • 为何g₂变化10%而TMD PDFs保持稳定?
    • 需要更详细的理论分析

未来方向

  1. 更多格点数据
    • 不同格点合作组的独立计算
    • 更精细的格点间距
    • 更大的b范围
    • 物理pion质量的计算
  2. 扩展到其他TMD
    • 本文聚焦无极化TMD
    • 可扩展到极化和横向性TMD
    • 胶子TMD的格点计算
  3. 更复杂的参数化
    • 探索g_K的其他函数形式
    • 机器学习方法的更深入应用
    • 减少模型依赖
  4. 更多实验过程
    • 纳入半单举深度非弹性散射(SIDIS)
    • e⁺e⁻对撞数据
    • 未来EIC实验数据
  5. 理论改进
    • 更高阶微扰修正(N⁴LL)
    • 功率修正的系统处理
    • 格点-连续统匹配的改进
  6. 方法论发展
    • 贝叶斯推断的更精细应用
    • 机器学习在TMD提取中的更深入应用
    • 不确定度量化的改进

深度评价

优点

1. 开创性工作

  • 首次系统性地将格点QCD数据纳入TMD唯象分析
  • 为未来TMD研究建立了重要范式
  • 填补了CSK提取方法论的空白

2. 方法严谨

  • 双重验证:重加权和同时拟合两种独立方法
  • 完整的不确定度处理:包括统计和系统误差
  • 协方差矩阵的正确处理
  • 格点间距效应的系统考虑

3. 结果显著

  • 不确定度降低40-55%,提升实质性
  • 无数据张力,证明方法的自洽性
  • 有效复制品数N_eff≈150,表明重加权成功

4. 技术创新

  • 神经网络参数化提供灵活性
  • 有限格点间距数据的直接使用
  • 连续极限外推的同时进行

5. 写作清晰

  • 逻辑结构清晰
  • 技术细节充分
  • 图表信息丰富
  • 结果呈现直观

不足

1. 数据量限制

  • 格点数据仅21点,相对实验数据(482点)较少
  • 单一格点合作组的结果,缺乏独立验证
  • 可能限制了对系统误差的全面评估

2. 参数化简单

  • g_K(b)采用最简单的二次形式
  • 虽然论文称"未发现需要更复杂形式的证据",但可能在更高精度下需要
  • 未探索其他函数形式的系统比较

3. 物理解释不足

  • 为何g₂变化10%而TMD PDFs稳定?缺乏深入讨论
  • CSK的物理意义(QCD真空结构)未充分阐述
  • 不同b区域的物理图像可更清晰

4. 格点系统误差

  • 连续极限外推依赖于特定拟合形式
  • 有限体积效应的讨论不足
  • 非物理pion质量的影响未详细讨论

5. 对比分析有限

  • 未与其他TMD合作组(如SV19, MAP等)的最新结果详细比较
  • 缺少对不同g_K参数化的系统研究
  • 与纯格点提取(g₂^Lattice=0.152±0.027)的18%差异讨论不足

6. 实用性考虑

  • 格点数据获取成本高,限制了方法的普适性
  • 对未来EIC等实验的预测能力未充分展示
  • 方法的可复现性依赖于特定格点数据的可用性

影响力

对领域的贡献

  1. 范式转变:开创了TMD提取的新范式,将成为未来研究的标准方法
  2. 精度提升:为CSK提供了迄今最精确的确定
  3. 方法论贡献:为其他TMD(极化、横向性)和胶子TMD的提取提供了模板

实用价值

  1. 唯象应用:改进的CSK可直接用于LHC、RHIC和未来EIC的理论预测
  2. 减少模型依赖:通过第一性原理约束减少了非微扰模型的任意性
  3. 指导实验:为未来实验设计提供更可靠的理论输入

可复现性

  • 方法描述清晰,理论框架明确
  • 依赖于公开的格点数据(Refs. 53, 54
  • 基线拟合(Ref. 32)已发表
  • 但完整复现需要相当的计算资源和专业知识

预期影响

  1. 短期:将被TMD社区快速采纳,成为标准方法
  2. 中期:激励更多格点QCD计算CSK和其他TMD量
  3. 长期:可能改变TMD提取的整体方法论,格点输入成为必需组分

适用场景

直接适用

  1. Drell-Yan过程:W/Z玻色子产生的精确预测
  2. SIDIS分析:半单举深度非弹性散射的TMD提取
  3. 未来EIC:为电子-离子对撞机提供理论输入
  4. 重离子碰撞:RHIC和LHC的小x物理

潜在扩展

  1. 胶子TMD:方法可直接推广到胶子CSK
  2. 极化TMD:横向自旋、纵向自旋TMD的提取
  3. 其他非微扰量:如软函数、喷注函数等
  4. 重夸克TMD:charm和bottom夸克的TMD

限制场景

  1. 需要高精度理论预测的场景(当前N³LL)
  2. 格点数据不可用或不可靠的情况
  3. 极端运动学区域(非常大或非常小的b)
  4. 需要实时快速计算的应用(格点数据获取慢)

参考文献

关键格点QCD参考文献

  • 53, 54 A. Avkhadiev et al., Phys. Rev. D 108, 114505 (2023); Phys. Rev. Lett. 132, 231901 (2024) - 本文使用的格点数据来源

基线TMD拟合

  • 32 A. Bacchetta et al. (MAP), Phys. Rev. Lett. 135, 021904 (2025) - 本文的基线拟合

重加权方法

  • 55 R. D. Ball et al. (NNPDF), Nucl. Phys. B 849, 112 (2011) - 贝叶斯重加权方法的原始提出

理论基础

  • 18 I. Moult et al., JHEP 08, 280 (2022) - 四圈cusp反常维度
  • 19 C. Duhr et al., Phys. Rev. Lett. 129, 162001 (2022) - 四圈CSK计算

相关联合分析

  • 1-13 各种PDF的格点-实验联合提取工作
  • 17 T. Cridge et al., arXiv:2506.13874 (2025) - 类似方向的平行工作

总结

本文是TMD领域的里程碑式工作,首次成功地将格点QCD数据系统性地纳入Collins-Soper核的唯象提取。通过贝叶斯重加权和同时拟合两种独立方法,研究者证明了格点数据可以显著改善CSK的确定:中心值偏移约10%,不确定度降低40-55%。这一成功为未来TMD研究树立了新范式,也为其他非微扰QCD量的提取提供了方法论模板。

尽管存在格点数据量有限、参数化相对简单等局限,但本文的核心贡献——证明格点与实验数据可以自洽结合并显著提升精度——是无可置疑的。随着格点QCD计算能力的提升和更多独立计算的出现,这一方法有望成为TMD提取的标准范式,对理解QCD真空结构和强子内部动力学产生深远影响。