We present a first joint extraction of the Collins-Soper kernel (CSK) combining experimental and lattice QCD data in the context of an analysis of transverse-momentum-dependent distributions (TMDs). Based on a neural-network parametrization, we perform a Bayesian reweighting of an existing fits of TMDs using lattice data, as well as a joint TMD fit to lattice and experimental data. We consistently find that the inclusion of lattice information shifts the central value of the CSK by approximately 10% and reduces its uncertainty by 40-50%, highlighting the potential of lattice inputs to improve TMD extractions.
An extraction of the Collins-Soper kernel from a joint analysis of experimental and lattice data
- 论文ID: 2510.26489
- 标题: An extraction of the Collins-Soper kernel from a joint analysis of experimental and lattice data
- 作者: Artur Avkhadiev, Valerio Bertone, Chiara Bissolotti, Matteo Cerutti, Yang Fu, Simone Rodini, Phiala Shanahan, Michael Wagman, Yong Zhao
- 机构: MIT, Argonne National Laboratory, CEA Saclay, DESY, University of Pavia, Fermilab
- 分类: hep-ph (高能物理-唯象学), hep-ex (高能物理-实验), hep-lat (高能物理-格点)
- 发表时间: 2025年10月30日
- 论文链接: https://arxiv.org/abs/2510.26489
本文首次将实验数据和格点QCD数据联合用于提取Collins-Soper核(CSK),在横向动量依赖分布(TMDs)分析框架下进行。基于神经网络参数化方法,研究者对现有TMD拟合进行贝叶斯重加权,并执行了联合拟合。研究一致发现,纳入格点信息使CSK中心值偏移约10%,不确定度降低40-50%,凸显了格点输入改进TMD提取的潜力。
Collins-Soper核(CSK)是描述横向动量依赖分布(TMDs)演化的关键非微扰物理量,它编码了QCD真空的信息而非强子内部结构。CSK在大横向距离b(非微扰区域)的行为无法通过微扰QCD计算,必须从数据中提取。
- TMD精度提升:精确确定CSK对于减少TMD演化中的模型依赖性至关重要
- 多过程预测:改进的CSK可提高QCD对多种过程的预测精度
- 因子化检验:可用于测试非微扰区域的因子化有效性
- 无直接实验观测:没有实验观测量直接敏感于CSK,格点QCD成为唯一的直接信息来源
- 纯唯象提取:传统方法仅从实验数据(如Drell-Yan过程)间接提取CSK,不确定度较大
- 模型依赖:非微扰部分通常采用简单参数化(如g_K(b) = 2g_2²b²),缺乏第一性原理约束
- 格点数据未利用:虽然格点QCD可直接计算CSK,但此前未被系统纳入唯象分析
借鉴部分子分布函数(PDFs)提取中成功结合格点和实验数据的经验,本文首次将这一策略应用于TMD提取,特别是CSK的确定。
- 首次联合分析:首次将格点QCD数据系统性地纳入TMD唯象提取,实现实验与格点数据的联合分析
- 双重方法论验证:
- 贝叶斯重加权(Bayesian reweighting)现有拟合
- 实验与格点数据的同时拟合(simultaneous fit)
- 两种方法结果高度一致,验证了方法的稳健性
- 显著精度提升:
- CSK非微扰参数g₂的中心值偏移约10%
- 不确定度降低40-50%
- 从 g₂^Baseline = 0.186±0.033 提升到 g₂^Fit = 0.167±0.015
- 无张力验证:证明了格点数据与实验数据之间不存在张力,两者可以自洽结合
- 方法论创新:处理有限格点间距数据的系统方法,包括连续极限外推的同时进行
输入:
- 实验数据:482个Drell-Yan过程数据点(固定靶、RHIC、Tevatron、LHCb、CMS、ATLAS)
- 格点数据:21个CSK数据点,来自3个不同格点间距(a₁=0.15 fm, a₂=0.12 fm, a₃=0.09 fm)
输出:
- CSK的非微扰参数g₂及其不确定度
- 完整的TMD分布函数
约束条件:
- 保持对实验数据的描述质量
- 正确处理格点间距效应
- 满足微扰QCD在小b区域的约束
CSK满足重整化群方程:
∂lnμ∂K(b,μ)=−γK(αs(μ))
其中γ_K是尖点反常维度,已知到四圈精度。解为:
K(b,μ)=K(b∗,μb∗)−∫μb∗μμ′dμ′γK(αs(μ′))−gK(b)
关键组成部分:
- 微扰部分:K(b_,μ_{b_})和积分项,可精确计算
- 非微扰部分:g_K(b),本文采用参数化
gK(b)=2g22b2
- b_*处方:确保微扰计算在可靠区域(μ_{b_} = 2e^{-γ_E}/b_)
基于Ref. 32的框架:
- 理论精度:N³LL(次次次领头对数)
- 参数化:神经网络(NN)用于非微扰部分
- 数据集:comprehensive Drell-Yan数据
- 基线结果:g₂^Baseline = 0.186±0.033
- MC样本:N=250个蒙特卡洛复制品
两种处理方式:
- 连续极限外推数据:
- n=21个数据点{K_j±σ_j}
- 无点间相关性
- χ²计算:
χα2=∑j=1n(σjKj−K(α)(bj))2
- 有限格点间距数据:
- 三个子集(n₁=6, n₂=7, n₃=8个点)
- 每个子集有协方差矩阵Σᵢ
- 需要修正格点间距效应:
gK(b)=2g22b2−k1ba−k2b2a2
- χ²计算包含相关性:
χα2=∑i=13∑ji,li=1ni(Kji−K(α)(bji))(Σi−1)ji,li(Kli−K(α)(bli))
原理:根据格点数据的似然度为现有拟合的MC复制品赋权重
权重计算:
wα=N(χα2)n/2−1e−χα2/2
其中N为归一化常数,使得∑w_α = N
加权统计量:
⟨g2⟩=∑α=1Nwαg2(α),σg22=∑α=1Nwα(g2(α)−⟨g2⟩)2
有效复制品数:N_eff ≈ 150(原始N=250),表明重加权成功
设置:
- 总数据点:503(482 DY + 21格点)
- 训练-验证划分:实验数据50%-50%,格点数据全部用于训练
- 完全相同的NN参数化和拟合框架
- 格点数据通过协方差矩阵处理相关性
拟合参数:
- g₂:CSK非微扰参数
- k₁, k₂:格点间距修正参数(先验:k₁=0.22±0.08, k₂=0±0.1)
实验数据(482点):
- 固定靶实验:233点
- RHIC:7点
- Tevatron:71点
- LHCb:21点
- CMS:78点
- ATLAS:72点
格点QCD数据(21点):
- 来源:Refs. 53, 54,首个具有完全系统误差控制的CSK格点计算
- 包含连续极限外推(a→0)
- 三个格点间距:
- a₁ = 0.15 fm(6点)
- a₂ = 0.12 fm(7点)
- a₃ = 0.09 fm(8点)
- 横向距离范围:b ∈ 0, 5 GeV⁻¹
- 重整化标度:μ = 2 GeV
- χ²统计量:衡量理论预测与数据的符合程度
- 平均χ²:⟨χ²⟩在MC ensemble上的平均
- 参数不确定度:通过MC复制品分布确定
- 有效复制品数:N_eff,评估重加权效果
- Baseline:纯实验数据拟合(Ref. 32)
- Reweighting-continuum:使用连续极限外推格点数据重加权
- Reweighting-finite:使用有限格点间距数据重加权
- Simultaneous fit:实验与格点数据联合拟合
- 神经网络架构:与Ref. 32完全一致
- MC样本数:N=250(基线),10⁴(重加权中用于k₁,k₂采样)
- 微扰阶数:N³LL精度
- b_*处方:标准选择,保证微扰可靠性
- 先验分布:k₁∼Normal(0.22, 0.08), k₂∼Normal(0, 0.1)
g₂参数提取结果对比:
| 方法 | g₂值 | 中心值偏移 | 不确定度降低 |
|---|
| Baseline(实验) | 0.186±0.033 | - | - |
| Lattice only | 0.152±0.027 | - | - |
| Reweighting-continuum | 0.164±0.020 | ~12% | ~40% |
| Reweighting-finite | 0.165±0.020 | ~11% | ~40% |
| Simultaneous fit | 0.167±0.015 | ~10% | ~55% |
关键发现:
- 两种重加权方法结果完全一致,验证了方法稳健性
- 同时拟合给出略小的不确定度(0.015 vs 0.020)
- 格点数据系统性地将g₂向较小值拉动
- 不确定度显著降低,精度提升近一倍
表I:各数据子集的⟨χ²⟩值
| 实验/格点 | N_dat | Baseline | Reweighting | Fit |
|---|
| Fixed-target | 233 | 239.67 | 234.09 | 242.29 |
| RHIC | 7 | 7.06 | 7.11 | 7.62 |
| Tevatron | 71 | 61.33 | 59.91 | 65.31 |
| LHCb | 21 | 22.94 | 21.88 | 22.77 |
| CMS | 78 | 30.74 | 29.85 | 29.48 |
| ATLAS | 72 | 95.35 | 95.60 | 95.71 |
| Lattice a₁ | 6 | 31.13 | 11.5 | 12.56 |
| Lattice a₂ | 7 | 6.30 | 4.67 | 1.77 |
| Lattice a₃ | 8 | 8.50 | 3.88 | 6.01 |
重要观察:
- 实验数据稳定性:所有DY数据的χ²在三种配置下保持稳定,表明无张力
- 格点数据改善:格点数据的χ²显著降低(从31.13→12.56,6.30→1.77,8.50→6.01)
- 约束力证明:尽管格点数据点数少,但对CSK有强约束作用
图1:g₂的MC分布
- 红色(Baseline):分布较宽,中心在0.186
- 绿色(Reweighting):分布收窄,中心偏移至0.165
- 蓝色(Fit):分布最窄,中心在0.167
- 清晰展示了格点数据的约束效果
图2:CSK随b的变化(μ=2 GeV)
- 小b区域(b<2 GeV⁻¹):三种方法预测基本一致,由微扰QCD主导
- 大b区域(b>2.5 GeV⁻¹):
- Baseline预测不确定度大
- 重加权和拟合结果不确定度显著减小
- 底部插图显示相对基线的比率,格点数据使预测降低约20-30%
- 与格点数据点(黑点)符合良好
虽然论文未明确进行消融实验,但通过不同方法的对比可以分析各组分贡献:
- 格点数据的独立约束力:
- 纯格点拟合:g₂^Lattice = 0.152±0.027
- 与实验基线有~18%差异,但在不确定度范围内兼容
- 连续极限 vs 有限间距:
- 两种处理方式结果一致(0.164 vs 0.165)
- 验证了格点间距修正的有效性
- 重加权 vs 同时拟合:
- 中心值高度一致(0.165 vs 0.167)
- 同时拟合不确定度略小(0.015 vs 0.020)
- 表明直接拟合能更充分利用数据信息
重要发现:尽管g₂有显著变化,但TMD PDFs本身保持稳定。这表明:
- CSK的改变主要影响演化行为
- 对最终物理观测量的影响被其他参数吸收
- 格点数据提供了额外的物理约束而非简单的参数调整
PDF提取:
- 无极化PDFs:Lin et al. (2018), Cichy et al. (2019), Del Debbio et al. (2020-2021)
- 极化PDFs:Bringewatt et al. (2021), Barry et al. (2022), Hou et al. (2023)
- 横向性PDFs:Karpie et al. (2024)
- 广义PDFs:Guo et al. (2023), Cichy et al. (2024)
这些工作证明了格点QCD数据在改进PDF确定中的价值。
理论发展:
- 原始提议:Ji et al. (2015), Ebert et al. (2019), Ji et al. (2020-2022)
- 准TMD束函数方法:Shanahan et al. (2020-2021)
- 准TMD波函数方法:Zhang et al. (2020), Chu et al. (2022)
- Coulomb规范方法:Bollweg et al. (2024-2025)
本文使用的数据:
- Avkhadiev et al. (2023-2024):首个包含连续极限外推的完整系统误差控制计算
- 三个格点间距,完整协方差矩阵
近期进展:
- MAP合作组:Bacchetta et al. (2020-2024),多维分析框架
- Moos et al. (2024-2025):先进的TMD提取
- Aslan et al. (2024):不同g_K参数化
- Camarda et al. (2024):高精度Drell-Yan分析
本文创新:首次将格点数据系统纳入TMD唯象提取
Cridge et al. (2025)也探索了类似方向,但本文:
- 首次完成完整的联合提取
- 使用神经网络参数化
- 提供了重加权和同时拟合两种独立验证
- 技术可行性:首次成功将格点QCD数据纳入TMD唯象分析,两种独立方法(重加权和同时拟合)给出一致结果
- 显著精度提升:
- g₂中心值偏移~10%:从0.186降至0.167
- 不确定度降低40-55%:从±0.033降至±0.015
- CSK在非微扰区域的约束显著改善
- 数据兼容性:实验与格点数据无张力,可自洽结合
- 方法稳健性:
- 连续极限和有限间距数据处理结果一致
- 重加权(N_eff≈150)和同时拟合结果一致
- 对DY数据的描述质量保持稳定
- 物理洞察:格点数据对CSK提供直接约束,弥补了实验数据的间接性
- 格点数据量有限:
- 仅21个数据点(vs 482个实验点)
- 来自单一格点合作组的计算
- 未来需要更多独立格点计算验证
- 参数化简单性:
- 采用最简单的g_K(b)=2g₂²b²形式
- 论文提到"未发现需要更复杂形式的证据",但可能限制了灵活性
- 格点间距修正:
- k₁, k₂参数的先验来自格点分析
- 理想情况应在联合分析中完全独立确定
- 物理点外推:
- 格点计算在非物理pion质量下进行
- 连续极限外推的系统误差已包含,但可能仍有残余效应
- TMD稳定性的深入理解:
- 为何g₂变化10%而TMD PDFs保持稳定?
- 需要更详细的理论分析
- 更多格点数据:
- 不同格点合作组的独立计算
- 更精细的格点间距
- 更大的b范围
- 物理pion质量的计算
- 扩展到其他TMD:
- 本文聚焦无极化TMD
- 可扩展到极化和横向性TMD
- 胶子TMD的格点计算
- 更复杂的参数化:
- 探索g_K的其他函数形式
- 机器学习方法的更深入应用
- 减少模型依赖
- 更多实验过程:
- 纳入半单举深度非弹性散射(SIDIS)
- e⁺e⁻对撞数据
- 未来EIC实验数据
- 理论改进:
- 更高阶微扰修正(N⁴LL)
- 功率修正的系统处理
- 格点-连续统匹配的改进
- 方法论发展:
- 贝叶斯推断的更精细应用
- 机器学习在TMD提取中的更深入应用
- 不确定度量化的改进
1. 开创性工作
- 首次系统性地将格点QCD数据纳入TMD唯象分析
- 为未来TMD研究建立了重要范式
- 填补了CSK提取方法论的空白
2. 方法严谨
- 双重验证:重加权和同时拟合两种独立方法
- 完整的不确定度处理:包括统计和系统误差
- 协方差矩阵的正确处理
- 格点间距效应的系统考虑
3. 结果显著
- 不确定度降低40-55%,提升实质性
- 无数据张力,证明方法的自洽性
- 有效复制品数N_eff≈150,表明重加权成功
4. 技术创新
- 神经网络参数化提供灵活性
- 有限格点间距数据的直接使用
- 连续极限外推的同时进行
5. 写作清晰
1. 数据量限制
- 格点数据仅21点,相对实验数据(482点)较少
- 单一格点合作组的结果,缺乏独立验证
- 可能限制了对系统误差的全面评估
2. 参数化简单
- g_K(b)采用最简单的二次形式
- 虽然论文称"未发现需要更复杂形式的证据",但可能在更高精度下需要
- 未探索其他函数形式的系统比较
3. 物理解释不足
- 为何g₂变化10%而TMD PDFs稳定?缺乏深入讨论
- CSK的物理意义(QCD真空结构)未充分阐述
- 不同b区域的物理图像可更清晰
4. 格点系统误差
- 连续极限外推依赖于特定拟合形式
- 有限体积效应的讨论不足
- 非物理pion质量的影响未详细讨论
5. 对比分析有限
- 未与其他TMD合作组(如SV19, MAP等)的最新结果详细比较
- 缺少对不同g_K参数化的系统研究
- 与纯格点提取(g₂^Lattice=0.152±0.027)的18%差异讨论不足
6. 实用性考虑
- 格点数据获取成本高,限制了方法的普适性
- 对未来EIC等实验的预测能力未充分展示
- 方法的可复现性依赖于特定格点数据的可用性
对领域的贡献:
- 范式转变:开创了TMD提取的新范式,将成为未来研究的标准方法
- 精度提升:为CSK提供了迄今最精确的确定
- 方法论贡献:为其他TMD(极化、横向性)和胶子TMD的提取提供了模板
实用价值:
- 唯象应用:改进的CSK可直接用于LHC、RHIC和未来EIC的理论预测
- 减少模型依赖:通过第一性原理约束减少了非微扰模型的任意性
- 指导实验:为未来实验设计提供更可靠的理论输入
可复现性:
- 方法描述清晰,理论框架明确
- 依赖于公开的格点数据(Refs. 53, 54)
- 基线拟合(Ref. 32)已发表
- 但完整复现需要相当的计算资源和专业知识
预期影响:
- 短期:将被TMD社区快速采纳,成为标准方法
- 中期:激励更多格点QCD计算CSK和其他TMD量
- 长期:可能改变TMD提取的整体方法论,格点输入成为必需组分
直接适用:
- Drell-Yan过程:W/Z玻色子产生的精确预测
- SIDIS分析:半单举深度非弹性散射的TMD提取
- 未来EIC:为电子-离子对撞机提供理论输入
- 重离子碰撞:RHIC和LHC的小x物理
潜在扩展:
- 胶子TMD:方法可直接推广到胶子CSK
- 极化TMD:横向自旋、纵向自旋TMD的提取
- 其他非微扰量:如软函数、喷注函数等
- 重夸克TMD:charm和bottom夸克的TMD
限制场景:
- 需要高精度理论预测的场景(当前N³LL)
- 格点数据不可用或不可靠的情况
- 极端运动学区域(非常大或非常小的b)
- 需要实时快速计算的应用(格点数据获取慢)
关键格点QCD参考文献:
- 53, 54 A. Avkhadiev et al., Phys. Rev. D 108, 114505 (2023); Phys. Rev. Lett. 132, 231901 (2024) - 本文使用的格点数据来源
基线TMD拟合:
- 32 A. Bacchetta et al. (MAP), Phys. Rev. Lett. 135, 021904 (2025) - 本文的基线拟合
重加权方法:
- 55 R. D. Ball et al. (NNPDF), Nucl. Phys. B 849, 112 (2011) - 贝叶斯重加权方法的原始提出
理论基础:
- 18 I. Moult et al., JHEP 08, 280 (2022) - 四圈cusp反常维度
- 19 C. Duhr et al., Phys. Rev. Lett. 129, 162001 (2022) - 四圈CSK计算
相关联合分析:
- 1-13 各种PDF的格点-实验联合提取工作
- 17 T. Cridge et al., arXiv:2506.13874 (2025) - 类似方向的平行工作
本文是TMD领域的里程碑式工作,首次成功地将格点QCD数据系统性地纳入Collins-Soper核的唯象提取。通过贝叶斯重加权和同时拟合两种独立方法,研究者证明了格点数据可以显著改善CSK的确定:中心值偏移约10%,不确定度降低40-55%。这一成功为未来TMD研究树立了新范式,也为其他非微扰QCD量的提取提供了方法论模板。
尽管存在格点数据量有限、参数化相对简单等局限,但本文的核心贡献——证明格点与实验数据可以自洽结合并显著提升精度——是无可置疑的。随着格点QCD计算能力的提升和更多独立计算的出现,这一方法有望成为TMD提取的标准范式,对理解QCD真空结构和强子内部动力学产生深远影响。