2025-11-14T00:28:11.716967

An extraction of the Collins-Soper kernel from a joint analysis of experimental and lattice data

Avkhadiev, Bertone, Bissolotti et al.

We present a first joint extraction of the Collins-Soper kernel (CSK) combining experimental and lattice QCD data in the context of an analysis of transverse-momentum-dependent distributions (TMDs). Based on a neural-network parametrization, we perform a Bayesian reweighting of an existing fits of TMDs using lattice data, as well as a joint TMD fit to lattice and experimental data. We consistently find that the inclusion of lattice information shifts the central value of the CSK by approximately 10% and reduces its uncertainty by 40-50%, highlighting the potential of lattice inputs to improve TMD extractions.

academic

An extraction of the Collins-Soper kernel from a joint analysis of experimental and lattice data

基本信息

论文ID: 2510.26489
标题: An extraction of the Collins-Soper kernel from a joint analysis of experimental and lattice data
作者: Artur Avkhadiev, Valerio Bertone, Chiara Bissolotti, Matteo Cerutti, Yang Fu, Simone Rodini, Phiala Shanahan, Michael Wagman, Yong Zhao
机构: MIT, Argonne National Laboratory, CEA Saclay, DESY, University of Pavia, Fermilab
分类: hep-ph (高能物理-唯象学), hep-ex (高能物理-实验), hep-lat (高能物理-格点)
发表时间: 2025年10月30日
论文链接: https://arxiv.org/abs/2510.26489

摘要

本文首次将实验数据和格点QCD数据联合用于提取Collins-Soper核（CSK），在横向动量依赖分布（TMDs）分析框架下进行。基于神经网络参数化方法，研究者对现有TMD拟合进行贝叶斯重加权，并执行了联合拟合。研究一致发现，纳入格点信息使CSK中心值偏移约10%，不确定度降低40-50%，凸显了格点输入改进TMD提取的潜力。

研究背景与动机

研究问题

Collins-Soper核（CSK）是描述横向动量依赖分布（TMDs）演化的关键非微扰物理量，它编码了QCD真空的信息而非强子内部结构。CSK在大横向距离b（非微扰区域）的行为无法通过微扰QCD计算，必须从数据中提取。

问题重要性

TMD精度提升：精确确定CSK对于减少TMD演化中的模型依赖性至关重要
多过程预测：改进的CSK可提高QCD对多种过程的预测精度
因子化检验：可用于测试非微扰区域的因子化有效性
无直接实验观测：没有实验观测量直接敏感于CSK，格点QCD成为唯一的直接信息来源

现有方法局限

纯唯象提取：传统方法仅从实验数据（如Drell-Yan过程）间接提取CSK，不确定度较大
模型依赖：非微扰部分通常采用简单参数化（如g_K(b) = 2g_2²b²），缺乏第一性原理约束
格点数据未利用：虽然格点QCD可直接计算CSK，但此前未被系统纳入唯象分析

研究动机

借鉴部分子分布函数（PDFs）提取中成功结合格点和实验数据的经验，本文首次将这一策略应用于TMD提取，特别是CSK的确定。

核心贡献

首次联合分析：首次将格点QCD数据系统性地纳入TMD唯象提取，实现实验与格点数据的联合分析
双重方法论验证：
- 贝叶斯重加权（Bayesian reweighting）现有拟合
- 实验与格点数据的同时拟合（simultaneous fit）
- 两种方法结果高度一致，验证了方法的稳健性
显著精度提升：
- CSK非微扰参数g₂的中心值偏移约10%
- 不确定度降低40-50%
- 从 g₂^Baseline = 0.186±0.033 提升到 g₂^Fit = 0.167±0.015
无张力验证：证明了格点数据与实验数据之间不存在张力，两者可以自洽结合
方法论创新：处理有限格点间距数据的系统方法，包括连续极限外推的同时进行

方法详解

任务定义

输入：

实验数据：482个Drell-Yan过程数据点（固定靶、RHIC、Tevatron、LHCb、CMS、ATLAS）
格点数据：21个CSK数据点，来自3个不同格点间距（a₁=0.15 fm, a₂=0.12 fm, a₃=0.09 fm）

输出：

CSK的非微扰参数g₂及其不确定度
完整的TMD分布函数

约束条件：

保持对实验数据的描述质量
正确处理格点间距效应
满足微扰QCD在小b区域的约束

Collins-Soper核的理论框架

CSK满足重整化群方程： $\frac{\partial K(b,\mu)}{\partial \ln\mu} = -\gamma_K(\alpha_s(\mu))$

其中γ_K是尖点反常维度，已知到四圈精度。解为：

$K(b,\mu) = K(b_*,\mu_{b_*}) - \int_{\mu_{b_*}}^{\mu} \frac{d\mu'}{\mu'}\gamma_K(\alpha_s(\mu')) - g_K(b)$

关键组成部分：

微扰部分：K(b_,μ_{b_})和积分项，可精确计算
非微扰部分：g_K(b)，本文采用参数化 $g_K(b) = 2g_2^2 b^2$
b_*处方：确保微扰计算在可靠区域（μ_{b_} = 2e^{-γ_E}/b_）

基线TMD拟合

基于Ref. 32的框架：

理论精度：N³LL（次次次领头对数）
参数化：神经网络（NN）用于非微扰部分
数据集：comprehensive Drell-Yan数据
基线结果：g₂^Baseline = 0.186±0.033
MC样本：N=250个蒙特卡洛复制品

格点数据处理

两种处理方式：

连续极限外推数据：
- n=21个数据点{K_j±σ_j}
- 无点间相关性
- χ²计算： $\chi_\alpha^2 = \sum_{j=1}^{n} \left(\frac{K_j - K^{(\alpha)}(b_j)}{\sigma_j}\right)^2$
有限格点间距数据：
- 三个子集（n₁=6, n₂=7, n₃=8个点）
- 每个子集有协方差矩阵Σᵢ
- 需要修正格点间距效应： $g_K(b) = 2g_2^2 b^2 - k_1\frac{a}{b} - k_2\frac{a^2}{b^2}$
- χ²计算包含相关性： $\chi_\alpha^2 = \sum_{i=1}^{3}\sum_{j_i,l_i=1}^{n_i}(K_{j_i}-K^{(\alpha)}(b_{j_i}))(\Sigma_i^{-1})_{j_i,l_i}(K_{l_i}-K^{(\alpha)}(b_{l_i}))$

贝叶斯重加权方法

原理：根据格点数据的似然度为现有拟合的MC复制品赋权重

权重计算： $w_\alpha = \mathcal{N}\left(\chi_\alpha^2\right)^{n/2-1}e^{-\chi_\alpha^2/2}$

其中N为归一化常数，使得∑w_α = N

加权统计量： $\langle g_2\rangle = \sum_{\alpha=1}^{N}w_\alpha g_2^{(\alpha)}, \quad \sigma_{g_2}^2 = \sum_{\alpha=1}^{N}w_\alpha(g_2^{(\alpha)}-\langle g_2\rangle)^2$

有效复制品数：N_eff ≈ 150（原始N=250），表明重加权成功

同时拟合方法

设置：

总数据点：503（482 DY + 21格点）
训练-验证划分：实验数据50%-50%，格点数据全部用于训练
完全相同的NN参数化和拟合框架
格点数据通过协方差矩阵处理相关性

拟合参数：

g₂：CSK非微扰参数
k₁, k₂：格点间距修正参数（先验：k₁=0.22±0.08, k₂=0±0.1）

实验设置

数据集详情

实验数据（482点）：

固定靶实验：233点
RHIC：7点
Tevatron：71点
LHCb：21点
CMS：78点
ATLAS：72点

格点QCD数据（21点）：

来源：Refs. 53, 54，首个具有完全系统误差控制的CSK格点计算
包含连续极限外推（a→0）
三个格点间距：
- a₁ = 0.15 fm（6点）
- a₂ = 0.12 fm（7点）
- a₃ = 0.09 fm（8点）
横向距离范围：b ∈ 0, 5 GeV⁻¹
重整化标度：μ = 2 GeV

评价指标

χ²统计量：衡量理论预测与数据的符合程度
平均χ²：⟨χ²⟩在MC ensemble上的平均
参数不确定度：通过MC复制品分布确定
有效复制品数：N_eff，评估重加权效果

对比方法

Baseline：纯实验数据拟合（Ref. 32）
Reweighting-continuum：使用连续极限外推格点数据重加权
Reweighting-finite：使用有限格点间距数据重加权
Simultaneous fit：实验与格点数据联合拟合

实现细节

神经网络架构：与Ref. 32完全一致
MC样本数：N=250（基线），10⁴（重加权中用于k₁,k₂采样）
微扰阶数：N³LL精度
b_*处方：标准选择，保证微扰可靠性
先验分布：k₁∼Normal(0.22, 0.08), k₂∼Normal(0, 0.1)

实验结果

主要结果

g₂参数提取结果对比：

方法	g₂值	中心值偏移	不确定度降低
Baseline（实验）	0.186±0.033	-	-
Lattice only	0.152±0.027	-	-
Reweighting-continuum	0.164±0.020	~12%	~40%
Reweighting-finite	0.165±0.020	~11%	~40%
Simultaneous fit	0.167±0.015	~10%	~55%

关键发现：

两种重加权方法结果完全一致，验证了方法稳健性
同时拟合给出略小的不确定度（0.015 vs 0.020）
格点数据系统性地将g₂向较小值拉动
不确定度显著降低，精度提升近一倍

χ²分析

表I：各数据子集的⟨χ²⟩值

实验/格点	N_dat	Baseline	Reweighting	Fit
Fixed-target	233	239.67	234.09	242.29
RHIC	7	7.06	7.11	7.62
Tevatron	71	61.33	59.91	65.31
LHCb	21	22.94	21.88	22.77
CMS	78	30.74	29.85	29.48
ATLAS	72	95.35	95.60	95.71
Lattice a₁	6	31.13	11.5	12.56
Lattice a₂	7	6.30	4.67	1.77
Lattice a₃	8	8.50	3.88	6.01

重要观察：

实验数据稳定性：所有DY数据的χ²在三种配置下保持稳定，表明无张力
格点数据改善：格点数据的χ²显著降低（从31.13→12.56，6.30→1.77，8.50→6.01）
约束力证明：尽管格点数据点数少，但对CSK有强约束作用

可视化分析

图1：g₂的MC分布

红色（Baseline）：分布较宽，中心在0.186
绿色（Reweighting）：分布收窄，中心偏移至0.165
蓝色（Fit）：分布最窄，中心在0.167
清晰展示了格点数据的约束效果

图2：CSK随b的变化（μ=2 GeV）

小b区域（b<2 GeV⁻¹）：三种方法预测基本一致，由微扰QCD主导
大b区域（b>2.5 GeV⁻¹）：
- Baseline预测不确定度大
- 重加权和拟合结果不确定度显著减小
- 底部插图显示相对基线的比率，格点数据使预测降低约20-30%
与格点数据点（黑点）符合良好

消融分析

虽然论文未明确进行消融实验，但通过不同方法的对比可以分析各组分贡献：

格点数据的独立约束力：
- 纯格点拟合：g₂^Lattice = 0.152±0.027
- 与实验基线有~18%差异，但在不确定度范围内兼容
连续极限 vs 有限间距：
- 两种处理方式结果一致（0.164 vs 0.165）
- 验证了格点间距修正的有效性
重加权 vs 同时拟合：
- 中心值高度一致（0.165 vs 0.167）
- 同时拟合不确定度略小（0.015 vs 0.020）
- 表明直接拟合能更充分利用数据信息

TMD分布的稳定性

重要发现：尽管g₂有显著变化，但TMD PDFs本身保持稳定。这表明：

CSK的改变主要影响演化行为
对最终物理观测量的影响被其他参数吸收
格点数据提供了额外的物理约束而非简单的参数调整

结论与讨论

主要结论

技术可行性：首次成功将格点QCD数据纳入TMD唯象分析，两种独立方法（重加权和同时拟合）给出一致结果
显著精度提升：
- g₂中心值偏移~10%：从0.186降至0.167
- 不确定度降低40-55%：从±0.033降至±0.015
- CSK在非微扰区域的约束显著改善
数据兼容性：实验与格点数据无张力，可自洽结合
方法稳健性：
- 连续极限和有限间距数据处理结果一致
- 重加权（N_eff≈150）和同时拟合结果一致
- 对DY数据的描述质量保持稳定
物理洞察：格点数据对CSK提供直接约束，弥补了实验数据的间接性

局限性

格点数据量有限：
- 仅21个数据点（vs 482个实验点）
- 来自单一格点合作组的计算
- 未来需要更多独立格点计算验证
参数化简单性：
- 采用最简单的g_K(b)=2g₂²b²形式
- 论文提到"未发现需要更复杂形式的证据"，但可能限制了灵活性
格点间距修正：
- k₁, k₂参数的先验来自格点分析
- 理想情况应在联合分析中完全独立确定
物理点外推：
- 格点计算在非物理pion质量下进行
- 连续极限外推的系统误差已包含，但可能仍有残余效应
TMD稳定性的深入理解：
- 为何g₂变化10%而TMD PDFs保持稳定？
- 需要更详细的理论分析

未来方向

更多格点数据：
- 不同格点合作组的独立计算
- 更精细的格点间距
- 更大的b范围
- 物理pion质量的计算
扩展到其他TMD：
- 本文聚焦无极化TMD
- 可扩展到极化和横向性TMD
- 胶子TMD的格点计算
更复杂的参数化：
- 探索g_K的其他函数形式
- 机器学习方法的更深入应用
- 减少模型依赖
更多实验过程：
- 纳入半单举深度非弹性散射（SIDIS）
- e⁺e⁻对撞数据
- 未来EIC实验数据
理论改进：
- 更高阶微扰修正（N⁴LL）
- 功率修正的系统处理
- 格点-连续统匹配的改进
方法论发展：
- 贝叶斯推断的更精细应用
- 机器学习在TMD提取中的更深入应用
- 不确定度量化的改进

深度评价

优点

1. 开创性工作

首次系统性地将格点QCD数据纳入TMD唯象分析
为未来TMD研究建立了重要范式
填补了CSK提取方法论的空白

2. 方法严谨

双重验证：重加权和同时拟合两种独立方法
完整的不确定度处理：包括统计和系统误差
协方差矩阵的正确处理
格点间距效应的系统考虑

3. 结果显著

不确定度降低40-55%，提升实质性
无数据张力，证明方法的自洽性
有效复制品数N_eff≈150，表明重加权成功

4. 技术创新

神经网络参数化提供灵活性
有限格点间距数据的直接使用
连续极限外推的同时进行

5. 写作清晰

逻辑结构清晰
技术细节充分
图表信息丰富
结果呈现直观

不足

1. 数据量限制

格点数据仅21点，相对实验数据（482点）较少
单一格点合作组的结果，缺乏独立验证
可能限制了对系统误差的全面评估

2. 参数化简单

g_K(b)采用最简单的二次形式
虽然论文称"未发现需要更复杂形式的证据"，但可能在更高精度下需要
未探索其他函数形式的系统比较

3. 物理解释不足

为何g₂变化10%而TMD PDFs稳定？缺乏深入讨论
CSK的物理意义（QCD真空结构）未充分阐述
不同b区域的物理图像可更清晰

4. 格点系统误差

连续极限外推依赖于特定拟合形式
有限体积效应的讨论不足
非物理pion质量的影响未详细讨论

5. 对比分析有限

未与其他TMD合作组（如SV19, MAP等）的最新结果详细比较
缺少对不同g_K参数化的系统研究
与纯格点提取（g₂^Lattice=0.152±0.027）的18%差异讨论不足

6. 实用性考虑

格点数据获取成本高，限制了方法的普适性
对未来EIC等实验的预测能力未充分展示
方法的可复现性依赖于特定格点数据的可用性

影响力

对领域的贡献：

范式转变：开创了TMD提取的新范式，将成为未来研究的标准方法
精度提升：为CSK提供了迄今最精确的确定
方法论贡献：为其他TMD（极化、横向性）和胶子TMD的提取提供了模板

实用价值：

唯象应用：改进的CSK可直接用于LHC、RHIC和未来EIC的理论预测
减少模型依赖：通过第一性原理约束减少了非微扰模型的任意性
指导实验：为未来实验设计提供更可靠的理论输入

可复现性：

方法描述清晰，理论框架明确
依赖于公开的格点数据（Refs. 53, 54）
基线拟合（Ref. 32）已发表
但完整复现需要相当的计算资源和专业知识

预期影响：

短期：将被TMD社区快速采纳，成为标准方法
中期：激励更多格点QCD计算CSK和其他TMD量
长期：可能改变TMD提取的整体方法论，格点输入成为必需组分

适用场景

直接适用：

Drell-Yan过程：W/Z玻色子产生的精确预测
SIDIS分析：半单举深度非弹性散射的TMD提取
未来EIC：为电子-离子对撞机提供理论输入
重离子碰撞：RHIC和LHC的小x物理

潜在扩展：

胶子TMD：方法可直接推广到胶子CSK
极化TMD：横向自旋、纵向自旋TMD的提取
其他非微扰量：如软函数、喷注函数等
重夸克TMD：charm和bottom夸克的TMD

限制场景：

需要高精度理论预测的场景（当前N³LL）
格点数据不可用或不可靠的情况
极端运动学区域（非常大或非常小的b）
需要实时快速计算的应用（格点数据获取慢）

参考文献

关键格点QCD参考文献：

53, 54 A. Avkhadiev et al., Phys. Rev. D 108, 114505 (2023); Phys. Rev. Lett. 132, 231901 (2024) - 本文使用的格点数据来源

基线TMD拟合：

32 A. Bacchetta et al. (MAP), Phys. Rev. Lett. 135, 021904 (2025) - 本文的基线拟合

重加权方法：

55 R. D. Ball et al. (NNPDF), Nucl. Phys. B 849, 112 (2011) - 贝叶斯重加权方法的原始提出

理论基础：

18 I. Moult et al., JHEP 08, 280 (2022) - 四圈cusp反常维度
19 C. Duhr et al., Phys. Rev. Lett. 129, 162001 (2022) - 四圈CSK计算

相关联合分析：

1-13 各种PDF的格点-实验联合提取工作
17 T. Cridge et al., arXiv:2506.13874 (2025) - 类似方向的平行工作

总结

本文是TMD领域的里程碑式工作，首次成功地将格点QCD数据系统性地纳入Collins-Soper核的唯象提取。通过贝叶斯重加权和同时拟合两种独立方法，研究者证明了格点数据可以显著改善CSK的确定：中心值偏移约10%，不确定度降低40-55%。这一成功为未来TMD研究树立了新范式，也为其他非微扰QCD量的提取提供了方法论模板。

尽管存在格点数据量有限、参数化相对简单等局限，但本文的核心贡献——证明格点与实验数据可以自洽结合并显著提升精度——是无可置疑的。随着格点QCD计算能力的提升和更多独立计算的出现，这一方法有望成为TMD提取的标准范式，对理解QCD真空结构和强子内部动力学产生深远影响。