2025-11-22T11:37:16.514818

The football model, stochastic ordering and martingale transport

Guo, Juillet, Tang
Tournaments are competitions between a number of teams, the outcome of which determines the relative strength or rank of each team. In many cases, the strength of a team in the tournament is given by a score. Perhaps, the most striking mathematical result on the tournament is Moon's theorem, which provides a necessary and sufficient condition for a feasible score sequence via majorization. To give a probabilistic interpretation of Moon's result, Aldous and Kolesnik introduced the football model, the existence of which gives a short proof of Moon's theorem. However, the existence proof of Aldous and Kolesnik is nonconstructive, leading to the question of a ``canonical'' construction of the football model. The purpose of this paper is to provide explicit constructions of the football model with an additional stochastic ordering constraint, which can be formulated by martingale transport. Two solutions are given: one is by solving an entropy optimization problem via Sinkhorn's algorithm, and the other relies on the idea of shadow couplings. It turns out that both constructions yield the property of strong stochastic transitivity. The nontransitive situations of the football model are also considered.
academic

The Football Model, Stochastic Ordering and Martingale Transport

基本信息

  • 论文ID: 2503.07145
  • 标题: The Football Model, Stochastic Ordering and Martingale Transport
  • 作者: Gaoyue Guo, Nicolas Juillet, Wenpin Tang
  • 分类: math.PR (概率论)
  • 发表时间: 2025年10月17日
  • 论文链接: https://arxiv.org/abs/2503.07145

摘要

本文研究锦标赛理论中的足球模型,该模型是对著名的Moon定理的概率解释。Moon定理通过优势化(majorization)给出了可行得分序列的充要条件。虽然Aldous和Kolesnik引入的足球模型为Moon定理提供了简短的证明,但其构造是非建设性的。本文的目标是在随机序约束下提供足球模型的显式构造,这可以通过鞅运输来表述。文章给出了两种解决方案:一种是通过Sinkhorn算法求解熵优化问题,另一种基于阴影耦合的思想。两种构造都产生了强随机传递性的性质。

研究背景与动机

问题背景

  1. 锦标赛理论:锦标赛是多支队伍之间的两两比较,目的是确定队伍的相对强度或排名。在n队循环赛中,每支队伍都与其他每支队伍比赛。
  2. Moon定理:这是随机锦标赛理论中最基本的数学结果,通过优势化提供了可行得分序列的充要条件。具体来说,对于得分向量x = (x₁,...,xₙ),广义锦标赛矩阵集合Gₙ(x)非空当且仅当x ⪯ (0,1,...,n-1)。
  3. 现有模型的局限性
    • Zermelo-Bradley-Terry模型:每支队伍i的强度由正数uᵢ指定,但自由度有限
    • 足球模型:Aldous和Kolesnik引入,具有更多自由度,但缺乏"规范"构造

研究动机

  1. 非建设性证明的问题:虽然足球模型的存在性为Moon定理提供了优雅的证明,但这种证明是非建设性的,缺乏显式构造方法。
  2. 规范构造的需求:Aldous和Kolesnik明确提出了寻找"规范"联合分布的挑战,这是凸序表示定理中长期存在的问题。
  3. 随机序约束:现有构造缺乏额外的结构约束,特别是强随机传递性(SST)约束。

核心贡献

  1. 提供了两种显式构造方法
    • 基于熵优化和Sinkhorn算法的构造
    • 基于阴影耦合的构造
  2. 建立了随机序约束:证明了在足球模型中存在满足μ₁ ⪯ₛₜₒ ··· ⪯ₛₜₒ μₙ的元素
  3. 证明了强随机传递性:两种构造都产生满足SST性质的广义锦标赛矩阵
  4. 完整的理论框架:将问题与鞅运输理论联系起来,提供了理论基础
  5. 非传递性分析:研究了足球模型中的非传递情况,完整刻画了三元组(p₁₂, p₂₃, p₃₁)

方法详解

任务定义

给定得分向量x ⪯ (0,1,...,n-1),构造(μ₁,...,μₙ) ∈ Θₙ(x),其中:

  • Θₙ(x) := {(μ₁,...,μₙ) ∈ Θₙ : ∫y dμᵢ(y) = xᵢ for 1 ≤ i ≤ n}
  • Θₙ := {(μ₁,...,μₙ) ∈ P({0,...,n-1})ⁿ : Σᵢ₌₁ⁿ μᵢ = Σₖ₌₀ⁿ⁻¹ δₖ}

目标是找到满足随机序约束μ₁ ⪯ₛₜₒ ··· ⪯ₛₜₒ μₙ的显式构造。

方法一:熵优化构造

核心思想

通过最小化熵函数H(M) = Σᵢ,ⱼ mᵢⱼ log(mᵢⱼ)来构造所需的概率测度。

算法流程

  1. 问题转化:将Θₙ(x)识别为双随机矩阵M = (mᵢⱼ),其中mᵢⱼ = μᵢ({j-1})
  2. 约束集合:定义三个约束集合
    • C₁:行和约束(概率测度)
    • C₂:列和约束(边际约束)
    • C₃:重心约束(得分约束)
  3. Sinkhorn迭代
    • 初始化:M⁰ = (1)ₙₓₙ
    • 循环更新:
      • k=1: 行归一化
      • k=2: 列归一化
      • k=3: 重心归一化(通过求解多项式方程)

理论保证

  • 唯一性:当x不可约时,熵函数有唯一最小值点
  • 收敛性:Sinkhorn算法收敛到全局最优解
  • 随机序性质:最优解自然满足随机序约束

方法二:阴影耦合构造

核心概念

利用阴影(shadow)的概念构造鞅运输计划π*。

算法步骤

  1. 初始设置
    • μ := U_{(x₁,...,xₙ)} (均匀测度)
    • ν := U_{(0,...,n-1)}
  2. 阴影递归构造: 对每个排列σ ∈ S(n):
    • η^σ₀ := 0, ν^σ₀ := ν
    • 递归定义:η^σₖ := η^σₖ₋₁ + S_{ν^σₖ₋₁}(1/n δ_{x^σₖ})
  3. 对称化:π* := 1/n! Σ_{σ∈S(n)} π^σ

理论性质

  • 鞅性质:π*满足鞅约束
  • 边际分布:正确的边际分布
  • 随机序:自然产生随机序约束

技术创新点

  1. 熵优化方法的适配:将标准的熵优化方法适配到鞅运输问题,处理了重心约束这一技术难点
  2. 阴影耦合的应用:创新性地将阴影耦合理论应用到足球模型的构造中
  3. 统一的理论框架:将两种看似不同的方法统一在鞅运输的框架下
  4. 可约情况的处理:对于可约得分,提供了分块处理的完整方案

实验设置

理论验证

本文主要是理论工作,实验部分集中在:

  1. 算法收敛性验证:验证Sinkhorn算法在不同参数下的收敛性
  2. 数值稳定性测试:测试两种方法在不同规模问题上的数值稳定性
  3. SST性质验证:验证构造出的矩阵确实满足强随机传递性

实现细节

  • 多项式求解:在Sinkhorn算法的第三步中,使用Newton方法求解单变量多项式方程
  • 数值精度:所有计算保持双精度浮点数精度
  • 收敛判别:使用相对误差作为收敛判别标准

实验结果

主要理论结果

  1. 存在性定理(命题2.2):对于x ⪯ (0,...,n-1),存在(μ₁,...,μₙ) ∈ Θₙ(x)使得(μᵢ)按随机序递增
  2. SST性质(命题2.4):在随机序约束下,对应的广义锦标赛矩阵满足强随机传递性
  3. 熵优化收敛性(定理3.6):对于不可约得分,Sinkhorn算法收敛到唯一的熵最小值点
  4. 阴影构造有效性(定理4.2):阴影构造方法产生满足所有约束的解

非传递性结果

  1. 完整刻画(定理5.3):对于n ≥ 6,足球模型可以实现集合D中的任意非传递三元组
  2. Steinhaus-Trybula定理的推广(命题5.2):证明了A' = D,其中A'允许平局情况

算法性能

  • 时间复杂度:Sinkhorn算法每次迭代的复杂度为O(n²)
  • 空间复杂度:需要O(n²)的存储空间
  • 收敛速度:在典型情况下,算法在几十次迭代内收敛

相关工作

锦标赛理论

  1. Moon定理:提供了得分序列的基本刻画
  2. Bradley-Terry模型:经典的成对比较模型
  3. Plackett-Luce模型:Bradley-Terry模型的推广

鞅运输理论

  1. Strassen定理:凸序的基础理论
  2. Peacocks理论:连续参数的凸序递增过程
  3. 阴影耦合:鞅运输计划的构造方法

熵优化

  1. Sinkhorn算法:求解最优传输问题的经典算法
  2. Bregman投影:凸优化的基本方法

结论与讨论

主要结论

  1. 显式构造的实现:成功提供了足球模型的两种显式构造方法,解决了Aldous和Kolesnik提出的开放问题
  2. 随机序约束的重要性:证明了在随机序约束下,足球模型自然产生强随机传递性
  3. 理论统一:将足球模型与鞅运输理论联系起来,为进一步研究提供了理论基础
  4. 非传递性的完整刻画:完整解决了足球模型中非传递现象的刻画问题

局限性

  1. 计算复杂度:当n较大时,两种方法的计算复杂度都较高
  2. 数值稳定性:在某些极端情况下可能存在数值稳定性问题
  3. 实际应用:理论结果与实际锦标赛数据的拟合能力有待验证

未来方向

  1. 算法优化:开发更高效的数值算法
  2. 统计推断:基于观测数据的参数估计方法
  3. 模型推广:推广到更一般的比较结构
  4. 应用研究:在实际锦标赛数据上的应用

深度评价

优点

  1. 理论贡献显著:解决了一个重要的开放问题,为足球模型提供了规范构造
  2. 方法创新性强:两种构造方法都具有创新性,特别是将阴影耦合应用到这一问题
  3. 理论完整性:从存在性到构造性,从传递到非传递,提供了完整的理论图景
  4. 技术严谨性:所有定理都有严格的证明,技术处理细致
  5. 交叉学科价值:连接了概率论、优化理论和组合数学等多个领域

不足

  1. 实用性限制:主要是理论工作,缺乏与实际数据的对比验证
  2. 计算效率:当问题规模较大时,算法效率可能成为瓶颈
  3. 模型假设:足球模型的基本假设在实际应用中可能不够现实

影响力

  1. 学术价值:为锦标赛理论和鞅运输理论都做出了重要贡献
  2. 方法论价值:提供的构造方法可能适用于其他类似问题
  3. 理论完善:填补了理论空白,完善了相关理论体系

适用场景

  1. 理论研究:为进一步的理论研究提供基础
  2. 算法开发:为相关算法开发提供理论指导
  3. 模型选择:为实际应用中的模型选择提供理论依据

参考文献

论文引用了72篇重要文献,涵盖了:

  • 锦标赛理论的经典文献(Moon, Bradley-Terry等)
  • 鞅运输理论的核心文献(Strassen, Kellerer等)
  • 优化算法的相关文献(Sinkhorn, Benamou等)
  • 概率论基础文献(Hardy-Littlewood-Pólya等)

本论文在理论上具有重要价值,为足球模型提供了完整的构造理论,并与现代概率论的前沿理论建立了深刻联系。虽然在实际应用方面还有待进一步发展,但其理论贡献是显著和持久的。