2025-11-17T00:16:13.462169

Approaching the Continuous from the Discrete: an Infinite Tensor Product Construction

Lorenzin, Zanasi
Increasingly in recent years, probabilistic computation has been investigated through the lenses of categorical algebra, especially via string diagrammatic calculi. Whereas categories of discrete and Gaussian probabilistic processes have been thoroughly studied, with various axiomatisation results, more expressive classes of continuous probability are less understood, because of the intrinsic difficulty of describing infinite behaviour by algebraic means. In this work, we establish a universal construction that adjoins infinite tensor products, allowing continuous probability to be investigated from discrete settings. Our main result applies this construction to $\mathsf{FinStoch}$, the category of finite sets and stochastic matrices, obtaining a category of locally constant Markov kernels, where the objects are finite sets plus the Cantor space $2^{\mathbb{N}}$. Any probability measure on the reals can be reasoned about in this category. Furthermore, we show how to lift axiomatisation results through the infinite tensor product construction. This way we obtain an axiomatic presentation of continuous probability over countable powers of $2=\lbrace 0,1\rbrace$.
academic

Approaching the Continuous from the Discrete: an Infinite Tensor Product Construction

基本信息

  • 论文ID: 2510.14716
  • 标题: Approaching the Continuous from the Discrete: an Infinite Tensor Product Construction
  • 作者: Antonio Lorenzin (a.lorenzin.95@gmail.com), Fabio Zanasi (University College London)
  • 分类: math.CT (Category Theory), cs.LO (Logic in Computer Science)
  • 发表时间: 2025年10月16日 (arXiv预印本)
  • 论文链接: https://arxiv.org/abs/2510.14716

摘要

近年来,概率计算越来越多地通过范畴代数的视角进行研究,特别是通过字符串图解演算。虽然离散和高斯概率过程的范畴已经得到了充分研究,并有各种公理化结果,但更具表达力的连续概率类别却缺乏理解,这是因为用代数方法描述无限行为存在内在困难。

本文建立了一个通用构造,用于附加无限张量积,使得连续概率可以从离散设置中进行研究。主要结果将此构造应用于FinStoch(有限集和随机矩阵的范畴),得到了局部常数马尔可夫核的范畴,其中对象是有限集加上康托空间2N2^{\mathbb{N}}。任何实数上的概率测度都可以在此范畴中进行推理。此外,还展示了如何通过无限张量积构造提升公理化结果,从而获得2={0,1}2=\{0,1\}的可数次幂上连续概率的公理化表示。

研究背景与动机

问题背景

范畴论方法在概率计算中的应用近年来引起了广泛关注,其应用范围从证据决策理论到随机图和主动推理。这些方法能够突出底层的代数结构,提供严格的语义,增强形式化清晰度和组合方法论,并允许用字符串图进行直观描述。

核心问题

尽管离散概率(如FinStoch和BinStoch)和高斯概率的范畴已经有了完整的公理化,但连续概率的字符串图公理化仍然是一个根本性的缺口。主要挑战在于如何在现有的字符串图代数框架内直接编码无限行为。

研究动机

  1. 理论需求:需要为连续概率提供完整的范畴论描述
  2. 方法论创新:通过无限张量积连接离散和连续概率
  3. 实用价值:为连续概率推理提供代数工具

核心贡献

  1. 通用构造:引入了一个通用构造,为任何半笛卡尔范畴附加无限张量积(定理1)
  2. 图解表示:为具有无限张量积的自由生成范畴提供图解表示,使用板记号(plate notation)
  3. FinStoch⊗∞刻画:用Stone空间和局部常数马尔可夫核刻画了FinStoch⊗∞(定理2)
  4. 公理化表示:提供了CantorStochlc的公理化表示,即FinStoch⊗∞在2的幂及康托空间2^ℕ上的限制(推论2)

方法详解

理论基础:半笛卡尔范畴

定义1:半笛卡尔范畴是对称单子范畴(C,⊗,I),其中单子单位I是终对象。

关键例子:

  • FinStoch:对象为有限集,态射为随机函数f: X → Y
  • BinStoch:FinStoch的子范畴,对象为2={0,1}的有限次幂
  • BorelStoch:对象为标准Borel空间,态射为马尔可夫核

无限张量积的定义

定义2:抽象无限张量积是函子X: P_(J)^{op} → C,将有限子集F映射到X_F := ⊗_{j∈F} X_j。

定义3:具体无限张量积X = ⊗_{j∈J} X_j是相应抽象无限张量积的极限,且此极限被-⊗Y保持。

通用构造C⊗∞

核心思想:通过兼容族(compatible families)定义态射,这些族满足:

  • 自然性:与投影态射交换
  • 覆盖条件:每个目标有限子集都有对应的源有限子集
  • 遗传性:如果(F,G)在族中,则所有(F',G)(F' ⊇ F)也在族中

定义8:C⊗∞的态射f: X → Y是兼容族的等价类,组合通过逐点定义:

(gf)_{F,H} := g_{G,H} f_{F,G}

板记号(Plate Notation)

为了直观表示兼容族,引入板记号:

f_{F,G}
─────────  表示态射 f: X → Y
(F,G) ∈ Λ_f
  X    Y

这种记号与贝叶斯网络中的板记号类似,但专门用于表示兼容族。

主要定理

定理1:通用性质

对于具有消去删除的半笛卡尔范畴C,存在具有无限张量积的半笛卡尔范畴C⊗∞和严格对称单子函子C → C⊗∞,使得对于任何具有无限张量积的半笛卡尔范畴D和对称单子函子φ: C → D,存在唯一的ITP-保持对称单子函子φ̃: C⊗∞ → D使得图表交换。

定理2:Stone空间刻画

ITP-保持对称单子函子

φ: FinStoch⊗∞ → StoneStoch^{lc}

是完全忠实的,其本质像是拓扑空间意义下有限集的无限张量积。

局部常数马尔可夫核(定义11):Stone空间之间的态射f: X → Y满足:

  • f(U|-): X → 0,1对所有clopen集U是局部常数
  • f(-|x): Clopen(Y) → 0,1对所有x∈X是有限可加概率测度

实验设置与应用

马尔可夫链案例

论文通过马尔可夫链展示了板记号的应用。时齐马尔可夫链可以表示为:

c_n: X → X^n := f ∘ c_{n-1}

在无限张量积设置中,可以定义无限马尔可夫链c: X → X^ℕ,并证明其在添加前置步骤下的不变性:

c_n = c_{n-1} ∘ f = c ∘ f

实验结果

表达能力

关键结果:CantorStoch^{lc}包含ℝ上的所有概率测度。这是因为ℝ是BorelStoch中2的无限张量积,而2^ℕ是CantorStoch^{lc}中相应的对象。

公理化成果

推论3:CantorStoch^{lc}同构于Free^∞(Σ,E),其中(Σ,E)是CausCirc的对称单子理论。

这意味着可以用有限的生成元和方程完全刻画这个连续概率范畴。

相关工作

范畴概率理论

  • Fritz等人的马尔可夫范畴理论11
  • 离散概率的公理化21
  • 高斯概率的字符串图25

无限张量积

  • Fritz和Rischel的开创性工作16
  • 在范畴概率中的应用13,14

本文创新

与现有工作相比,本文首次提供了从离散到连续概率的系统性构造方法,并给出了完整的公理化表示。

结论与讨论

主要结论

  1. 建立了附加无限张量积的通用构造
  2. 证明了FinStoch⊗∞可以刻画为局部常数马尔可夫核
  3. 提供了连续概率的完整公理化
  4. 展示了从离散到连续的系统性方法

局限性

  1. 表达能力限制:无法恢复完整的BorelStoch,因为可测函数的自由度无法完全通过有限操作捕获
  2. 局部常数约束:只能处理局部常数马尔可夫核,不包括所有连续概率过程
  3. 可数限制:构造仅适用于可数无限张量积

未来方向

  1. 扩展到一般马尔可夫核:研究如何用局部常数核描述一般核
  2. 测度分解:研究保证马尔可夫范畴中条件存在的通用构造
  3. Stone对偶:通过Stone对偶研究布尔代数之间的概率态射
  4. 其他范畴:应用于高斯概率、高斯混合等其他范畴

深度评价

优点

  1. 理论创新:首次系统性地连接了离散和连续概率的范畴论描述
  2. 构造通用:提供的通用构造适用于所有半笛卡尔范畴
  3. 工具实用:板记号为复杂的无限张量积推理提供了直观工具
  4. 结果深刻:证明了康托空间足以表示所有实数上的概率测度

不足

  1. 应用有限:马尔可夫链案例相对简单,需要更复杂的应用展示
  2. 计算复杂性:未讨论实际计算中的复杂性问题
  3. 实现细节:缺乏具体的算法实现和计算工具

影响力

  1. 理论贡献:为范畴概率理论提供了重要的理论工具
  2. 方法论意义:开创了从离散逼近连续的新方法
  3. 应用前景:为概率编程和机器学习提供了新的理论基础

适用场景

  1. 理论研究:范畴论、概率论、逻辑学研究
  2. 概率编程:提供更严格的语义基础
  3. 机器学习:为概率模型提供代数工具
  4. 形式化验证:为概率系统的形式化分析提供工具

参考文献

论文引用了29篇相关文献,主要包括:

  • 11 Fritz, T.: A synthetic approach to Markov kernels (马尔可夫范畴的奠基性工作)
  • 16 Fritz, T., Rischel, E.F.: Infinite products and zero-one laws (无限张量积的原始工作)
  • 21 Piedeleu, R. et al.: A complete axiomatisation of equivalence for discrete probabilistic programming (离散概率的公理化)
  • 25 Stein, D. et al.: Graphical quadratic algebra (高斯概率的字符串图)

这篇论文在范畴概率理论领域做出了重要贡献,为连续概率提供了系统性的代数处理方法。虽然在实际应用方面还有待进一步发展,但其理论价值和方法论创新具有深远意义。