2025-11-10T02:30:54.908722

Tight universal bounds on the height times the width of random trees

Donderwinkel, Khanfir
We obtain assumption-free, non-asymptotic, uniform bounds on the product of the height and the width of uniformly random trees with a given degree sequence, conditioned Bienaymé trees and simply generated trees. We show that for a tree of size $n$, this product is $O(n \log n)$ in probability, answering a question by Addario-Berry (2019). The order of this bound is tight in this generality.
academic

Tight universal bounds on the height times the width of random trees

基本信息

  • 论文ID: 2501.00458
  • 标题: Tight universal bounds on the height times the width of random trees
  • 作者: Serte Donderwinkel, Robin Khanfir
  • 分类: math.PR (概率论), math.CO (组合数学)
  • 发表时间: December 31, 2024
  • 论文链接: https://arxiv.org/abs/2501.00458

摘要

本文获得了对给定度序列的均匀随机树、条件Bienaymé树和简单生成树的高度与宽度乘积的无假设、非渐近、一致界。我们证明了对于大小为nn的树,这个乘积在概率意义下是O(nlogn)O(n \log n),回答了Addario-Berry (2019)提出的问题。该界的阶是紧的。

研究背景与动机

问题背景

  1. 核心问题: 研究随机树的高度(height)与宽度(width)乘积的上界。对于根树tt,高度Ht(t)Ht(t)是从根到任意节点的最大距离,宽度Wd(t)Wd(t)是任意层中节点数的最大值。
  2. 重要性: 高度和宽度给出了树的全局形状的粗略描述,是研究树几何性质的第一步。这些统计量的量级估计对理解各种随机树模型的几何结构至关重要。
  3. 现有局限性:
    • 以往研究主要分别研究高度和宽度,缺乏对它们乘积的统一分析
    • 现有结果通常需要对后代分布做特定假设(如有限方差)
    • 缺乏非渐近的一致界
  4. 研究动机: Addario-Berry在2019年提出了一个开放问题:是否存在后代分布使得Wd(Tμ,n)Ht(Tμ,n)/nWd(T_{\mu,n})Ht(T_{\mu,n})/nlogn\log n大很多且概率不消失?本文给出了否定答案。

核心贡献

  1. 无假设一致界: 对任意后代分布μ\mu和任意nn,证明了P(Wd(Tμ,n)Ht(Tμ,n)>snlogn)230s2/13P(Wd(T_{\mu,n})Ht(T_{\mu,n}) > sn \log n) \leq 230s^{-2/13}
  2. 广泛适用性: 结果适用于多种随机树模型:
    • 条件Bienaymé树
    • 简单生成树
    • 给定度序列的均匀随机树
  3. 紧性证明: 通过已知例子证明O(nlogn)O(n \log n)界是紧的
  4. 初等证明方法: 使用相对简单的概率技术,避免了复杂的分析工具

方法详解

任务定义

给定类型序列n=(ni)i0n = (n_i)_{i \geq 0},其中nin_i表示有ii个子节点的顶点数量,研究均匀随机平面树TT的高度Ht(T)Ht(T)与宽度Wd(T)Wd(T)乘积的概率界。

核心技术框架

1. 脊柱分解(Spinal Decomposition)

对于树tt中的顶点uu,定义脊柱权重:

  • Su(t)=#{vt{}:v=uv and vu}S_u(t) = \#\{v \in t \setminus \{\emptyset\} : \overleftarrow{v} = u \wedge v \text{ and } \overleftarrow{v} \neq u\}
  • Sud(t)S^d_u(t):右脊柱权重(younger siblings)
  • Sug(t)S^g_u(t):左脊柱权重(older siblings)

2. 二阶高度

定义二阶高度:Ht(2)(t)=maxu,vtmin(uuv,vuv)Ht^{(2)}(t) = \max_{u,v \in t} \min(|u| - |u \wedge v|, |v| - |u \wedge v|)

关键性质:Ht(2)(t)=maxvtvuvHt^{(2)}(t) = \max_{v \in t} |v| - |u \wedge v|,其中u=Ht(t)|u| = Ht(t)

3. 树的编码

使用深度优先遍历和广度优先遍历将树编码为随机游走:

  • 深度优先游走:Xidf(t)=Suidf(t)d(t)X^{df}_i(t) = S^d_{u^{df}_i(t)}(t)
  • 广度优先游走:与宽度相关

主要证明策略

步骤1: 高度比较(命题2.3)

证明对于ϵ>0\epsilon > 0,如果ϵ1/3n02\epsilon^{1/3}n_0 \geq 2P(ϵHt(T)1;ϵHt(T)>Ht(2)(T))64ϵ1/3P(\epsilon Ht(T) \geq 1; \epsilon Ht(T) > Ht^{(2)}(T)) \leq 64\epsilon^{1/3}

技术要点:

  • 构造类型保持映射,将线状树转换为叉状树
  • 使用循环移位技术分析祖先谱系

步骤2: 宽度比较(命题2.4)

证明如果ϵ4/3n0126\epsilon^{4/3}\sqrt{n_0} - 1 \geq 26P(ϵWd(T)maxuSud(T))3222ϵ2/3P(\epsilon Wd(T) \geq \max_u S^d_u(T)) \leq 3\sqrt{222}\epsilon^{2/3}

技术要点:

  • 利用Vervaat变换连接两种编码
  • 分析可交换桥的范围性质

步骤3: 脊柱高度控制(命题2.5)

P(maxu,vT,uv(vuv)Sud(T)snlogn)3n2s/2P\left(\max_{u,v \in T, u \leq v} (|v| - |u \wedge v|)S^d_u(T) \geq sn \log n\right) \leq 3n^{2-s/2}

技术要点:

  • 随机占优论证
  • 将问题归约到路径森林的最大高度分析

步骤4: 对称化(命题2.6, 2.7)

通过混洗操作消除左右不对称性:

  • 镜像混洗保持树的分布
  • 利用平面顺序的随机性

实验设置

理论验证

本文为纯理论工作,主要通过数学证明验证结果:

  1. 紧性例子: 引用Kortchemski (2014)和Addario-Berry (2019)的结果,证明存在后代分布使得Wd(Tμ,n)Ht(Tμ,n)Wd(T_{\mu,n})Ht(T_{\mu,n})达到Θ(nlogn)\Theta(n \log n)
  2. 特殊情况分析:
    • 有限方差情况:Ht(Tμ,n)nHt(T_{\mu,n}) \sim \sqrt{n}, Wd(Tμ,n)nWd(T_{\mu,n}) \sim \sqrt{n}
    • 重尾分布情况:出现凝聚现象,导致O(nlogn)O(n \log n)行为

实验结果

主要结果

定理1.1 (Bienaymé树)

对任意后代分布μ\mun3n \geq 3P(Wd(Tμ,n)Ht(Tμ,n)>snlogn)230s2/13P(Wd(T_{\mu,n})Ht(T_{\mu,n}) > sn \log n) \leq 230s^{-2/13}

定理1.2 (简单生成树)

对任意权重序列wwn3n \geq 3P(Wd(Tw,n)Ht(Tw,n)>snlogn)230s2/13P(Wd(T_{w,n})Ht(T_{w,n}) > sn \log n) \leq 230s^{-2/13}

定理1.3 (给定度序列的树)

对任意度序列dd满足i=1ndi=n1\sum_{i=1}^n d_i = n-1P(Wd(Td)Ht(Td)>snlogn)230s2/13P(Wd(T_d)Ht(T_d) > sn \log n) \leq 230s^{-2/13}

技术结果

可交换桥的范围界(定理4.5)

对于跳跃序列bnb^n,序列(σn1R(Yn))n1(\sigma_n^{-1}R(Y^n))_{n \geq 1}是紧的,其中σn=σ2(bn)\sigma_n = \sqrt{\sigma^2(b^n)}

具体地:

  • 上界(命题4.6): P(σ1R(Y)ϵ1)12ϵP(\sigma^{-1}R(Y) \geq \epsilon^{-1}) \leq 12\epsilon
  • 下界(命题4.8): P(2σ1R(Y)p1/2)400p1P(2\sigma^{-1}R(Y) \leq p^{-1/2}) \leq 400p^{-1}

相关工作

历史发展

  1. 经典结果: Kolchin (1986)证明了有限方差情况下的渐近行为
  2. scaling limits: Aldous (1993), Duquesne (2003)等建立了连续极限
  3. 非渐近界: Devroye-Janson-Addario-Berry (2013), Kortchemski (2015)

本文创新

  1. 无假设: 不需要对后代分布做任何假设
  2. 统一处理: 同时处理高度和宽度
  3. 初等方法: 避免复杂的分析工具

结论与讨论

主要结论

  1. 对于大小为nn的随机树,高度与宽度的乘积几乎必然不超过O(nlogn)O(n \log n)
  2. 这个界对所有考虑的随机树模型都成立,无需任何假设
  3. 界是紧的,存在达到此阶的例子

局限性

  1. 尾界指数: 2/132/13这个指数远非最优,可能通过更精细分析改进
  2. 常数: 常数230可能不是最佳的
  3. 方法限制: 使用二阶矩方法,可能通过高阶矩改进

未来方向

论文提出了三个开放问题:

  1. 计算\sup E[1_{\{#T_\mu < \infty\}}Ht(T_\mu)Wd(T_\mu)(#T_\mu)^{-1}]的值
  2. 刻画Ht(Tμ,n)Wd(Tμ,n)=Θ(n)Ht(T_{\mu,n})Wd(T_{\mu,n}) = \Theta(n)=Θ(nlogn)= \Theta(n \log n)的条件
  3. 对于慢变函数f(n)f(n),是否存在后代分布使得乘积为Θ(nf(n))\Theta(nf(n))

深度评价

优点

  1. 重要问题: 解决了Addario-Berry提出的重要开放问题
  2. 技术创新:
    • 巧妙的脊柱分解技术
    • 可交换桥理论的应用
    • 混洗操作的对称化技巧
  3. 广泛适用: 结果适用于多种随机树模型
  4. 初等方法: 证明相对简洁,避免了复杂工具

不足

  1. 尾界: s2/13s^{-2/13}的衰减较慢,实际应用中可能不够强
  2. 常数: 230这个常数较大,实际意义有限
  3. 技术性: 某些证明步骤较为技术性,缺乏直观解释

影响力

  1. 理论贡献: 为随机树几何理论提供了重要结果
  2. 方法价值: 脊柱分解和混洗技术可能有更广泛应用
  3. 开放问题: 提出的问题为后续研究指明方向

适用场景

  1. 理论研究: 随机树、随机图理论
  2. 算法分析: 树算法的复杂度分析
  3. 统计物理: 分支过程、渗流理论

参考文献

关键参考文献包括:

  • Addario-Berry (2019): 提出了原始问题
  • Kortchemski (2014, 2015): 提供了紧性例子和技术基础
  • Aldous (1993): 连续随机树理论
  • Devroye-Janson-Addario-Berry (2013): 非渐近界的先驱工作

本文是概率论和组合数学交叉领域的重要理论工作,通过巧妙的概率技术解决了一个基本而困难的问题,为随机树理论做出了实质性贡献。