We obtain assumption-free, non-asymptotic, uniform bounds on the product of the height and the width of uniformly random trees with a given degree sequence, conditioned Bienaymé trees and simply generated trees. We show that for a tree of size $n$, this product is $O(n \log n)$ in probability, answering a question by Addario-Berry (2019). The order of this bound is tight in this generality.
Tight universal bounds on the height times the width of random trees
- 论文ID: 2501.00458
- 标题: Tight universal bounds on the height times the width of random trees
- 作者: Serte Donderwinkel, Robin Khanfir
- 分类: math.PR (概率论), math.CO (组合数学)
- 发表时间: December 31, 2024
- 论文链接: https://arxiv.org/abs/2501.00458
本文获得了对给定度序列的均匀随机树、条件Bienaymé树和简单生成树的高度与宽度乘积的无假设、非渐近、一致界。我们证明了对于大小为n的树,这个乘积在概率意义下是O(nlogn),回答了Addario-Berry (2019)提出的问题。该界的阶是紧的。
- 核心问题: 研究随机树的高度(height)与宽度(width)乘积的上界。对于根树t,高度Ht(t)是从根到任意节点的最大距离,宽度Wd(t)是任意层中节点数的最大值。
- 重要性: 高度和宽度给出了树的全局形状的粗略描述,是研究树几何性质的第一步。这些统计量的量级估计对理解各种随机树模型的几何结构至关重要。
- 现有局限性:
- 以往研究主要分别研究高度和宽度,缺乏对它们乘积的统一分析
- 现有结果通常需要对后代分布做特定假设(如有限方差)
- 缺乏非渐近的一致界
- 研究动机: Addario-Berry在2019年提出了一个开放问题:是否存在后代分布使得Wd(Tμ,n)Ht(Tμ,n)/n比logn大很多且概率不消失?本文给出了否定答案。
- 无假设一致界: 对任意后代分布μ和任意n,证明了P(Wd(Tμ,n)Ht(Tμ,n)>snlogn)≤230s−2/13
- 广泛适用性: 结果适用于多种随机树模型:
- 条件Bienaymé树
- 简单生成树
- 给定度序列的均匀随机树
- 紧性证明: 通过已知例子证明O(nlogn)界是紧的
- 初等证明方法: 使用相对简单的概率技术,避免了复杂的分析工具
给定类型序列n=(ni)i≥0,其中ni表示有i个子节点的顶点数量,研究均匀随机平面树T的高度Ht(T)与宽度Wd(T)乘积的概率界。
对于树t中的顶点u,定义脊柱权重:
- Su(t)=#{v∈t∖{∅}:v=u∧v and v=u}
- Sud(t):右脊柱权重(younger siblings)
- Sug(t):左脊柱权重(older siblings)
定义二阶高度:Ht(2)(t)=maxu,v∈tmin(∣u∣−∣u∧v∣,∣v∣−∣u∧v∣)
关键性质:Ht(2)(t)=maxv∈t∣v∣−∣u∧v∣,其中∣u∣=Ht(t)
使用深度优先遍历和广度优先遍历将树编码为随机游走:
- 深度优先游走:Xidf(t)=Suidf(t)d(t)
- 广度优先游走:与宽度相关
证明对于ϵ>0,如果ϵ1/3n0≥2:
P(ϵHt(T)≥1;ϵHt(T)>Ht(2)(T))≤64ϵ1/3
技术要点:
- 构造类型保持映射,将线状树转换为叉状树
- 使用循环移位技术分析祖先谱系
证明如果ϵ4/3n0−1≥26:
P(ϵWd(T)≥maxuSud(T))≤3222ϵ2/3
技术要点:
- 利用Vervaat变换连接两种编码
- 分析可交换桥的范围性质
P(maxu,v∈T,u≤v(∣v∣−∣u∧v∣)Sud(T)≥snlogn)≤3n2−s/2
技术要点:
通过混洗操作消除左右不对称性:
本文为纯理论工作,主要通过数学证明验证结果:
- 紧性例子: 引用Kortchemski (2014)和Addario-Berry (2019)的结果,证明存在后代分布使得Wd(Tμ,n)Ht(Tμ,n)达到Θ(nlogn)
- 特殊情况分析:
- 有限方差情况:Ht(Tμ,n)∼n, Wd(Tμ,n)∼n
- 重尾分布情况:出现凝聚现象,导致O(nlogn)行为
对任意后代分布μ和n≥3:
P(Wd(Tμ,n)Ht(Tμ,n)>snlogn)≤230s−2/13
对任意权重序列w和n≥3:
P(Wd(Tw,n)Ht(Tw,n)>snlogn)≤230s−2/13
对任意度序列d满足∑i=1ndi=n−1:
P(Wd(Td)Ht(Td)>snlogn)≤230s−2/13
对于跳跃序列bn,序列(σn−1R(Yn))n≥1是紧的,其中σn=σ2(bn)。
具体地:
- 上界(命题4.6): P(σ−1R(Y)≥ϵ−1)≤12ϵ
- 下界(命题4.8): P(2σ−1R(Y)≤p−1/2)≤400p−1
- 经典结果: Kolchin (1986)证明了有限方差情况下的渐近行为
- scaling limits: Aldous (1993), Duquesne (2003)等建立了连续极限
- 非渐近界: Devroye-Janson-Addario-Berry (2013), Kortchemski (2015)
- 无假设: 不需要对后代分布做任何假设
- 统一处理: 同时处理高度和宽度
- 初等方法: 避免复杂的分析工具
- 对于大小为n的随机树,高度与宽度的乘积几乎必然不超过O(nlogn)
- 这个界对所有考虑的随机树模型都成立,无需任何假设
- 界是紧的,存在达到此阶的例子
- 尾界指数: 2/13这个指数远非最优,可能通过更精细分析改进
- 常数: 常数230可能不是最佳的
- 方法限制: 使用二阶矩方法,可能通过高阶矩改进
论文提出了三个开放问题:
- 计算\sup E[1_{\{#T_\mu < \infty\}}Ht(T_\mu)Wd(T_\mu)(#T_\mu)^{-1}]的值
- 刻画Ht(Tμ,n)Wd(Tμ,n)=Θ(n)和=Θ(nlogn)的条件
- 对于慢变函数f(n),是否存在后代分布使得乘积为Θ(nf(n))
- 重要问题: 解决了Addario-Berry提出的重要开放问题
- 技术创新:
- 巧妙的脊柱分解技术
- 可交换桥理论的应用
- 混洗操作的对称化技巧
- 广泛适用: 结果适用于多种随机树模型
- 初等方法: 证明相对简洁,避免了复杂工具
- 尾界: s−2/13的衰减较慢,实际应用中可能不够强
- 常数: 230这个常数较大,实际意义有限
- 技术性: 某些证明步骤较为技术性,缺乏直观解释
- 理论贡献: 为随机树几何理论提供了重要结果
- 方法价值: 脊柱分解和混洗技术可能有更广泛应用
- 开放问题: 提出的问题为后续研究指明方向
- 理论研究: 随机树、随机图理论
- 算法分析: 树算法的复杂度分析
- 统计物理: 分支过程、渗流理论
关键参考文献包括:
- Addario-Berry (2019): 提出了原始问题
- Kortchemski (2014, 2015): 提供了紧性例子和技术基础
- Aldous (1993): 连续随机树理论
- Devroye-Janson-Addario-Berry (2013): 非渐近界的先驱工作
本文是概率论和组合数学交叉领域的重要理论工作,通过巧妙的概率技术解决了一个基本而困难的问题,为随机树理论做出了实质性贡献。