We present a new probabilistic proof of Otter's asymptotic formula for the number of unlabelled trees with a given number of vertices. We additionally prove a new approximation result, showing that the total variation distance between random Pólya trees and random unlabelled trees tends to zero when the number of vertices tends to infinity. In order to demonstrate that our approach is not restricted to trees we extend our results to tree-like classes of graphs.
Probabilistic enumeration and equivalence of nonisomorphic trees 论文ID : 2305.16453标题 : Probabilistic enumeration and equivalence of nonisomorphic trees作者 : Benedikt Stufler (Vienna University of Technology)分类 : math.CO (组合数学), math.PR (概率论)发表时间 : 2023年5月,修订版2025年10月论文链接 : https://arxiv.org/abs/2305.16453 本文提出了Otter关于给定顶点数的无标号树数量渐近公式的新概率证明。此外,还证明了一个新的逼近结果,表明随机Pólya树和随机无标号树之间的全变差距离在顶点数趋于无穷时趋于零。为了证明该方法不仅限于树,作者将结果扩展到了类树图类。
经典树计数问题 :Cayley定理给出了标号树的计数公式 u n = n n − 2 u_n = n^{n-2} u n = n n − 2 ,但无标号树的计数更加复杂Otter公式的重要性 :Otter在1948年得出了无标号树数量的渐近公式,这是组合数学中的经典结果概率方法的缺失 :现有的Otter公式证明主要基于生成函数和解析组合学方法,缺乏概率论视角方法论创新 :提供Otter公式的首个概率证明,丰富了组合计数的方法论等价性问题 :解决随机Pólya树与随机无标号树之间关系的根本问题结果转移 :为从有根树的性质转移到无根树提供更强的理论基础推广应用 :证明方法的普适性,扩展到更一般的图类提供了Otter渐近公式的新概率证明 :避免了传统的dissymmetry方程方法证明了随机树的渐近等价性 :lim n → ∞ d T V ( F ( A n ) , F n ) = 0 \lim_{n→∞} d_{TV}(F(A_n), F_n) = 0 lim n → ∞ d T V ( F ( A n ) , F n ) = 0 建立了更强的逼近理论 :相比之前需要附加小树的逼近结果,本文直接证明了等价性扩展到度限制树和类树图类 :证明了方法的普适性提供了精确的收敛速度 :对于 1 / 2 < α < 1 1/2 < α < 1 1/2 < α < 1 ,给出了指数收敛速度作者通过对称性分析,将树的计数问题转化为对称群作用下的轨道计数问题。
对称性集合 :S y m ( U ) [ V ] = { ( T , σ ) ∣ T ∈ U [ V ] , σ ∈ S [ V ] , σ . T = T } Sym(U)[V] = \{(T,σ) | T ∈ U[V], σ ∈ S[V], σ.T = T\} S y m ( U ) [ V ] = {( T , σ ) ∣ T ∈ U [ V ] , σ ∈ S [ V ] , σ . T = T } 固定点分类 :S y m k ( U ) [ V ] Sym_k(U)[V] S y m k ( U ) [ V ] 表示恰好有k个固定点的对称性生成函数关系 :建立指数生成函数之间的联系将无标号树的生成函数分解为:
F ( z ) = S y m 0 ( U ) ( z ) + U ( H ( z ) ) F(z) = Sym_0(U)(z) + U(H(z)) F ( z ) = S y m 0 ( U ) ( z ) + U ( H ( z ))
其中:
U ( z ) = ∑ n ≥ 1 n n − 2 n ! z n U(z) = \sum_{n≥1} \frac{n^{n-2}}{n!}z^n U ( z ) = ∑ n ≥ 1 n ! n n − 2 z n 是标号树的指数生成函数H ( z ) = z exp ( ∑ i ≥ 2 A ( z i ) / i ) H(z) = z\exp(\sum_{i≥2} A(z^i)/i) H ( z ) = z exp ( ∑ i ≥ 2 A ( z i ) / i ) 对应只固定根的对称性引入独立随机变量X 1 , X 2 , . . . X_1, X_2, ... X 1 , X 2 , ... ,其概率生成函数为:
E [ z X ] = ρ z exp ( 1 + ∑ i ≥ 2 A ( ( ρ z ) i ) / i ) E[z^X] = ρz\exp(1 + \sum_{i≥2} A((ρz)^i)/i) E [ z X ] = ρ z exp ( 1 + ∑ i ≥ 2 A (( ρ z ) i ) / i )
以及独立的随机变量N N N ,满足E [ z N ] = 2 U ( z / e ) E[z^N] = 2U(z/e) E [ z N ] = 2 U ( z / e ) 。
利用随机游走的中偏差不等式和Stirling公式,得到:
[ z n ] F ( z ) ∼ 1 2 π E [ X ] 3 / 2 n − 5 / 2 ρ − n [z^n]F(z) ∼ \frac{1}{\sqrt{2π}}E[X]^{3/2}n^{-5/2}ρ^{-n} [ z n ] F ( z ) ∼ 2 π 1 E [ X ] 3/2 n − 5/2 ρ − n
固定点控制 :证明对称性中固定点数偏离期望值n / E [ X ] n/E[X] n / E [ X ] 超过n α n^α n α 的概率指数小条件比较 :在固定点数在合理范围内时,比较有根和无根情况的概率二阶项分析 :利用Pólya树的二阶渐近展开控制误差项本文主要是理论工作,实验部分包括:
常数计算 :验证c A ≈ 0.439924 c_A ≈ 0.439924 c A ≈ 0.439924 , ρ ≈ 0.338321 ρ ≈ 0.338321 ρ ≈ 0.338321 收敛速度验证 :通过具体计算验证指数收敛速度扩展验证 :在度限制情况下验证理论结果中偏差不等式 :用于控制随机游走的尾概率生成函数分析 :建立组合结构与概率分布的联系奇点分析 :从生成函数的奇点性质推导渐近行为f n ∼ c F n − 5 / 2 ρ − n f_n ∼ c_F n^{-5/2}ρ^{-n} f n ∼ c F n − 5/2 ρ − n
其中c F = 2 π c A 3 c_F = 2πc_A^3 c F = 2 π c A 3 ,c A = 1 2 π E [ X ] 1 / 2 c_A = \frac{1}{\sqrt{2π}}E[X]^{1/2} c A = 2 π 1 E [ X ] 1/2 。
lim n → ∞ d T V ( F ( A n ) , F n ) = 0 \lim_{n→∞} d_{TV}(F(A_n), F_n) = 0 lim n → ∞ d T V ( F ( A n ) , F n ) = 0
更精确地,对于1 / 2 < α < 1 1/2 < α < 1 1/2 < α < 1 ,存在常数c , C > 0 c, C > 0 c , C > 0 使得:
∣ P ( F ( A n ) ∈ E ) − P ( F n ∈ E ) ∣ ≤ exp ( − c n 2 α − 1 ) + P ( F ( A n ) ∈ E ) C n α − 1 |P(F(A_n) ∈ E) - P(F_n ∈ E)| ≤ \exp(-cn^{2α-1}) + P(F(A_n) ∈ E)Cn^{α-1} ∣ P ( F ( A n ) ∈ E ) − P ( F n ∈ E ) ∣ ≤ exp ( − c n 2 α − 1 ) + P ( F ( A n ) ∈ E ) C n α − 1
度限制树 :对于度集合Ω Ω Ω ,有lim n → ∞ d T V ( F ( A ~ n Ω ) , F n Ω ) = 0 \lim_{n→∞} d_{TV}(F(\tilde{A}_n^Ω), F_n^Ω) = 0 lim n → ∞ d T V ( F ( A ~ n Ω ) , F n Ω ) = 0 亚临界图类 :对于满足条件的图类C C C ,有lim n → ∞ d T V ( F ( C n • ) , C n ) = 0 \lim_{n→∞} d_{TV}(F(C_n^•), C_n) = 0 lim n → ∞ d T V ( F ( C n • ) , C n ) = 0 Cayley (1889) :标号树计数公式Pólya (1937) :一般计数理论和Pólya树Otter (1948) :无标号树的渐近公式Harary (1955) :dissymmetry方程的替代证明解析组合学方法 :Flajolet-Sedgewick的奇点分析概率方法 :随机树的性质研究转移定理 :从有根树到无根树的结果转移相比现有工作,本文首次:
提供了Otter公式的概率证明 建立了最强形式的随机树等价性 避免了复杂的dissymmetry方程 方法论贡献 :概率方法在组合计数中的成功应用理论突破 :建立了随机Pólya树与随机无标号树的完全等价性技术创新 :通过对称性分析和中偏差不等式的巧妙结合技术复杂性 :证明需要深入的概率论和组合学知识推广限制 :扩展到非树结构需要额外的技术条件计算复杂性 :常数的精确计算仍然困难非标号平面图 :将方法扩展到更复杂的图类函数式收敛 :研究轮廓函数的极限过程算法应用 :将理论结果应用于随机生成算法理论深度 :解决了组合数学中的经典问题,提供了全新视角技术创新 :巧妙结合了对称群理论、概率论和生成函数方法结果强度 :不仅重新证明了经典结果,还得到了更强的等价性定理方法普适性 :成功扩展到度限制和图类情况证明复杂性 :技术细节较多,理解门槛较高实际应用 :主要是理论贡献,直接应用价值有限计算方面 :对于具体计算常数等实际问题帮助有限学术价值 :为组合数学和概率论的交叉研究提供了重要范例方法论意义 :展示了概率方法在计数组合学中的强大潜力后续研究 :为相关问题的研究提供了新的技术工具理论研究 :组合结构的渐近分析随机算法 :树结构的随机生成和分析概率组合 :大型随机结构的性质研究论文引用了32篇重要文献,涵盖了从Cayley的经典工作到现代概率组合学的发展,特别是:
Otter (1948):原始的渐近公式 Pólya (1937):计数理论基础 Flajolet & Sedgewick (2009):解析组合学方法 作者之前的工作:随机树的极限理论 这篇论文在理论上具有重要价值,不仅提供了经典结果的新证明,更重要的是建立了随机树理论中的基本等价性,为该领域的进一步发展奠定了坚实基础。