In this paper, we study rare events in spherical and Gaussian random geometric graphs in high dimensions. In these models, the vertices correspond to points sampled uniformly at random on the $d$ dimensional unit sphere or correspond to $d$ dimensional standard Gaussian vectors, and edges are added between two vertices if the inner-product between their corresponding points are greater than a threshold $t_p$, chosen such that the probability of having an edge is equal to $p$. We focus on two problems: (a) the probability that the RGG is a complete graph, and (b) the probability of observing an atypically large number of edges. We obtain asymptotically exponential decay rates depending on $n$ and $d$ of the probabilities of these rare events through a combination of geometric and probabilistic arguments.
Rare event probabilities in Random Geometric Graphs 论文ID : 2510.09196标题 : Rare event probabilities in Random Geometric Graphs作者 : Prabhanka Deka (北京大学北京国际数学研究中心), Fangzhou Luo (北京大学数学科学学院), Baichuan Wu (北京大学数学科学学院)分类 : math.PR (概率论)发表时间 : 2025年10月10日 (arXiv预印本)论文链接 : https://arxiv.org/abs/2510.09196 本文研究高维球面和高斯随机几何图中的稀有事件。在这些模型中,顶点对应于d维单位球面上的均匀随机采样点或d维标准高斯向量,当两个顶点对应点的内积大于阈值t p t_p t p 时在它们之间添加边,其中t p t_p t p 的选择使得边存在的概率等于p p p 。本文专注于两个问题:(a) 随机几何图为完全图的概率,以及 (b) 观察到异常大量边数的概率。通过几何和概率论证的结合,获得了这些稀有事件概率的渐近指数衰减率,该衰减率依赖于顶点数n n n 和维数d d d 。
本文研究的核心问题是在高维随机几何图中分析两类稀有事件:
完全图概率 :随机几何图成为完全图(所有顶点对之间都有边)的概率边数大偏差 :观察到异常大量边数的概率理论意义 :随机几何图是建模复杂系统的基础工具,在计算机科学、生物学、社会学和物理学等领域广泛应用实际应用 :
异常检测和假设检验 高维数据中的团结构分析 几何网络模型的鲁棒性分析 神经网络和核方法中基于内积的相似性度量 以往工作主要固定维数d d d ,让顶点数n n n 趋于无穷 缺乏对高维稠密随机几何图的系统分析 边之间的复杂依赖关系使得分析具有挑战性 建立了完整的理论框架 :为球面和高斯随机几何图中的稀有事件提供了统一的分析方法获得了精确的衰减率 :在不同的n n n 和d d d 关系下,给出了完全图概率和边数大偏差概率的上下界开发了创新的技术工具 :
球面对称重排技术的应用 两种模型之间的耦合方法 几何和概率论证的有机结合 揭示了维数效应 :发现在高维情况下,随机几何图的行为接近Erdős-Rényi模型,而在低维时表现出不同特性顶点:( X 1 , … , X n ) (X_1, \ldots, X_n) ( X 1 , … , X n ) 独立同分布地均匀分布在d d d 维单位球面S d − 1 S^{d-1} S d − 1 上 边:当⟨ X i , X j ⟩ ≥ t p \langle X_i, X_j \rangle \geq t_p ⟨ X i , X j ⟩ ≥ t p 时,顶点i i i 和j j j 之间有边 阈值:t p t_p t p 选择使得P ( ⟨ X 1 , X 2 ⟩ ≥ t p ) = p P(\langle X_1, X_2 \rangle \geq t_p) = p P (⟨ X 1 , X 2 ⟩ ≥ t p ) = p 顶点:( X ~ 1 , … , X ~ n ) (\tilde{X}_1, \ldots, \tilde{X}_n) ( X ~ 1 , … , X ~ n ) 独立同分布地服从d d d 维标准正态分布 边:当⟨ X ~ i , X ~ j ⟩ ≥ t ~ p \langle \tilde{X}_i, \tilde{X}_j \rangle \geq \tilde{t}_p ⟨ X ~ i , X ~ j ⟩ ≥ t ~ p 时,顶点i i i 和j j j 之间有边 阈值:t ~ p \tilde{t}_p t ~ p 选择使得P ( ⟨ X ~ 1 , X ~ 2 ⟩ ≥ t ~ p ) = p P(\langle \tilde{X}_1, \tilde{X}_2 \rangle \geq \tilde{t}_p) = p P (⟨ X ~ 1 , X ~ 2 ⟩ ≥ t ~ p ) = p 通过观察到X ~ / ∥ X ~ ∥ \tilde{X}/\|\tilde{X}\| X ~ /∥ X ~ ∥ 在球面上均匀分布,建立两种模型的耦合关系:
引理 3.2 :对于固定p < 1 / 2 p < 1/2 p < 1/2 和小的δ > 0 \delta > 0 δ > 0 ,存在常数c δ , Δ δ c_\delta, \Delta_\delta c δ , Δ δ ,使得:
P n , d ( E ~ ( n , d , p ) ) ≤ exp ( − c δ d n ) + 2 n P n , d ( E ( ( 1 − δ ) n , d , q ) ) P_{n,d}(\tilde{E}(n,d,p)) \leq \exp(-c_\delta dn) + 2^n P_{n,d}(E((1-\delta)n, d, q)) P n , d ( E ~ ( n , d , p )) ≤ exp ( − c δ d n ) + 2 n P n , d ( E (( 1 − δ ) n , d , q ))
利用球面上的对称重排来处理复杂的几何约束:
定理 3.4 :对于球面上的函数f 1 , … , f n f_1, \ldots, f_n f 1 , … , f n 和增函数K i , j K_{i,j} K i , j ,有:
I [ f 1 , … , f n ] ≤ I [ f 1 ∗ , … , f n ∗ ] I[f_1, \ldots, f_n] \leq I[f_1^*, \ldots, f_n^*] I [ f 1 , … , f n ] ≤ I [ f 1 ∗ , … , f n ∗ ]
其中f ∗ f^* f ∗ 表示f f f 的对称重排。
引理 3.1 :对于固定p ∈ ( 0 , 1 ) p \in (0,1) p ∈ ( 0 , 1 ) ,当d → ∞ d \to \infty d → ∞ 时:
t ~ p = ( Φ − 1 ( p ) + o ( 1 ) ) d \tilde{t}_p = (\Phi^{-1}(p) + o(1))\sqrt{d} t ~ p = ( Φ − 1 ( p ) + o ( 1 )) d t p = ( Φ − 1 ( p ) + o ( 1 ) ) / d t_p = (\Phi^{-1}(p) + o(1))/\sqrt{d} t p = ( Φ − 1 ( p ) + o ( 1 )) / d Erdős-Rényi类型下界 :通过几何论证证明P ( E ) ≥ p ( n 2 ) P(E) \geq p^{\binom{n}{2}} P ( E ) ≥ p ( 2 n ) 偏置论证 :在高斯模型中,对所有向量的第一个坐标施加小的偏置维数依赖界 :当log n < ε d \log n < \varepsilon d log n < ε d 时,P ( E ~ ) ≥ exp ( − C n d log n ) P(\tilde{E}) \geq \exp(-Cn\sqrt{d \log n}) P ( E ~ ) ≥ exp ( − C n d log n ) 贝叶斯论证 :利用统计量S = ∑ i ≠ j ⟨ X ~ i , X ~ j ⟩ S = \sum_{i \neq j} \langle \tilde{X}_i, \tilde{X}_j \rangle S = ∑ i = j ⟨ X ~ i , X ~ j ⟩ 的性质球帽过程分析 :通过对称重排将复杂的凸集过程转化为球帽过程矩生成函数方法 :对边数偏差问题使用指数马尔可夫不等式根据定理 2.1 和定理 2.2 ,完全图概率在不同维数区间有不同的衰减率:
维数区间 下界 上界 d ≳ n 2 d \gtrsim n^2 d ≳ n 2 − C n 2 -Cn^2 − C n 2 − c n 2 -cn^2 − c n 2 n 2 / log n ≲ d ≲ n 2 n^2/\log n \lesssim d \lesssim n^2 n 2 / log n ≲ d ≲ n 2 − C n d -Cn\sqrt{d} − C n d − c n 2 -cn^2 − c n 2 n 4 / 3 + o ( 1 ) ≲ d ≲ n 2 / log n n^{4/3+o(1)} \lesssim d \lesssim n^2/\log n n 4/3 + o ( 1 ) ≲ d ≲ n 2 / log n − C n d -Cn\sqrt{d} − C n d − c n d log n -cn\sqrt{d \log n} − c n d log n log n ≲ d ≲ n 4 / 3 + o ( 1 ) \log n \lesssim d \lesssim n^{4/3+o(1)} log n ≲ d ≲ n 4/3 + o ( 1 ) − C n d log n -Cn\sqrt{d \log n} − C n d log n − c n d log n -cn\sqrt{d \log n} − c n d log n d ≲ log n d \lesssim \log n d ≲ log n − C n d -Cnd − C n d − c n d -cnd − c n d
定理 2.3 和定理 2.4 给出了边数大偏差的精确界:
对于事件I ε : = { ∣ E ( G ) ∣ ≥ ( 1 + ε ) ( n 2 ) p } I_\varepsilon := \{|E(G)| \geq (1+\varepsilon)\binom{n}{2}p\} I ε := { ∣ E ( G ) ∣ ≥ ( 1 + ε ) ( 2 n ) p } ,有:
exp ( − c min ( n 2 , n d ) ) ≤ P ( I ε ) ≤ exp ( − C min ( n 2 , n d ) ) \exp(-c\min(n^2, n\sqrt{d})) \leq P(I_\varepsilon) \leq \exp(-C\min(n^2, n\sqrt{d})) exp ( − c min ( n 2 , n d )) ≤ P ( I ε ) ≤ exp ( − C min ( n 2 , n d ))
维数阈值效应 :当d ≳ n d \gtrsim \sqrt{n} d ≳ n 时,衰减率为exp ( − Ω ( n 2 ) ) \exp(-\Omega(n^2)) exp ( − Ω ( n 2 )) ,类似于Erdős-Rényi模型几何效应保持 :当d ≲ n d \lesssim \sqrt{n} d ≲ n 时,衰减率为exp ( − Ω ( n d ) ) \exp(-\Omega(n\sqrt{d})) exp ( − Ω ( n d )) ,体现了几何结构的影响匹配上下界 :在区间d ≥ n 2 d \geq n^2 d ≥ n 2 和d ≤ n 4 / 3 + o ( 1 ) d \leq n^{4/3+o(1)} d ≤ n 4/3 + o ( 1 ) 获得了匹配的上下界Devroye等 (2011) :研究了d ≫ log ( n ) d \gg \log(n) d ≫ log ( n ) 情况下的团数问题Bubeck等 (2016) :建立了几何可检测性的相变:d ≪ n 3 d \ll n^3 d ≪ n 3 时几何可检测,d ≫ n 3 d \gg n^3 d ≫ n 3 时不可检测Chatterjee & Harel (2020) :研究了泊松点过程生成的随机几何图中边数的大偏差Schreiber & Yukich (2005) :建立了空间点过程泛函的大偏差原理Draghici (2005) :发展了球面上的重排不等式理论,为本文的核心技术工具提供了基础通过X ~ / ∥ X ~ ∥ \tilde{X}/\|\tilde{X}\| X ~ /∥ X ~ ∥ 的球面投影建立两种模型的联系,避免了重复分析的复杂性。
将对称重排这一几何分析工具创新性地应用于概率论问题,特别是在处理复杂的边依赖关系方面。
针对不同的( n , d ) (n,d) ( n , d ) 关系建立了统一的分析框架,揭示了从低维到高维的过渡行为。
技术限制 :在中间区间n 4 / 3 ≲ d ≲ n 2 n^{4/3} \lesssim d \lesssim n^2 n 4/3 ≲ d ≲ n 2 ,上下界存在gap模型限制 :主要考虑p ≤ 1 / 2 p \leq 1/2 p ≤ 1/2 的情况,对于p > 1 / 2 p > 1/2 p > 1/2 的分析相对有限方法限制 :对称重排过程中信息损失导致某些界不够紧完善理论界 :缩小中间区间的上下界gap扩展模型 :考虑更一般的p p p 值和其他几何度量算法应用 :将理论结果应用于实际的网络分析和机器学习问题动态模型 :研究时变随机几何图的稀有事件理论深度 :建立了完整的数学理论框架,结合了几何学、概率论和分析学的深刻结果技术创新 :对称重排技术在随机图理论中的应用具有开创性结果完整性 :在多个维数区间给出了精确的上下界,展现了问题的复杂性方法通用性 :所develop的技术可以推广到其他几何随机图问题完整性缺陷 :中间区间的上下界不匹配影响了结果的完整性实用性限制 :主要是理论结果,缺乏数值验证和实际应用展示技术复杂性 :证明技术较为复杂,可能限制了结果的可推广性理论贡献 :为高维随机几何图理论提供了重要的理论基础方法论贡献 :对称重排技术的应用为相关问题提供了新的分析工具启发价值 :揭示了维数在随机几何图中的关键作用,为后续研究提供了方向理论研究 :随机图理论、几何概率论、高维现象研究应用领域 :网络科学、机器学习中的核方法、高维统计算法设计 :基于几何图的算法分析和优化本文在随机几何图的稀有事件分析方面取得了重要的理论突破。通过创新性地结合对称重排技术和概率论方法,为高维球面和高斯随机几何图中的完全图概率和边数大偏差问题提供了系统性的分析。虽然在某些技术细节上还有改进空间,但其建立的理论框架和获得的深刻结果为该领域的发展奠定了坚实基础,具有重要的学术价值和启发意义。