2025-11-16T21:22:11.887650

Rare event probabilities in Random Geometric Graphs

Deka, Luo, Wu
In this paper, we study rare events in spherical and Gaussian random geometric graphs in high dimensions. In these models, the vertices correspond to points sampled uniformly at random on the $d$ dimensional unit sphere or correspond to $d$ dimensional standard Gaussian vectors, and edges are added between two vertices if the inner-product between their corresponding points are greater than a threshold $t_p$, chosen such that the probability of having an edge is equal to $p$. We focus on two problems: (a) the probability that the RGG is a complete graph, and (b) the probability of observing an atypically large number of edges. We obtain asymptotically exponential decay rates depending on $n$ and $d$ of the probabilities of these rare events through a combination of geometric and probabilistic arguments.
academic

Probabilités d'événements rares dans les graphes géométriques aléatoires

Informations de base

  • ID de l'article: 2510.09196
  • Titre: Rare event probabilities in Random Geometric Graphs
  • Auteurs: Prabhanka Deka (Centre international de recherche mathématique de Pékin, Université de Pékin), Fangzhou Luo (École des sciences mathématiques, Université de Pékin), Baichuan Wu (École des sciences mathématiques, Université de Pékin)
  • Classification: math.PR (Théorie des probabilités)
  • Date de publication: 10 octobre 2025 (prépublication arXiv)
  • Lien de l'article: https://arxiv.org/abs/2510.09196

Résumé

Cet article étudie les événements rares dans les graphes géométriques aléatoires sur des sphères de haute dimension et dans les modèles gaussiens. Dans ces modèles, les sommets correspondent à des points échantillonnés uniformément aléatoirement sur la sphère unité de dimension dd ou à des vecteurs gaussiens standards de dimension dd. Une arête est ajoutée entre deux sommets lorsque le produit scalaire des points correspondants dépasse un seuil tpt_p, où tpt_p est choisi de sorte que la probabilité d'existence d'une arête soit égale à pp. Cet article se concentre sur deux problèmes: (a) la probabilité que le graphe géométrique aléatoire soit un graphe complet, et (b) la probabilité d'observer un nombre anormalement élevé d'arêtes. Par une combinaison d'arguments géométriques et probabilistes, les auteurs obtiennent les taux de décroissance exponentielle asymptotique des probabilités de ces événements rares, qui dépendent du nombre de sommets nn et de la dimension dd.

Contexte et motivation de la recherche

Définition du problème

Les problèmes fondamentaux étudiés dans cet article concernent l'analyse de deux classes d'événements rares dans les graphes géométriques aléatoires de haute dimension:

  1. Probabilité de graphe complet: la probabilité que le graphe géométrique aléatoire devienne un graphe complet (avec des arêtes entre toutes les paires de sommets)
  2. Grandes déviations du nombre d'arêtes: la probabilité d'observer un nombre anormalement élevé d'arêtes

Importance de la recherche

  1. Signification théorique: Les graphes géométriques aléatoires sont des outils fondamentaux pour modéliser les systèmes complexes, largement appliqués en informatique, biologie, sociologie et physique
  2. Applications pratiques:
    • Détection d'anomalies et tests d'hypothèses
    • Analyse des structures de cliques dans les données de haute dimension
    • Analyse de robustesse des modèles de réseaux géométriques
    • Mesures de similarité basées sur le produit scalaire dans les réseaux de neurones et les méthodes à noyau

Limitations des travaux antérieurs

  • Les travaux précédents fixaient principalement la dimension dd et laissaient le nombre de sommets nn tendre vers l'infini
  • Absence d'analyse systématique des graphes géométriques aléatoires denses de haute dimension
  • Les dépendances complexes entre les arêtes rendent l'analyse difficile

Contributions principales

  1. Établissement d'un cadre théorique complet: Fournit une méthode d'analyse unifiée pour les événements rares dans les graphes géométriques aléatoires sphériques et gaussiens
  2. Obtention de taux de décroissance précis: Fournit des bornes supérieures et inférieures pour la probabilité de graphe complet et la probabilité de grandes déviations du nombre d'arêtes sous différentes relations entre nn et dd
  3. Développement d'outils techniques innovants:
    • Application de la technique de réarrangement symétrique sphérique
    • Méthode d'accouplement entre les deux modèles
    • Combinaison organique d'arguments géométriques et probabilistes
  4. Révélation des effets de dimension: Découverte que pour les cas de haute dimension, le comportement des graphes géométriques aléatoires se rapproche du modèle d'Erdős-Rényi, tandis que pour les basses dimensions, il présente des caractéristiques différentes

Explication détaillée des méthodes

Définition des modèles

Graphe géométrique aléatoire sphérique (SRGG)

  • Sommets: (X1,,Xn)(X_1, \ldots, X_n) distribués indépendamment et identiquement de manière uniforme sur la sphère unité Sd1S^{d-1} de dimension dd
  • Arêtes: Une arête existe entre les sommets ii et jj lorsque Xi,Xjtp\langle X_i, X_j \rangle \geq t_p
  • Seuil: tpt_p est choisi de sorte que P(X1,X2tp)=pP(\langle X_1, X_2 \rangle \geq t_p) = p

Graphe géométrique aléatoire gaussien (GRGG)

  • Sommets: (X~1,,X~n)(\tilde{X}_1, \ldots, \tilde{X}_n) distribués indépendamment et identiquement selon une distribution normale standard de dimension dd
  • Arêtes: Une arête existe entre les sommets ii et jj lorsque X~i,X~jt~p\langle \tilde{X}_i, \tilde{X}_j \rangle \geq \tilde{t}_p
  • Seuil: t~p\tilde{t}_p est choisi de sorte que P(X~1,X~2t~p)=pP(\langle \tilde{X}_1, \tilde{X}_2 \rangle \geq \tilde{t}_p) = p

Méthodes techniques principales

1. Technique d'accouplement de modèles

En observant que X~/X~\tilde{X}/\|\tilde{X}\| est uniformément distribué sur la sphère, on établit une relation d'accouplement entre les deux modèles:

Lemme 3.2: Pour un pp fixe avec p<1/2p < 1/2 et un petit δ>0\delta > 0, il existe des constantes cδ,Δδc_\delta, \Delta_\delta telles que: Pn,d(E~(n,d,p))exp(cδdn)+2nPn,d(E((1δ)n,d,q))P_{n,d}(\tilde{E}(n,d,p)) \leq \exp(-c_\delta dn) + 2^n P_{n,d}(E((1-\delta)n, d, q))

2. Technique de réarrangement symétrique

Utilisation du réarrangement symétrique sur la sphère pour traiter les contraintes géométriques complexes:

Théorème 3.4: Pour les fonctions f1,,fnf_1, \ldots, f_n sur la sphère et une fonction croissante Ki,jK_{i,j}, on a: I[f1,,fn]I[f1,,fn]I[f_1, \ldots, f_n] \leq I[f_1^*, \ldots, f_n^*]ff^* désigne le réarrangement symétrique de ff.

3. Comportement asymptotique du seuil

Lemme 3.1: Pour un pp fixe dans (0,1)(0,1), lorsque dd \to \infty:

  • t~p=(Φ1(p)+o(1))d\tilde{t}_p = (\Phi^{-1}(p) + o(1))\sqrt{d}
  • tp=(Φ1(p)+o(1))/dt_p = (\Phi^{-1}(p) + o(1))/\sqrt{d}

Stratégies principales de preuve

Preuve de la borne inférieure

  1. Borne inférieure de type Erdős-Rényi: Preuve par argument géométrique que P(E)p(n2)P(E) \geq p^{\binom{n}{2}}
  2. Argument de biais: Dans le modèle gaussien, imposition d'un petit biais sur la première coordonnée de tous les vecteurs
  3. Borne dépendant de la dimension: Lorsque logn<εd\log n < \varepsilon d, P(E~)exp(Cndlogn)P(\tilde{E}) \geq \exp(-Cn\sqrt{d \log n})

Preuve de la borne supérieure

  1. Argument bayésien: Utilisation des propriétés de la statistique S=ijX~i,X~jS = \sum_{i \neq j} \langle \tilde{X}_i, \tilde{X}_j \rangle
  2. Analyse du processus de calotte sphérique: Transformation du processus d'ensemble convexe complexe en processus de calotte sphérique par réarrangement symétrique
  3. Méthode de la fonction génératrice des moments: Utilisation de l'inégalité exponentielle de Markov pour le problème de déviation du nombre d'arêtes

Résultats expérimentaux

Résultats principaux pour la probabilité de graphe complet

Selon les Théorèmes 2.1 et 2.2, la probabilité de graphe complet présente différents taux de décroissance selon les intervalles de dimension:

Intervalle de dimensionBorne inférieureBorne supérieure
dn2d \gtrsim n^2Cn2-Cn^2cn2-cn^2
n2/logndn2n^2/\log n \lesssim d \lesssim n^2Cnd-Cn\sqrt{d}cn2-cn^2
n4/3+o(1)dn2/lognn^{4/3+o(1)} \lesssim d \lesssim n^2/\log nCnd-Cn\sqrt{d}cndlogn-cn\sqrt{d \log n}
logndn4/3+o(1)\log n \lesssim d \lesssim n^{4/3+o(1)}Cndlogn-Cn\sqrt{d \log n}cndlogn-cn\sqrt{d \log n}
dlognd \lesssim \log nCnd-Cndcnd-cnd

Résultats principaux pour les grandes déviations du nombre d'arêtes

Les Théorèmes 2.3 et 2.4 fournissent les bornes précises pour les grandes déviations du nombre d'arêtes:

Pour l'événement Iε:={E(G)(1+ε)(n2)p}I_\varepsilon := \{|E(G)| \geq (1+\varepsilon)\binom{n}{2}p\}, on a: exp(cmin(n2,nd))P(Iε)exp(Cmin(n2,nd))\exp(-c\min(n^2, n\sqrt{d})) \leq P(I_\varepsilon) \leq \exp(-C\min(n^2, n\sqrt{d}))

Découvertes clés

  1. Effet de seuil de dimension: Lorsque dnd \gtrsim \sqrt{n}, le taux de décroissance est exp(Ω(n2))\exp(-\Omega(n^2)), similaire au modèle d'Erdős-Rényi
  2. Persistance de l'effet géométrique: Lorsque dnd \lesssim \sqrt{n}, le taux de décroissance est exp(Ω(nd))\exp(-\Omega(n\sqrt{d})), reflétant l'influence de la structure géométrique
  3. Bornes supérieures et inférieures concordantes: Obtention de bornes concordantes dans les intervalles dn2d \geq n^2 et dn4/3+o(1)d \leq n^{4/3+o(1)}

Travaux connexes

Recherche sur les graphes géométriques aléatoires de haute dimension

  • Devroye et al. (2011): Étude du nombre de cliques dans le cas dlog(n)d \gg \log(n)
  • Bubeck et al. (2016): Établissement d'une transition de détectabilité géométrique: détectable géométriquement lorsque dn3d \ll n^3, non détectable lorsque dn3d \gg n^3

Théorie des grandes déviations

  • Chatterjee & Harel (2020): Étude des grandes déviations du nombre d'arêtes dans les graphes géométriques aléatoires générés par des processus ponctuels de Poisson
  • Schreiber & Yukich (2005): Établissement du principe des grandes déviations pour les fonctionnelles de processus ponctuels spatiaux

Technique de réarrangement symétrique

  • Draghici (2005): Développement de la théorie des inégalités de réarrangement sur la sphère, fournissant la base pour l'outil technique principal de cet article

Points d'innovation technique

1. Application innovante de la technique d'accouplement

Établissement de la relation entre les deux modèles par projection sphérique de X~/X~\tilde{X}/\|\tilde{X}\|, évitant la complexité d'une analyse répétée.

2. Application probabiliste des outils géométriques

Application innovante du réarrangement symétrique, un outil d'analyse géométrique, aux problèmes de théorie des probabilités, particulièrement dans le traitement des relations de dépendance complexes entre les arêtes.

3. Cadre d'analyse multi-échelle

Établissement d'un cadre d'analyse unifié pour différentes relations (n,d)(n,d), révélant le comportement de transition de la basse dimension à la haute dimension.

Limitations et directions futures

Limitations

  1. Limitations techniques: Dans l'intervalle intermédiaire n4/3dn2n^{4/3} \lesssim d \lesssim n^2, il existe un écart entre les bornes supérieures et inférieures
  2. Limitations du modèle: Considération principale du cas p1/2p \leq 1/2, analyse relativement limitée pour p>1/2p > 1/2
  3. Limitations des méthodes: Perte d'information lors du processus de réarrangement symétrique conduisant à des bornes non suffisamment serrées

Directions de recherche futures

  1. Perfectionnement des bornes théoriques: Réduction de l'écart entre les bornes supérieures et inférieures dans l'intervalle intermédiaire
  2. Extension du modèle: Considération de valeurs de pp plus générales et d'autres mesures géométriques
  3. Applications algorithmiques: Application des résultats théoriques à l'analyse de réseaux pratiques et aux problèmes d'apprentissage automatique
  4. Modèles dynamiques: Étude des événements rares dans les graphes géométriques aléatoires variant dans le temps

Évaluation approfondie

Points forts

  1. Profondeur théorique: Établissement d'un cadre mathématique complet combinant des résultats profonds de la géométrie, de la théorie des probabilités et de l'analyse
  2. Innovation technique: Application de la technique de réarrangement symétrique à la théorie des graphes aléatoires est novatrice
  3. Complétude des résultats: Fourniture de bornes précises supérieures et inférieures sur plusieurs intervalles de dimension, démontrant la complexité du problème
  4. Généralité des méthodes: Les techniques développées peuvent être généralisées à d'autres problèmes de graphes géométriques aléatoires

Insuffisances

  1. Défaut de complétude: L'absence de concordance entre les bornes supérieures et inférieures dans l'intervalle intermédiaire affecte la complétude des résultats
  2. Limitations pratiques: Résultats principalement théoriques, manque de vérification numérique et de démonstration d'applications pratiques
  3. Complexité technique: Les techniques de preuve sont relativement complexes, ce qui peut limiter la généralisabilité des résultats

Impact académique

  1. Contribution théorique: Fourniture d'une base théorique importante pour la théorie des graphes géométriques aléatoires de haute dimension
  2. Contribution méthodologique: Application de la technique de réarrangement symétrique fournissant un nouvel outil d'analyse pour les problèmes connexes
  3. Valeur inspiratrice: Révélation du rôle clé de la dimension dans les graphes géométriques aléatoires, fournissant une direction pour les recherches ultérieures

Scénarios d'application

  1. Recherche théorique: Théorie des graphes aléatoires, probabilité géométrique, étude des phénomènes de haute dimension
  2. Domaines d'application: Science des réseaux, méthodes à noyau en apprentissage automatique, statistiques de haute dimension
  3. Conception d'algorithmes: Analyse et optimisation d'algorithmes basés sur des graphes géométriques

Conclusion

Cet article réalise une percée théorique importante dans l'analyse des événements rares dans les graphes géométriques aléatoires. En combinant de manière innovante la technique de réarrangement symétrique et les méthodes probabilistes, il fournit une analyse systématique pour les problèmes de probabilité de graphe complet et de grandes déviations du nombre d'arêtes dans les graphes géométriques aléatoires sphériques et gaussiens de haute dimension. Bien qu'il y ait encore de la place pour l'amélioration dans certains détails techniques, le cadre théorique établi et les résultats profonds obtenus posent une base solide pour le développement de ce domaine, possédant une valeur académique importante et une signification inspiratrice.