2025-11-16T21:22:11.887650

Rare event probabilities in Random Geometric Graphs

Deka, Luo, Wu
In this paper, we study rare events in spherical and Gaussian random geometric graphs in high dimensions. In these models, the vertices correspond to points sampled uniformly at random on the $d$ dimensional unit sphere or correspond to $d$ dimensional standard Gaussian vectors, and edges are added between two vertices if the inner-product between their corresponding points are greater than a threshold $t_p$, chosen such that the probability of having an edge is equal to $p$. We focus on two problems: (a) the probability that the RGG is a complete graph, and (b) the probability of observing an atypically large number of edges. We obtain asymptotically exponential decay rates depending on $n$ and $d$ of the probabilities of these rare events through a combination of geometric and probabilistic arguments.
academic

Wahrscheinlichkeiten seltener Ereignisse in zufälligen geometrischen Graphen

Grundinformationen

  • Paper-ID: 2510.09196
  • Titel: Rare event probabilities in Random Geometric Graphs
  • Autoren: Prabhanka Deka (Beijing International Center for Mathematical Research, Peking-Universität), Fangzhou Luo (School of Mathematical Sciences, Peking-Universität), Baichuan Wu (School of Mathematical Sciences, Peking-Universität)
  • Klassifikation: math.PR (Wahrscheinlichkeitstheorie)
  • Veröffentlichungsdatum: 10. Oktober 2025 (arXiv-Preprint)
  • Paper-Link: https://arxiv.org/abs/2510.09196

Zusammenfassung

Dieses Paper untersucht seltene Ereignisse in hochdimensionalen Sphären und Gaußschen zufälligen geometrischen Graphen. In diesen Modellen entsprechen Knoten gleichmäßig zufällig gewählten Punkten auf der dd-dimensionalen Einheitssphäre oder dd-dimensionalen Standard-Gaußvektoren. Eine Kante wird zwischen zwei Knoten eingefügt, wenn das innere Produkt der entsprechenden Punkte einen Schwellenwert tpt_p übersteigt, wobei tpt_p so gewählt wird, dass die Wahrscheinlichkeit für das Vorhandensein einer Kante gleich pp ist. Das Paper konzentriert sich auf zwei Probleme: (a) die Wahrscheinlichkeit, dass der zufällige geometrische Graph ein vollständiger Graph ist, und (b) die Wahrscheinlichkeit, eine ungewöhnlich große Anzahl von Kanten zu beobachten. Durch eine Kombination geometrischer und wahrscheinlichkeitstheoretischer Argumente werden asymptotische Exponentialabfallraten dieser Wahrscheinlichkeiten seltener Ereignisse ermittelt, die von der Anzahl der Knoten nn und der Dimension dd abhängen.

Forschungshintergrund und Motivation

Problemdefinition

Die Kernprobleme dieser Forschung sind die Analyse zweier Klassen seltener Ereignisse in hochdimensionalen zufälligen geometrischen Graphen:

  1. Vollständige-Graph-Wahrscheinlichkeit: Die Wahrscheinlichkeit, dass der zufällige geometrische Graph ein vollständiger Graph wird (Kanten zwischen allen Knotenpaaren existieren)
  2. Große Abweichungen der Kantenzahl: Die Wahrscheinlichkeit, eine ungewöhnlich große Anzahl von Kanten zu beobachten

Forschungsbedeutung

  1. Theoretische Bedeutung: Zufällige geometrische Graphen sind grundlegende Werkzeuge zur Modellierung komplexer Systeme und werden in Informatik, Biologie, Soziologie und Physik weit verbreitet angewendet
  2. Praktische Anwendungen:
    • Anomalieerkennung und Hypothesentests
    • Analyse von Clique-Strukturen in hochdimensionalen Daten
    • Robustheitsanalyse geometrischer Netzwerkmodelle
    • Innenproduktsbasierte Ähnlichkeitsmessungen in neuronalen Netzen und Kernmethoden

Einschränkungen bestehender Forschung

  • Frühere Arbeiten fixierten typischerweise die Dimension dd und ließen die Knotenzahl nn gegen Unendlich gehen
  • Systematische Analyse hochdimensionaler dichter zufälliger geometrischer Graphen fehlte
  • Die komplexen Abhängigkeitsbeziehungen zwischen Kanten erschweren die Analyse erheblich

Kernbeiträge

  1. Etablierung eines vollständigen theoretischen Rahmens: Bereitstellung einer einheitlichen Analysemethode für seltene Ereignisse in sphärischen und Gaußschen zufälligen geometrischen Graphen
  2. Ermittlung präziser Abfallraten: Bereitstellung von Ober- und Untergrenzen für die Wahrscheinlichkeit vollständiger Graphen und großer Abweichungen der Kantenzahl unter verschiedenen nn- und dd-Beziehungen
  3. Entwicklung innovativer technischer Werkzeuge:
    • Anwendung sphärischer symmetrischer Umordnungstechniken
    • Kopplungsmethoden zwischen zwei Modellen
    • Organische Kombination geometrischer und wahrscheinlichkeitstheoretischer Argumente
  4. Offenlegung von Dimensionseffekten: Entdeckung, dass sich zufällige geometrische Graphen im hochdimensionalen Fall dem Erdős-Rényi-Modell ähneln, während sie im niedrigdimensionalen Fall unterschiedliche Eigenschaften aufweisen

Methodische Details

Modelldefinition

Sphärischer zufälliger geometrischer Graph (SRGG)

  • Knoten: (X1,,Xn)(X_1, \ldots, X_n) unabhängig und identisch verteilt gleichmäßig auf der dd-dimensionalen Einheitssphäre Sd1S^{d-1}
  • Kanten: Eine Kante existiert zwischen Knoten ii und jj, wenn Xi,Xjtp\langle X_i, X_j \rangle \geq t_p
  • Schwellenwert: tpt_p wird so gewählt, dass P(X1,X2tp)=pP(\langle X_1, X_2 \rangle \geq t_p) = p

Gaußscher zufälliger geometrischer Graph (GRGG)

  • Knoten: (X~1,,X~n)(\tilde{X}_1, \ldots, \tilde{X}_n) unabhängig und identisch verteilt nach der dd-dimensionalen Standardnormalverteilung
  • Kanten: Eine Kante existiert zwischen Knoten ii und jj, wenn X~i,X~jt~p\langle \tilde{X}_i, \tilde{X}_j \rangle \geq \tilde{t}_p
  • Schwellenwert: t~p\tilde{t}_p wird so gewählt, dass P(X~1,X~2t~p)=pP(\langle \tilde{X}_1, \tilde{X}_2 \rangle \geq \tilde{t}_p) = p

Kernmethodische Techniken

1. Kopplungstechnik

Durch die Beobachtung, dass X~/X~\tilde{X}/\|\tilde{X}\| gleichmäßig auf der Sphäre verteilt ist, wird eine Kopplungsbeziehung zwischen den beiden Modellen etabliert:

Lemma 3.2: Für festes p<1/2p < 1/2 und kleines δ>0\delta > 0 existieren Konstanten cδ,Δδc_\delta, \Delta_\delta, so dass: Pn,d(E~(n,d,p))exp(cδdn)+2nPn,d(E((1δ)n,d,q))P_{n,d}(\tilde{E}(n,d,p)) \leq \exp(-c_\delta dn) + 2^n P_{n,d}(E((1-\delta)n, d, q))

2. Symmetrische Umordnungstechnik

Nutzung symmetrischer Umordnung auf der Sphäre zur Behandlung komplexer geometrischer Nebenbedingungen:

Theorem 3.4: Für Funktionen f1,,fnf_1, \ldots, f_n auf der Sphäre und steigende Funktionen Ki,jK_{i,j} gilt: I[f1,,fn]I[f1,,fn]I[f_1, \ldots, f_n] \leq I[f_1^*, \ldots, f_n^*] wobei ff^* die symmetrische Umordnung von ff bezeichnet.

3. Asymptotisches Verhalten des Schwellenwerts

Lemma 3.1: Für festes p(0,1)p \in (0,1) gilt bei dd \to \infty:

  • t~p=(Φ1(p)+o(1))d\tilde{t}_p = (\Phi^{-1}(p) + o(1))\sqrt{d}
  • tp=(Φ1(p)+o(1))/dt_p = (\Phi^{-1}(p) + o(1))/\sqrt{d}

Hauptbeweisstrategien

Beweis der Untergrenzen

  1. Erdős-Rényi-Typ-Untergrenzen: Beweis von P(E)p(n2)P(E) \geq p^{\binom{n}{2}} durch geometrische Argumente
  2. Bias-Argumente: Im Gaußmodell wird eine kleine Verzerrung auf die erste Koordinate aller Vektoren angewendet
  3. Dimensionsabhängige Grenzen: Wenn logn<εd\log n < \varepsilon d, dann P(E~)exp(Cndlogn)P(\tilde{E}) \geq \exp(-Cn\sqrt{d \log n})

Beweis der Obergrenzen

  1. Bayessche Argumente: Nutzung der Eigenschaften der Statistik S=ijX~i,X~jS = \sum_{i \neq j} \langle \tilde{X}_i, \tilde{X}_j \rangle
  2. Sphärische-Kappe-Prozessanalyse: Umwandlung komplexer konvexer Mengenprozesse in Sphärische-Kappe-Prozesse durch symmetrische Umordnung
  3. Momentenerzeugungsfunktionsmethode: Verwendung der exponentiellen Markov-Ungleichung für Kantenabweichungsprobleme

Experimentelle Ergebnisse

Hauptergebnisse zur Wahrscheinlichkeit vollständiger Graphen

Nach Theorem 2.1 und Theorem 2.2 haben die Wahrscheinlichkeiten vollständiger Graphen in verschiedenen Dimensionsbereichen unterschiedliche Abfallraten:

DimensionsbereichUntergrenzeObergrenze
dn2d \gtrsim n^2Cn2-Cn^2cn2-cn^2
n2/logndn2n^2/\log n \lesssim d \lesssim n^2Cnd-Cn\sqrt{d}cn2-cn^2
n4/3+o(1)dn2/lognn^{4/3+o(1)} \lesssim d \lesssim n^2/\log nCnd-Cn\sqrt{d}cndlogn-cn\sqrt{d \log n}
logndn4/3+o(1)\log n \lesssim d \lesssim n^{4/3+o(1)}Cndlogn-Cn\sqrt{d \log n}cndlogn-cn\sqrt{d \log n}
dlognd \lesssim \log nCnd-Cndcnd-cnd

Hauptergebnisse zu großen Abweichungen der Kantenzahl

Theorem 2.3 und Theorem 2.4 geben präzise Grenzen für große Abweichungen der Kantenzahl:

Für das Ereignis Iε:={E(G)(1+ε)(n2)p}I_\varepsilon := \{|E(G)| \geq (1+\varepsilon)\binom{n}{2}p\} gilt: exp(cmin(n2,nd))P(Iε)exp(Cmin(n2,nd))\exp(-c\min(n^2, n\sqrt{d})) \leq P(I_\varepsilon) \leq \exp(-C\min(n^2, n\sqrt{d}))

Wichtigste Erkenntnisse

  1. Dimensionsschwelleneffekt: Wenn dnd \gtrsim \sqrt{n}, ist die Abfallrate exp(Ω(n2))\exp(-\Omega(n^2)), ähnlich wie beim Erdős-Rényi-Modell
  2. Erhaltung geometrischer Effekte: Wenn dnd \lesssim \sqrt{n}, ist die Abfallrate exp(Ω(nd))\exp(-\Omega(n\sqrt{d})), was die Auswirkungen der geometrischen Struktur widerspiegelt
  3. Übereinstimmende Ober- und Untergrenzen: In den Bereichen dn2d \geq n^2 und dn4/3+o(1)d \leq n^{4/3+o(1)} wurden übereinstimmende Ober- und Untergrenzen erreicht

Verwandte Arbeiten

Forschung zu hochdimensionalen zufälligen geometrischen Graphen

  • Devroye et al. (2011): Untersuchung von Cliquenzahlproblemen im Fall dlog(n)d \gg \log(n)
  • Bubeck et al. (2016): Etablierung eines geometrischen Erkennbarkeitsphasenübergangs: geometrisch erkennbar wenn dn3d \ll n^3, nicht erkennbar wenn dn3d \gg n^3

Theorie großer Abweichungen

  • Chatterjee & Harel (2020): Untersuchung großer Abweichungen der Kantenzahl in zufälligen geometrischen Graphen, die durch Poisson-Punktprozesse erzeugt werden
  • Schreiber & Yukich (2005): Etablierung von Prinzipien großer Abweichungen für Funktionale räumlicher Punktprozesse

Symmetrische Umordnungstechnik

  • Draghici (2005): Entwicklung der Theorie der Umordnungsungleichungen auf Sphären, die die Grundlage für die Kernwerkzeuge dieses Papers bildet

Technische Innovationen

1. Innovative Anwendung der Kopplungstechnik

Durch die Sphärenprojektionen X~/X~\tilde{X}/\|\tilde{X}\| wird eine Verbindung zwischen den beiden Modellen hergestellt, was wiederholte Analysen komplexer Natur vermeidet.

2. Innovative Anwendung geometrischer Werkzeuge in der Wahrscheinlichkeitstheorie

Innovative Anwendung der symmetrischen Umordnung, eines geometrischen Analysewerkzeugs, auf wahrscheinlichkeitstheoretische Probleme, besonders bei der Behandlung komplexer Kantenabhängigkeitsbeziehungen.

3. Mehrskalenanalysegerüst

Etablierung eines einheitlichen Analysegerüsts für verschiedene (n,d)(n,d)-Beziehungen, das Übergangsverhaltens vom niedrig- zum hochdimensionalen Fall offenlegt.

Einschränkungen und zukünftige Richtungen

Einschränkungen

  1. Technische Einschränkungen: Im mittleren Bereich n4/3dn2n^{4/3} \lesssim d \lesssim n^2 existiert eine Lücke zwischen Ober- und Untergrenzen
  2. Modelleinschränkungen: Hauptsächlich wird der Fall p1/2p \leq 1/2 betrachtet; die Analyse für p>1/2p > 1/2 ist relativ begrenzt
  3. Methodische Einschränkungen: Informationsverlust während des symmetrischen Umordnungsprozesses führt zu nicht ausreichend engen Grenzen in einigen Fällen

Zukünftige Forschungsrichtungen

  1. Verbesserung theoretischer Grenzen: Schließung der Lücke zwischen Ober- und Untergrenzen im mittleren Bereich
  2. Modellerweiterung: Betrachtung allgemeinerer pp-Werte und anderer geometrischer Metriken
  3. Algorithmische Anwendungen: Anwendung theoretischer Ergebnisse auf praktische Netzwerkanalyse und Machine-Learning-Probleme
  4. Dynamische Modelle: Untersuchung seltener Ereignisse in zeitvarianten zufälligen geometrischen Graphen

Tiefgreifende Bewertung

Stärken

  1. Theoretische Tiefe: Etablierung eines vollständigen mathematischen Theorierahmens, der tiefe Ergebnisse aus Geometrie, Wahrscheinlichkeitstheorie und Analysis kombiniert
  2. Technische Innovation: Die Anwendung der symmetrischen Umordnungstechnik in der Theorie zufälliger Graphen ist bahnbrechend
  3. Vollständigkeit der Ergebnisse: Präzise Ober- und Untergrenzen in mehreren Dimensionsbereichen zeigen die Komplexität des Problems
  4. Allgemeingültigkeit der Methoden: Die entwickelten Techniken können auf andere Probleme geometrischer zufälliger Graphen verallgemeinert werden

Mängel

  1. Unvollständigkeit: Die Nichtübereinstimmung von Ober- und Untergrenzen im mittleren Bereich beeinträchtigt die Vollständigkeit der Ergebnisse
  2. Praktische Einschränkungen: Hauptsächlich theoretische Ergebnisse ohne numerische Verifikation und praktische Anwendungsdemonstration
  3. Technische Komplexität: Die Beweistechniken sind relativ komplex, was die Verallgemeinerbarkeit der Ergebnisse möglicherweise einschränkt

Akademischer Einfluss

  1. Theoretischer Beitrag: Bereitstellung einer wichtigen theoretischen Grundlage für die Theorie hochdimensionaler zufälliger geometrischer Graphen
  2. Methodologischer Beitrag: Die Anwendung der symmetrischen Umordnungstechnik bietet neue Analysewerkzeuge für verwandte Probleme
  3. Inspirationswert: Die Offenlegung der Schlüsselrolle der Dimension in zufälligen geometrischen Graphen bietet Richtung für nachfolgende Forschung

Anwendbare Szenarien

  1. Theoretische Forschung: Theorie zufälliger Graphen, geometrische Wahrscheinlichkeitstheorie, hochdimensionale Phänomene
  2. Anwendungsfelder: Netzwerkwissenschaft, Kernmethoden im Machine Learning, hochdimensionale Statistik
  3. Algorithmisches Design: Algorithmusanalyse und -optimierung basierend auf geometrischen Graphen

Fazit

Dieses Paper erzielt wichtige theoretische Durchbrüche in der Analyse seltener Ereignisse in zufälligen geometrischen Graphen. Durch innovative Kombination von symmetrischen Umordnungstechniken und wahrscheinlichkeitstheoretischen Methoden wird eine systematische Analyse für die Probleme der Wahrscheinlichkeit vollständiger Graphen und großer Abweichungen der Kantenzahl in hochdimensionalen sphärischen und Gaußschen zufälligen geometrischen Graphen bereitgestellt. Obwohl in einigen technischen Details noch Verbesserungsspielraum besteht, legt der etablierte theoretische Rahmen und die gewonnenen tiefgreifenden Ergebnisse eine solide Grundlage für die Entwicklung dieses Forschungsbereichs und besitzen wichtigen akademischen Wert und Inspirationsbedeutung.