2025-11-16T21:22:11.887650

Rare event probabilities in Random Geometric Graphs

Deka, Luo, Wu
In this paper, we study rare events in spherical and Gaussian random geometric graphs in high dimensions. In these models, the vertices correspond to points sampled uniformly at random on the $d$ dimensional unit sphere or correspond to $d$ dimensional standard Gaussian vectors, and edges are added between two vertices if the inner-product between their corresponding points are greater than a threshold $t_p$, chosen such that the probability of having an edge is equal to $p$. We focus on two problems: (a) the probability that the RGG is a complete graph, and (b) the probability of observing an atypically large number of edges. We obtain asymptotically exponential decay rates depending on $n$ and $d$ of the probabilities of these rare events through a combination of geometric and probabilistic arguments.
academic

Probabilidades de eventos raros en Grafos Geométricos Aleatorios

Información Básica

  • ID del Artículo: 2510.09196
  • Título: Probabilidades de eventos raros en Grafos Geométricos Aleatorios
  • Autores: Prabhanka Deka (Centro Internacional de Investigación Matemática de Beijing, Universidad de Beijing), Fangzhou Luo (Escuela de Ciencias Matemáticas, Universidad de Beijing), Baichuan Wu (Escuela de Ciencias Matemáticas, Universidad de Beijing)
  • Clasificación: math.PR (Teoría de Probabilidades)
  • Fecha de Publicación: 10 de octubre de 2025 (preimpresión en arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2510.09196

Resumen

Este artículo estudia eventos raros en esferas de alta dimensión y grafos geométricos aleatorios gaussianos. En estos modelos, los vértices corresponden a puntos muestreados uniformemente al azar en la esfera unitaria dd-dimensional o a vectores gaussianos estándar dd-dimensionales. Se añade una arista entre dos vértices cuando el producto interno de los puntos correspondientes excede un umbral tpt_p, donde tpt_p se elige de modo que la probabilidad de existencia de una arista sea igual a pp. El artículo se enfoca en dos problemas: (a) la probabilidad de que el grafo geométrico aleatorio sea un grafo completo, y (b) la probabilidad de observar un número anormalmente grande de aristas. Mediante una combinación de argumentos geométricos y probabilísticos, se obtienen tasas de decaimiento exponencial asintótico para las probabilidades de estos eventos raros, que dependen del número de vértices nn y la dimensión dd.

Contexto de Investigación y Motivación

Definición del Problema

Los problemas centrales estudiados en este artículo son el análisis de dos clases de eventos raros en grafos geométricos aleatorios de alta dimensión:

  1. Probabilidad de grafo completo: La probabilidad de que un grafo geométrico aleatorio sea un grafo completo (con aristas entre todos los pares de vértices)
  2. Gran desviación del número de aristas: La probabilidad de observar un número anormalmente grande de aristas

Importancia de la Investigación

  1. Significado Teórico: Los grafos geométricos aleatorios son herramientas fundamentales para modelar sistemas complejos, con aplicaciones generalizadas en ciencias de la computación, biología, sociología y física
  2. Aplicaciones Prácticas:
    • Detección de anomalías y pruebas de hipótesis
    • Análisis de estructuras de cliques en datos de alta dimensión
    • Análisis de robustez de modelos de redes geométricas
    • Medidas de similitud basadas en productos internos en redes neuronales y métodos kernel

Limitaciones de la Investigación Existente

  • Trabajos anteriores principalmente fijaban la dimensión dd y hacían tender el número de vértices nn al infinito
  • Falta de análisis sistemático de grafos geométricos aleatorios densos de alta dimensión
  • Las complejas dependencias entre aristas hacen que el análisis sea desafiante

Contribuciones Principales

  1. Establecimiento de un marco teórico completo: Se proporciona un método de análisis unificado para eventos raros en grafos geométricos aleatorios esféricos y gaussianos
  2. Obtención de tasas de decaimiento precisas: Se proporcionan cotas superiores e inferiores para la probabilidad de grafo completo y la probabilidad de gran desviación del número de aristas bajo diferentes relaciones entre nn y dd
  3. Desarrollo de herramientas técnicas innovadoras:
    • Aplicación de técnicas de reordenamiento simétrico esférico
    • Métodos de acoplamiento entre dos modelos
    • Combinación orgánica de argumentos geométricos y probabilísticos
  4. Revelación de efectos dimensionales: Se descubre que en casos de alta dimensión, el comportamiento del grafo geométrico aleatorio es cercano al modelo de Erdős-Rényi, mientras que en baja dimensión exhibe características diferentes

Explicación Detallada de Métodos

Definición del Modelo

Grafo Geométrico Aleatorio Esférico (SRGG)

  • Vértices: (X1,,Xn)(X_1, \ldots, X_n) distribuidos independiente e idénticamente de manera uniforme en la esfera unitaria dd-dimensional Sd1S^{d-1}
  • Aristas: Existe una arista entre los vértices ii y jj cuando Xi,Xjtp\langle X_i, X_j \rangle \geq t_p
  • Umbral: tpt_p se elige de modo que P(X1,X2tp)=pP(\langle X_1, X_2 \rangle \geq t_p) = p

Grafo Geométrico Aleatorio Gaussiano (GRGG)

  • Vértices: (X~1,,X~n)(\tilde{X}_1, \ldots, \tilde{X}_n) distribuidos independiente e idénticamente según la distribución normal estándar dd-dimensional
  • Aristas: Existe una arista entre los vértices ii y jj cuando X~i,X~jt~p\langle \tilde{X}_i, \tilde{X}_j \rangle \geq \tilde{t}_p
  • Umbral: t~p\tilde{t}_p se elige de modo que P(X~1,X~2t~p)=pP(\langle \tilde{X}_1, \tilde{X}_2 \rangle \geq \tilde{t}_p) = p

Métodos Técnicos Principales

1. Técnica de Acoplamiento de Modelos

Se establece la relación de acoplamiento entre dos modelos observando que X~/X~\tilde{X}/\|\tilde{X}\| se distribuye uniformemente en la esfera:

Lema 3.2: Para p<1/2p < 1/2 fijo y δ>0\delta > 0 pequeño, existen constantes cδ,Δδc_\delta, \Delta_\delta tales que: Pn,d(E~(n,d,p))exp(cδdn)+2nPn,d(E((1δ)n,d,q))P_{n,d}(\tilde{E}(n,d,p)) \leq \exp(-c_\delta dn) + 2^n P_{n,d}(E((1-\delta)n, d, q))

2. Técnica de Reordenamiento Simétrico

Se utilizan reordenamientos simétricos en la esfera para manejar restricciones geométricas complejas:

Teorema 3.4: Para funciones f1,,fnf_1, \ldots, f_n en la esfera y una función creciente Ki,jK_{i,j}, se tiene: I[f1,,fn]I[f1,,fn]I[f_1, \ldots, f_n] \leq I[f_1^*, \ldots, f_n^*] donde ff^* denota el reordenamiento simétrico de ff.

3. Comportamiento Asintótico del Umbral

Lema 3.1: Para p(0,1)p \in (0,1) fijo, cuando dd \to \infty:

  • t~p=(Φ1(p)+o(1))d\tilde{t}_p = (\Phi^{-1}(p) + o(1))\sqrt{d}
  • tp=(Φ1(p)+o(1))/dt_p = (\Phi^{-1}(p) + o(1))/\sqrt{d}

Estrategia Principal de Demostración

Demostración de Cotas Inferiores

  1. Cota inferior tipo Erdős-Rényi: Se demuestra P(E)p(n2)P(E) \geq p^{\binom{n}{2}} mediante argumentos geométricos
  2. Argumento de sesgo: En el modelo gaussiano, se impone un pequeño sesgo en la primera coordenada de todos los vectores
  3. Cota dependiente de la dimensión: Cuando logn<εd\log n < \varepsilon d, se tiene P(E~)exp(Cndlogn)P(\tilde{E}) \geq \exp(-Cn\sqrt{d \log n})

Demostración de Cotas Superiores

  1. Argumento bayesiano: Se utilizan propiedades del estadístico S=ijX~i,X~jS = \sum_{i \neq j} \langle \tilde{X}_i, \tilde{X}_j \rangle
  2. Análisis de procesos de casquetes esféricos: Se transforma el complejo proceso de conjuntos convexos en un proceso de casquetes esféricos mediante reordenamiento simétrico
  3. Método de función generadora de momentos: Se utiliza la desigualdad exponencial de Markov para problemas de desviación del número de aristas

Resultados Experimentales

Resultados Principales para la Probabilidad de Grafo Completo

De acuerdo con el Teorema 2.1 y el Teorema 2.2, la probabilidad de grafo completo tiene diferentes tasas de decaimiento en diferentes intervalos dimensionales:

Intervalo DimensionalCota InferiorCota Superior
dn2d \gtrsim n^2Cn2-Cn^2cn2-cn^2
n2/logndn2n^2/\log n \lesssim d \lesssim n^2Cnd-Cn\sqrt{d}cn2-cn^2
n4/3+o(1)dn2/lognn^{4/3+o(1)} \lesssim d \lesssim n^2/\log nCnd-Cn\sqrt{d}cndlogn-cn\sqrt{d \log n}
logndn4/3+o(1)\log n \lesssim d \lesssim n^{4/3+o(1)}Cndlogn-Cn\sqrt{d \log n}cndlogn-cn\sqrt{d \log n}
dlognd \lesssim \log nCnd-Cndcnd-cnd

Resultados Principales para la Gran Desviación del Número de Aristas

Los Teoremas 2.3 y 2.4 proporcionan cotas precisas para la gran desviación del número de aristas:

Para el evento Iε:={E(G)(1+ε)(n2)p}I_\varepsilon := \{|E(G)| \geq (1+\varepsilon)\binom{n}{2}p\}, se tiene: exp(cmin(n2,nd))P(Iε)exp(Cmin(n2,nd))\exp(-c\min(n^2, n\sqrt{d})) \leq P(I_\varepsilon) \leq \exp(-C\min(n^2, n\sqrt{d}))

Hallazgos Clave

  1. Efecto de umbral dimensional: Cuando dnd \gtrsim \sqrt{n}, la tasa de decaimiento es exp(Ω(n2))\exp(-\Omega(n^2)), similar al modelo de Erdős-Rényi
  2. Persistencia del efecto geométrico: Cuando dnd \lesssim \sqrt{n}, la tasa de decaimiento es exp(Ω(nd))\exp(-\Omega(n\sqrt{d})), reflejando la influencia de la estructura geométrica
  3. Cotas superior e inferior coincidentes: Se obtienen cotas coincidentes en los intervalos dn2d \geq n^2 y dn4/3+o(1)d \leq n^{4/3+o(1)}

Trabajo Relacionado

Investigación de Grafos Geométricos Aleatorios de Alta Dimensión

  • Devroye et al. (2011): Estudian el problema del número de cliques cuando dlog(n)d \gg \log(n)
  • Bubeck et al. (2016): Establecen una transición de fase en detectabilidad geométrica: detectable cuando dn3d \ll n^3, no detectable cuando dn3d \gg n^3

Teoría de Grandes Desviaciones

  • Chatterjee & Harel (2020): Estudian grandes desviaciones del número de aristas en grafos geométricos aleatorios generados por procesos de puntos de Poisson
  • Schreiber & Yukich (2005): Establecen principios de grandes desviaciones para funcionales de procesos de puntos espaciales

Técnica de Reordenamiento Simétrico

  • Draghici (2005): Desarrolla la teoría de desigualdades de reordenamiento en la esfera, proporcionando la base para la herramienta técnica central de este artículo

Puntos de Innovación Técnica

1. Aplicación Innovadora de Técnicas de Acoplamiento

Se establece la conexión entre dos modelos mediante la proyección esférica X~/X~\tilde{X}/\|\tilde{X}\|, evitando la complejidad del análisis repetido.

2. Aplicación Probabilística de Herramientas Geométricas

Se aplica innovadoramente el reordenamiento simétrico, una herramienta de análisis geométrico, a problemas de teoría de probabilidades, particularmente en el manejo de complejas relaciones de dependencia entre aristas.

3. Marco de Análisis Multiesacala

Se establece un marco de análisis unificado para diferentes relaciones (n,d)(n,d), revelando el comportamiento de transición de baja a alta dimensión.

Limitaciones y Direcciones Futuras

Limitaciones

  1. Limitaciones técnicas: En el intervalo intermedio n4/3dn2n^{4/3} \lesssim d \lesssim n^2, existe una brecha entre las cotas superior e inferior
  2. Limitaciones del modelo: Se considera principalmente el caso p1/2p \leq 1/2, con análisis relativamente limitado para p>1/2p > 1/2
  3. Limitaciones del método: La pérdida de información en el proceso de reordenamiento simétrico resulta en cotas no suficientemente ajustadas

Direcciones de Investigación Futura

  1. Perfeccionamiento de cotas teóricas: Reducir la brecha entre cotas superior e inferior en el intervalo intermedio
  2. Extensión del modelo: Considerar valores más generales de pp y otras métricas geométricas
  3. Aplicaciones algorítmicas: Aplicar resultados teóricos a problemas prácticos de análisis de redes y aprendizaje automático
  4. Modelos dinámicos: Estudiar eventos raros en grafos geométricos aleatorios que varían en el tiempo

Evaluación Profunda

Fortalezas

  1. Profundidad teórica: Se establece un marco matemático completo que combina resultados profundos de geometría, teoría de probabilidades y análisis
  2. Innovación técnica: La aplicación de técnicas de reordenamiento simétrico en la teoría de grafos aleatorios es pionera
  3. Completitud de resultados: Se proporcionan cotas precisas superior e inferior en múltiples intervalos dimensionales, demostrando la complejidad del problema
  4. Generalidad del método: Las técnicas desarrolladas pueden generalizarse a otros problemas de grafos geométricos aleatorios

Deficiencias

  1. Defecto de completitud: La falta de coincidencia entre cotas superior e inferior en el intervalo intermedio afecta la completitud de los resultados
  2. Limitaciones de practicidad: Principalmente resultados teóricos, con falta de verificación numérica y demostración de aplicaciones prácticas
  3. Complejidad técnica: Las técnicas de demostración son bastante complejas, lo que puede limitar la generalizabilidad de los resultados

Impacto Académico

  1. Contribución teórica: Proporciona una base teórica importante para la teoría de grafos geométricos aleatorios de alta dimensión
  2. Contribución metodológica: La aplicación de técnicas de reordenamiento simétrico proporciona nuevas herramientas de análisis para problemas relacionados
  3. Valor inspirador: Revela el papel crucial de la dimensión en grafos geométricos aleatorios, proporcionando dirección para investigaciones posteriores

Escenarios Aplicables

  1. Investigación teórica: Teoría de grafos aleatorios, teoría de probabilidad geométrica, investigación de fenómenos de alta dimensión
  2. Campos de aplicación: Ciencia de redes, métodos kernel en aprendizaje automático, estadística de alta dimensión
  3. Diseño de algoritmos: Análisis y optimización de algoritmos basados en grafos geométricos

Conclusión

Este artículo logra un avance teórico importante en el análisis de eventos raros en grafos geométricos aleatorios. Mediante la combinación innovadora de técnicas de reordenamiento simétrico y métodos probabilísticos, proporciona un análisis sistemático de los problemas de probabilidad de grafo completo y gran desviación del número de aristas en grafos geométricos aleatorios esféricos y gaussianos de alta dimensión. Aunque hay espacio para mejora en ciertos detalles técnicos, el marco teórico establecido y los resultados profundos obtenidos sientan una base sólida para el desarrollo de este campo, con importante valor académico e importancia inspiradora.