In this paper, we study rare events in spherical and Gaussian random geometric graphs in high dimensions. In these models, the vertices correspond to points sampled uniformly at random on the $d$ dimensional unit sphere or correspond to $d$ dimensional standard Gaussian vectors, and edges are added between two vertices if the inner-product between their corresponding points are greater than a threshold $t_p$, chosen such that the probability of having an edge is equal to $p$. We focus on two problems: (a) the probability that the RGG is a complete graph, and (b) the probability of observing an atypically large number of edges. We obtain asymptotically exponential decay rates depending on $n$ and $d$ of the probabilities of these rare events through a combination of geometric and probabilistic arguments.
논문 ID : 2510.09196제목 : 무작위 기하 그래프에서의 희귀 사건 확률저자 : Prabhanka Deka (베이징 대학교 베이징 국제 수학 연구 센터), Fangzhou Luo (베이징 대학교 수학 과학 학원), Baichuan Wu (베이징 대학교 수학 과학 학원)분류 : math.PR (확률론)발표 시간 : 2025년 10월 10일 (arXiv 사전인쇄본)논문 링크 : https://arxiv.org/abs/2510.09196 본 논문은 고차원 구면 및 가우스 무작위 기하 그래프에서의 희귀 사건을 연구한다. 이러한 모델에서 정점은 d d d 차원 단위 구면 위의 균등 무작위 표본점 또는 d d d 차원 표준 가우스 벡터에 대응되며, 두 정점에 대응하는 점의 내적이 임계값 t p t_p t p 보다 클 때 그들 사이에 간선을 추가한다. 여기서 t p t_p t p 는 간선이 존재할 확률이 p p p 가 되도록 선택된다. 본 논문은 두 가지 문제에 초점을 맞춘다: (a) 무작위 기하 그래프가 완전 그래프일 확률, 및 (b) 비정상적으로 많은 수의 간선을 관찰할 확률. 기하학적 및 확률론적 논증의 결합을 통해 이러한 희귀 사건 확률의 점근 지수 감소율을 획득했으며, 이 감소율은 정점 수 n n n 과 차원 d d d 에 따라 달라진다.
본 논문이 연구하는 핵심 문제는 고차원 무작위 기하 그래프에서 두 가지 유형의 희귀 사건을 분석하는 것이다:
완전 그래프 확률 : 무작위 기하 그래프가 완전 그래프(모든 정점 쌍 사이에 간선이 있음)가 될 확률간선 수 대편차 : 비정상적으로 많은 수의 간선을 관찰할 확률이론적 의의 : 무작위 기하 그래프는 복잡한 시스템을 모델링하기 위한 기본 도구이며, 컴퓨터 과학, 생물학, 사회학 및 물리학 등 다양한 분야에서 광범위하게 응용된다실제 응용 :
이상 탐지 및 가설 검정 고차원 데이터의 클리크 구조 분석 기하 네트워크 모델의 견고성 분석 신경망 및 커널 방법에서 내적 기반 유사성 측도 이전 연구는 주로 차원 d d d 를 고정하고 정점 수 n n n 을 무한대로 보냈다 고차원 밀집 무작위 기하 그래프의 체계적 분석이 부족하다 간선 간의 복잡한 의존성으로 인해 분석이 어렵다 완전한 이론 체계 구축 : 구면 및 가우스 무작위 기하 그래프의 희귀 사건에 대한 통일된 분석 방법 제공정확한 감소율 획득 : 서로 다른 n n n 과 d d d 의 관계에서 완전 그래프 확률 및 간선 수 대편차 확률의 상한과 하한 제시혁신적인 기술 도구 개발 :
구면 대칭 재배열 기법의 응용 두 모델 간의 결합 방법 기하학적 및 확률론적 논증의 유기적 결합 차원 효과 규명 : 고차원에서 무작위 기하 그래프의 행동이 Erdős-Rényi 모델에 가까우며, 저차원에서는 다른 특성을 나타냄을 발견정점: ( X 1 , … , X n ) (X_1, \ldots, X_n) ( X 1 , … , X n ) 이 d d d 차원 단위 구면 S d − 1 S^{d-1} S d − 1 위에 독립동일분포로 균등 분포 간선: ⟨ X i , X j ⟩ ≥ t p \langle X_i, X_j \rangle \geq t_p ⟨ X i , X j ⟩ ≥ t p 일 때 정점 i i i 와 j j j 사이에 간선 추가 임계값: P ( ⟨ X 1 , X 2 ⟩ ≥ t p ) = p P(\langle X_1, X_2 \rangle \geq t_p) = p P (⟨ X 1 , X 2 ⟩ ≥ t p ) = p 가 되도록 t p t_p t p 선택 정점: ( X ~ 1 , … , X ~ n ) (\tilde{X}_1, \ldots, \tilde{X}_n) ( X ~ 1 , … , X ~ n ) 이 d d d 차원 표준 정규분포를 따르며 독립동일분포 간선: ⟨ X ~ i , X ~ j ⟩ ≥ t ~ p \langle \tilde{X}_i, \tilde{X}_j \rangle \geq \tilde{t}_p ⟨ X ~ i , X ~ j ⟩ ≥ t ~ p 일 때 정점 i i i 와 j j j 사이에 간선 추가 임계값: P ( ⟨ X ~ 1 , X ~ 2 ⟩ ≥ t ~ p ) = p P(\langle \tilde{X}_1, \tilde{X}_2 \rangle \geq \tilde{t}_p) = p P (⟨ X ~ 1 , X ~ 2 ⟩ ≥ t ~ p ) = p 가 되도록 t ~ p \tilde{t}_p t ~ p 선택 X ~ / ∥ X ~ ∥ \tilde{X}/\|\tilde{X}\| X ~ /∥ X ~ ∥ 이 구면 위에 균등 분포함을 관찰하여 두 모델 간의 결합 관계 구축:
보조정리 3.2 : 고정된 p < 1 / 2 p < 1/2 p < 1/2 와 작은 δ > 0 \delta > 0 δ > 0 에 대해, 상수 c δ , Δ δ c_\delta, \Delta_\delta c δ , Δ δ 가 존재하여:
P n , d ( E ~ ( n , d , p ) ) ≤ exp ( − c δ d n ) + 2 n P n , d ( E ( ( 1 − δ ) n , d , q ) ) P_{n,d}(\tilde{E}(n,d,p)) \leq \exp(-c_\delta dn) + 2^n P_{n,d}(E((1-\delta)n, d, q)) P n , d ( E ~ ( n , d , p )) ≤ exp ( − c δ d n ) + 2 n P n , d ( E (( 1 − δ ) n , d , q ))
구면 위의 대칭 재배열을 이용하여 복잡한 기하학적 제약 처리:
정리 3.4 : 구면 위의 함수 f 1 , … , f n f_1, \ldots, f_n f 1 , … , f n 과 증가함수 K i , j K_{i,j} K i , j 에 대해:
I [ f 1 , … , f n ] ≤ I [ f 1 ∗ , … , f n ∗ ] I[f_1, \ldots, f_n] \leq I[f_1^*, \ldots, f_n^*] I [ f 1 , … , f n ] ≤ I [ f 1 ∗ , … , f n ∗ ]
여기서 f ∗ f^* f ∗ 는 f f f 의 대칭 재배열을 나타낸다.
보조정리 3.1 : 고정된 p ∈ ( 0 , 1 ) p \in (0,1) p ∈ ( 0 , 1 ) 에 대해, d → ∞ d \to \infty d → ∞ 일 때:
t ~ p = ( Φ − 1 ( p ) + o ( 1 ) ) d \tilde{t}_p = (\Phi^{-1}(p) + o(1))\sqrt{d} t ~ p = ( Φ − 1 ( p ) + o ( 1 )) d t p = ( Φ − 1 ( p ) + o ( 1 ) ) / d t_p = (\Phi^{-1}(p) + o(1))/\sqrt{d} t p = ( Φ − 1 ( p ) + o ( 1 )) / d Erdős-Rényi 유형 하한 : 기하학적 논증을 통해 P ( E ) ≥ p ( n 2 ) P(E) \geq p^{\binom{n}{2}} P ( E ) ≥ p ( 2 n ) 증명편향 논증 : 가우스 모델에서 모든 벡터의 첫 번째 좌표에 작은 편향 적용차원 의존 경계 : log n < ε d \log n < \varepsilon d log n < ε d 일 때, P ( E ~ ) ≥ exp ( − C n d log n ) P(\tilde{E}) \geq \exp(-Cn\sqrt{d \log n}) P ( E ~ ) ≥ exp ( − C n d log n ) 베이즈 논증 : 통계량 S = ∑ i ≠ j ⟨ X ~ i , X ~ j ⟩ S = \sum_{i \neq j} \langle \tilde{X}_i, \tilde{X}_j \rangle S = ∑ i = j ⟨ X ~ i , X ~ j ⟩ 의 성질 이용구 캡 과정 분석 : 대칭 재배열을 통해 복잡한 볼록 집합 과정을 구 캡 과정으로 변환적률생성함수 방법 : 간선 수 편차 문제에 지수 마르코프 부등식 적용정리 2.1 과 정리 2.2 에 따르면, 완전 그래프 확률은 서로 다른 차원 구간에서 다른 감소율을 가진다:
차원 구간 하한 상한 d ≳ n 2 d \gtrsim n^2 d ≳ n 2 − C n 2 -Cn^2 − C n 2 − c n 2 -cn^2 − c n 2 n 2 / log n ≲ d ≲ n 2 n^2/\log n \lesssim d \lesssim n^2 n 2 / log n ≲ d ≲ n 2 − C n d -Cn\sqrt{d} − C n d − c n 2 -cn^2 − c n 2 n 4 / 3 + o ( 1 ) ≲ d ≲ n 2 / log n n^{4/3+o(1)} \lesssim d \lesssim n^2/\log n n 4/3 + o ( 1 ) ≲ d ≲ n 2 / log n − C n d -Cn\sqrt{d} − C n d − c n d log n -cn\sqrt{d \log n} − c n d log n log n ≲ d ≲ n 4 / 3 + o ( 1 ) \log n \lesssim d \lesssim n^{4/3+o(1)} log n ≲ d ≲ n 4/3 + o ( 1 ) − C n d log n -Cn\sqrt{d \log n} − C n d log n − c n d log n -cn\sqrt{d \log n} − c n d log n d ≲ log n d \lesssim \log n d ≲ log n − C n d -Cnd − C n d − c n d -cnd − c n d
정리 2.3 과 정리 2.4 는 간선 수 대편차의 정확한 경계를 제시한다:
사건 I ε : = { ∣ E ( G ) ∣ ≥ ( 1 + ε ) ( n 2 ) p } I_\varepsilon := \{|E(G)| \geq (1+\varepsilon)\binom{n}{2}p\} I ε := { ∣ E ( G ) ∣ ≥ ( 1 + ε ) ( 2 n ) p } 에 대해:
exp ( − c min ( n 2 , n d ) ) ≤ P ( I ε ) ≤ exp ( − C min ( n 2 , n d ) ) \exp(-c\min(n^2, n\sqrt{d})) \leq P(I_\varepsilon) \leq \exp(-C\min(n^2, n\sqrt{d})) exp ( − c min ( n 2 , n d )) ≤ P ( I ε ) ≤ exp ( − C min ( n 2 , n d ))
차원 임계값 효과 : d ≳ n d \gtrsim \sqrt{n} d ≳ n 일 때, 감소율은 exp ( − Ω ( n 2 ) ) \exp(-\Omega(n^2)) exp ( − Ω ( n 2 )) 로 Erdős-Rényi 모델과 유사하다기하학적 효과 유지 : d ≲ n d \lesssim \sqrt{n} d ≲ n 일 때, 감소율은 exp ( − Ω ( n d ) ) \exp(-\Omega(n\sqrt{d})) exp ( − Ω ( n d )) 로 기하학적 구조의 영향을 반영한다상한과 하한 일치 : 구간 d ≥ n 2 d \geq n^2 d ≥ n 2 와 d ≤ n 4 / 3 + o ( 1 ) d \leq n^{4/3+o(1)} d ≤ n 4/3 + o ( 1 ) 에서 일치하는 상한과 하한을 획득했다Devroye 등 (2011) : d ≫ log ( n ) d \gg \log(n) d ≫ log ( n ) 경우의 클리크 수 문제 연구Bubeck 등 (2016) : 기하학적 검출 가능성의 상전이 구축: d ≪ n 3 d \ll n^3 d ≪ n 3 일 때 기하학적으로 검출 가능, d ≫ n 3 d \gg n^3 d ≫ n 3 일 때 불가능Chatterjee & Harel (2020) : 포아송 점 과정이 생성한 무작위 기하 그래프의 간선 수 대편차 연구Schreiber & Yukich (2005) : 공간 점 과정 함수의 대편차 원리 구축Draghici (2005) : 구면 위의 재배열 부등식 이론 개발로 본 논문의 핵심 기술 도구에 기초 제공X ~ / ∥ X ~ ∥ \tilde{X}/\|\tilde{X}\| X ~ /∥ X ~ ∥ 의 구면 투영을 통해 두 모델 간의 연결을 구축하여 반복 분석의 복잡성 회피
대칭 재배열이라는 기하학적 분석 도구를 확률론 문제에 혁신적으로 적용하며, 특히 복잡한 간선 의존성 처리에서 효과적
서로 다른 ( n , d ) (n,d) ( n , d ) 관계에 대해 통일된 분석 체계를 구축하여 저차원에서 고차원으로의 전이 행동 규명
기술적 제약 : 중간 구간 n 4 / 3 ≲ d ≲ n 2 n^{4/3} \lesssim d \lesssim n^2 n 4/3 ≲ d ≲ n 2 에서 상한과 하한 간의 간격 존재모델 제약 : 주로 p ≤ 1 / 2 p \leq 1/2 p ≤ 1/2 인 경우를 고려하며, p > 1 / 2 p > 1/2 p > 1/2 에 대한 분석은 상대적으로 제한적방법 제약 : 대칭 재배열 과정에서의 정보 손실로 인해 일부 경계가 충분히 타이트하지 않음이론 경계 완성 : 중간 구간의 상한과 하한 간격 축소모델 확장 : 더 일반적인 p p p 값과 다른 기하학적 측도 고려알고리즘 응용 : 이론 결과를 실제 네트워크 분석 및 기계학습 문제에 적용동적 모델 : 시변 무작위 기하 그래프의 희귀 사건 연구이론적 깊이 : 기하학, 확률론 및 분석학의 심오한 결과를 결합한 완전한 수학 이론 체계 구축기술 혁신 : 대칭 재배열 기법의 무작위 그래프 이론 응용이 개척적결과 완전성 : 다양한 차원 구간에서 정확한 상한과 하한 제시로 문제의 복잡성 전시방법 일반성 : 개발된 기법을 다른 기하 무작위 그래프 문제로 확대 가능완전성 결함 : 중간 구간의 상한과 하한 불일치로 결과의 완전성에 영향실용성 제약 : 주로 이론 결과이며 수치 검증 및 실제 응용 시연 부족기술 복잡성 : 증명 기법이 상당히 복잡하여 결과의 확장 가능성 제한 가능이론적 기여 : 고차원 무작위 기하 그래프 이론에 중요한 이론적 기초 제공방법론적 기여 : 대칭 재배열 기법의 응용이 관련 문제에 새로운 분석 도구 제공영감 가치 : 무작위 기하 그래프에서 차원의 핵심 역할 규명으로 후속 연구에 방향 제시이론 연구 : 무작위 그래프 이론, 기하 확률론, 고차원 현상 연구응용 분야 : 네트워크 과학, 기계학습의 커널 방법, 고차원 통계알고리즘 설계 : 기하 그래프 기반 알고리즘 분석 및 최적화본 논문은 무작위 기하 그래프의 희귀 사건 분석 분야에서 중요한 이론적 돌파구를 이루었다. 대칭 재배열 기법과 확률론 방법을 혁신적으로 결합하여 고차원 구면 및 가우스 무작위 기하 그래프의 완전 그래프 확률 및 간선 수 대편차 문제에 대한 체계적 분석을 제공한다. 일부 기술적 세부 사항에서 개선 여지가 있지만, 구축된 이론 체계와 획득된 심오한 결과는 해당 분야의 발전을 위한 견고한 기초를 마련하며, 중요한 학술적 가치와 영감을 제공한다.