2025-11-16T21:22:11.887650

Rare event probabilities in Random Geometric Graphs

Deka, Luo, Wu
In this paper, we study rare events in spherical and Gaussian random geometric graphs in high dimensions. In these models, the vertices correspond to points sampled uniformly at random on the $d$ dimensional unit sphere or correspond to $d$ dimensional standard Gaussian vectors, and edges are added between two vertices if the inner-product between their corresponding points are greater than a threshold $t_p$, chosen such that the probability of having an edge is equal to $p$. We focus on two problems: (a) the probability that the RGG is a complete graph, and (b) the probability of observing an atypically large number of edges. We obtain asymptotically exponential decay rates depending on $n$ and $d$ of the probabilities of these rare events through a combination of geometric and probabilistic arguments.
academic

Вероятности редких событий в случайных геометрических графах

Основная информация

  • ID статьи: 2510.09196
  • Название: Rare event probabilities in Random Geometric Graphs
  • Авторы: Prabhanka Deka (Пекинский международный центр математических исследований, Пекинский университет), Fangzhou Luo (Факультет математических наук, Пекинский университет), Baichuan Wu (Факультет математических наук, Пекинский университет)
  • Классификация: math.PR (Теория вероятностей)
  • Дата публикации: 10 октября 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.09196

Аннотация

В данной работе исследуются редкие события в случайных геометрических графах на высокомерных сферах и в гауссовых моделях. В этих моделях вершины соответствуют равномерно распределённым случайным точкам на единичной сфере размерности dd или стандартным гауссовым векторам размерности dd. Рёбра добавляются между двумя вершинами, если внутреннее произведение соответствующих точек превышает пороговое значение tpt_p, выбранное таким образом, чтобы вероятность существования ребра равнялась pp. Работа сосредоточена на двух проблемах: (a) вероятность того, что случайный геометрический граф является полным графом, и (b) вероятность наблюдения аномально большого количества рёбер. Используя комбинацию геометрических и вероятностных аргументов, получены асимптотические показатели экспоненциального убывания вероятностей этих редких событий, которые зависят от числа вершин nn и размерности dd.

Исследовательский контекст и мотивация

Определение проблемы

Основные проблемы, исследуемые в данной работе, связаны с анализом двух классов редких событий в высокомерных случайных геометрических графах:

  1. Вероятность полного графа: вероятность того, что случайный геометрический граф становится полным графом (между всеми парами вершин существуют рёбра)
  2. Большие отклонения числа рёбер: вероятность наблюдения аномально большого количества рёбер

Значимость исследования

  1. Теоретическое значение: Случайные геометрические графы являются фундаментальным инструментом для моделирования сложных систем и широко применяются в информатике, биологии, социологии и физике
  2. Практические приложения:
    • Обнаружение аномалий и проверка гипотез
    • Анализ структуры клик в высокомерных данных
    • Анализ робастности геометрических сетевых моделей
    • Меры подобия на основе внутреннего произведения в нейронных сетях и методах ядра

Ограничения существующих исследований

  • Предыдущие работы в основном фиксировали размерность dd и устремляли число вершин nn к бесконечности
  • Отсутствует систематический анализ высокомерных плотных случайных геометрических графов
  • Сложные зависимости между рёбрами делают анализ сложным

Основные вклады

  1. Построение полной теоретической базы: Предоставлен унифицированный метод анализа редких событий в сферических и гауссовых случайных геометрических графах
  2. Получение точных показателей убывания: Даны верхние и нижние границы вероятностей полного графа и больших отклонений числа рёбер при различных соотношениях nn и dd
  3. Разработка инновационных технических инструментов:
    • Применение техники сферической симметричной перестановки
    • Методы связывания двух моделей
    • Органическое сочетание геометрических и вероятностных аргументов
  4. Выявление эффектов размерности: Обнаружено, что при высокой размерности поведение случайного геометрического графа близко к модели Эрдёша-Рёньи, тогда как при низкой размерности проявляются иные характеристики

Подробное описание методов

Определение моделей

Сферический случайный геометрический граф (SRGG)

  • Вершины: (X1,,Xn)(X_1, \ldots, X_n) независимо и одинаково распределены равномерно на единичной сфере Sd1S^{d-1} размерности dd
  • Рёбра: между вершинами ii и jj существует ребро, когда Xi,Xjtp\langle X_i, X_j \rangle \geq t_p
  • Пороговое значение: tpt_p выбирается так, чтобы P(X1,X2tp)=pP(\langle X_1, X_2 \rangle \geq t_p) = p

Гауссов случайный геометрический граф (GRGG)

  • Вершины: (X~1,,X~n)(\tilde{X}_1, \ldots, \tilde{X}_n) независимо и одинаково распределены согласно стандартному нормальному распределению размерности dd
  • Рёбра: между вершинами ii и jj существует ребро, когда X~i,X~jt~p\langle \tilde{X}_i, \tilde{X}_j \rangle \geq \tilde{t}_p
  • Пороговое значение: t~p\tilde{t}_p выбирается так, чтобы P(X~1,X~2t~p)=pP(\langle \tilde{X}_1, \tilde{X}_2 \rangle \geq \tilde{t}_p) = p

Основные технические методы

1. Техника связывания моделей

Путём наблюдения того, что X~/X~\tilde{X}/\|\tilde{X}\| равномерно распределена на сфере, устанавливается связь между двумя моделями:

Лемма 3.2: Для фиксированного p<1/2p < 1/2 и малого δ>0\delta > 0 существуют константы cδ,Δδc_\delta, \Delta_\delta, такие что: Pn,d(E~(n,d,p))exp(cδdn)+2nPn,d(E((1δ)n,d,q))P_{n,d}(\tilde{E}(n,d,p)) \leq \exp(-c_\delta dn) + 2^n P_{n,d}(E((1-\delta)n, d, q))

2. Техника симметричной перестановки

Использование симметричной перестановки на сфере для обработки сложных геометрических ограничений:

Теорема 3.4: Для функций f1,,fnf_1, \ldots, f_n на сфере и возрастающей функции Ki,jK_{i,j} имеет место: I[f1,,fn]I[f1,,fn]I[f_1, \ldots, f_n] \leq I[f_1^*, \ldots, f_n^*] где ff^* обозначает симметричную перестановку ff.

3. Асимптотическое поведение порогового значения

Лемма 3.1: Для фиксированного p(0,1)p \in (0,1) при dd \to \infty:

  • t~p=(Φ1(p)+o(1))d\tilde{t}_p = (\Phi^{-1}(p) + o(1))\sqrt{d}
  • tp=(Φ1(p)+o(1))/dt_p = (\Phi^{-1}(p) + o(1))/\sqrt{d}

Основная стратегия доказательства

Доказательство нижних границ

  1. Нижние границы типа Эрдёша-Рёньи: Геометрические аргументы доказывают P(E)p(n2)P(E) \geq p^{\binom{n}{2}}
  2. Аргумент смещения: В гауссовой модели применяется малое смещение к первой координате всех векторов
  3. Границы, зависящие от размерности: При logn<εd\log n < \varepsilon d имеем P(E~)exp(Cndlogn)P(\tilde{E}) \geq \exp(-Cn\sqrt{d \log n})

Доказательство верхних границ

  1. Байесовский аргумент: Использование свойств статистики S=ijX~i,X~jS = \sum_{i \neq j} \langle \tilde{X}_i, \tilde{X}_j \rangle
  2. Анализ процесса сферических шапок: Преобразование сложного процесса выпуклых множеств в процесс сферических шапок посредством симметричной перестановки
  3. Метод производящей функции моментов: Применение экспоненциального неравенства Маркова к задаче больших отклонений числа рёбер

Экспериментальные результаты

Основные результаты для вероятности полного графа

Согласно Теореме 2.1 и Теореме 2.2, вероятность полного графа имеет различные показатели убывания в разных интервалах размерности:

Интервал размерностиНижняя границаВерхняя граница
dn2d \gtrsim n^2Cn2-Cn^2cn2-cn^2
n2/logndn2n^2/\log n \lesssim d \lesssim n^2Cnd-Cn\sqrt{d}cn2-cn^2
n4/3+o(1)dn2/lognn^{4/3+o(1)} \lesssim d \lesssim n^2/\log nCnd-Cn\sqrt{d}cndlogn-cn\sqrt{d \log n}
logndn4/3+o(1)\log n \lesssim d \lesssim n^{4/3+o(1)}Cndlogn-Cn\sqrt{d \log n}cndlogn-cn\sqrt{d \log n}
dlognd \lesssim \log nCnd-Cndcnd-cnd

Основные результаты для больших отклонений числа рёбер

Теоремы 2.3 и 2.4 дают точные границы для больших отклонений числа рёбер:

Для события Iε:={E(G)(1+ε)(n2)p}I_\varepsilon := \{|E(G)| \geq (1+\varepsilon)\binom{n}{2}p\} имеет место: exp(cmin(n2,nd))P(Iε)exp(Cmin(n2,nd))\exp(-c\min(n^2, n\sqrt{d})) \leq P(I_\varepsilon) \leq \exp(-C\min(n^2, n\sqrt{d}))

Ключевые находки

  1. Эффект порога размерности: При dnd \gtrsim \sqrt{n} показатель убывания равен exp(Ω(n2))\exp(-\Omega(n^2)), что аналогично модели Эрдёша-Рёньи
  2. Сохранение геометрических эффектов: При dnd \lesssim \sqrt{n} показатель убывания равен exp(Ω(nd))\exp(-\Omega(n\sqrt{d})), что отражает влияние геометрической структуры
  3. Совпадающие верхние и нижние границы: В интервалах dn2d \geq n^2 и dn4/3+o(1)d \leq n^{4/3+o(1)} получены совпадающие верхние и нижние границы

Связанные работы

Исследования высокомерных случайных геометрических графов

  • Devroye и др. (2011): Исследование задачи о кликах при dlog(n)d \gg \log(n)
  • Bubeck и др. (2016): Установление фазового перехода геометрической обнаруживаемости: геометрически обнаруживаемо при dn3d \ll n^3, необнаруживаемо при dn3d \gg n^3

Теория больших отклонений

  • Chatterjee & Harel (2020): Исследование больших отклонений числа рёбер в случайных геометрических графах, порождённых пуассоновскими точечными процессами
  • Schreiber & Yukich (2005): Установление принципа больших отклонений для функционалов пространственных точечных процессов

Техника симметричной перестановки

  • Draghici (2005): Разработка теории неравенств перестановки на сфере, обеспечивающей основу для основного технического инструмента данной работы

Технические инновации

1. Инновационное применение техники связывания

Установление связи между двумя моделями через сферическую проекцию X~/X~\tilde{X}/\|\tilde{X}\|, избегая сложности повторного анализа.

2. Применение геометрических инструментов в теории вероятностей

Инновационное применение симметричной перестановки — геометрического аналитического инструмента — к вероятностным задачам, особенно при обработке сложных зависимостей между рёбрами.

3. Многомасштабная аналитическая база

Построение унифицированной аналитической базы для различных соотношений (n,d)(n,d), выявляющей поведение переходов от низкой к высокой размерности.

Ограничения и направления будущих исследований

Ограничения

  1. Технические ограничения: В промежуточном интервале n4/3dn2n^{4/3} \lesssim d \lesssim n^2 существует разрыв между верхней и нижней границами
  2. Ограничения модели: Основное внимание уделяется случаю p1/2p \leq 1/2; анализ для p>1/2p > 1/2 относительно ограничен
  3. Ограничения метода: Потеря информации в процессе симметричной перестановки приводит к недостаточной точности некоторых границ

Направления будущих исследований

  1. Совершенствование теоретических границ: Сокращение разрыва между верхней и нижней границами в промежуточном интервале
  2. Расширение модели: Рассмотрение более общих значений pp и других геометрических метрик
  3. Алгоритмические приложения: Применение теоретических результатов к практическому анализу сетей и задачам машинного обучения
  4. Динамические модели: Исследование редких событий в нестационарных случайных геометрических графах

Глубокая оценка

Преимущества

  1. Теоретическая глубина: Построена полная математическая теоретическая база, объединяющая глубокие результаты геометрии, теории вероятностей и анализа
  2. Техническая инновация: Применение техники симметричной перестановки в теории случайных графов является пионерским
  3. Полнота результатов: Точные верхние и нижние границы в нескольких интервалах размерности демонстрируют сложность задачи
  4. Универсальность методов: Разработанные методы могут быть обобщены на другие задачи геометрических случайных графов

Недостатки

  1. Дефекты полноты: Несовпадение верхней и нижней границ в промежуточном интервале влияет на полноту результатов
  2. Ограничения практичности: Результаты в основном теоретические, отсутствуют численная верификация и практические приложения
  3. Сложность техники: Сложность доказательств может ограничить обобщаемость результатов

Академическое влияние

  1. Теоретический вклад: Предоставляет важную теоретическую основу для теории высокомерных случайных геометрических графов
  2. Методологический вклад: Применение техники симметричной перестановки предоставляет новый аналитический инструмент для связанных задач
  3. Вдохновляющая ценность: Выявление ключевой роли размерности в случайных геометрических графах указывает направления для последующих исследований

Применимые сценарии

  1. Теоретические исследования: Теория случайных графов, геометрическая теория вероятностей, исследование высокомерных явлений
  2. Области приложения: Сетевая наука, методы ядра в машинном обучении, высокомерная статистика
  3. Разработка алгоритмов: Анализ и оптимизация алгоритмов на основе геометрических графов

Заключение

Данная работа достигает важного теоретического прорыва в анализе редких событий в случайных геометрических графах. Путём инновационного объединения техники симметричной перестановки и методов теории вероятностей предоставлен систематический анализ задач о вероятности полного графа и больших отклонениях числа рёбер в высокомерных сферических и гауссовых случайных геометрических графах. Хотя в некоторых технических деталях остаётся место для улучшений, построенная теоретическая база и полученные глубокие результаты создают прочный фундамент для развития данной области и имеют важное академическое значение и вдохновляющую ценность.