2025-11-24T00:19:17.738116

Overlap Gap and Computational Thresholds in the Square Wave Perceptron

Benedetti, Bogdanov, Malatesta et al.

Square Wave Perceptrons (SWPs) form a class of neural network models with oscillating activation function that exhibit intriguing ``hardness'' properties in the high-dimensional limit at a fixed constraint density $Î±= O(1)$. In this work, we examine two key aspects of these models. The first is related to the so-called \emph{overlap-gap property}, that is a disconnectivity feature of the geometry of the solution space of combinatorial optimization problems proven to cause the failure of a large family of solvers, and conjectured to be a symptom of algorithmic hardness. We identify, both in the storage and in the teacher-student settings, the emergence of an overlap gap at a threshold $Î±_{\mathrm{OGP}}(Î´)$, which can be made arbitrarily small by suitably increasing the frequency of oscillations $1/Î´$ of the activation. This suggests that in this small-$Î´$ regime, typical instances of the problem are hard to solve even for small values of $Î±$. Second, in the teacher-student setup, we show that the recovery threshold of the planted signal for message-passing algorithms can be made arbitrarily large by reducing $Î´$. These properties make SWPs both a challenging benchmark for algorithms and an interesting candidate for cryptographic applications.

academic

Перекрытие промежутков и вычислительные пороги в квадратно-волновом персептроне

Основная информация

ID статьи: 2506.05197
Название: Overlap Gap and Computational Thresholds in the Square Wave Perceptron
Авторы: Marco Benedetti, Andrej Bogdanov, Enrico M. Malatesta, Marc Mézard, Gianmarco Perrupato, Alon Rosen, Nikolaj I. Schwartzbach, Riccardo Zecchina
Классификация: cond-mat.dis-nn (Физика конденсированного состояния - неупорядоченные системы и нейронные сети)
Дата публикации: 13 октября 2025 г. (препринт arXiv)
Ссылка на статью: https://arxiv.org/abs/2506.05197

Аннотация

Квадратно-волновые персептроны (SWP) представляют собой класс нейросетевых моделей с осциллирующими функциями активации, демонстрирующие интересные свойства "жесткости" в высокомерном пределе при фиксированной плотности ограничений α = O(1). В данном исследовании рассматриваются два ключевых аспекта этих моделей: во-первых, свойство перекрытия промежутков (overlap-gap property), представляющее собой признак несвязности геометрии пространства решений задач комбинаторной оптимизации, которое доказано приводит к отказу большого числа решателей и предположительно является симптомом алгоритмической жесткости; во-вторых, в постановке "учитель-ученик" пороги восстановления алгоритмов передачи сообщений могут становиться произвольно большими при уменьшении δ. Эти свойства делают SWP как сложным ориентиром для алгоритмов, так и интересным кандидатом для криптографических приложений.

Исследовательский контекст и мотивация

Предпосылки проблемы

Данное исследование сосредоточено на вычислительной сложности задачи персептрона, в частности на анализе жесткости на пересечении статистической физики и теоретической информатики. Персептрон как наиболее фундаментальная модель нейронной сети имеет важное значение для понимания вычислительных ограничений более сложных нейронных сетей в задачах обучения и хранения информации.

Основные проблемы

Статистико-вычислительный разрыв: во многих задачах удовлетворения ограничений существует разрыв между параметрической областью, информационно-теоретически осуществимой, и областью, в которой работают известные полиномиальные алгоритмы
Геометрические признаки жесткости: как геометрическая структура пространства решений влияет на вычислительную сложность алгоритмов
Свойство перекрытия промежутков: геометрическая несвязность как предиктор алгоритмической жесткости

Исследовательская мотивация

Существующие бинарные персептроны (такие как ABP, SBP), хотя и демонстрируют статистико-вычислительный разрыв, имеют относительно фиксированные пороги жесткости
Требуется модель, способная регулировать характеристики жесткости, для лучшего понимания геометрических причин отказа алгоритмов
Исследование потенциального применения моделей с экстремальными характеристиками жесткости в криптографии

Основные вклады

Введение модели квадратно-волнового персептрона: предложена новая модель персептрона с осциллирующей функцией активации φ_δ(h) = -sgn(sin(πh/δ))
Анализ порога перекрытия промежутков: выявлены пороги перекрытия промежутков α_OGP(δ) в задачах хранения и "учитель-ученик", которые могут становиться произвольно малыми при увеличении частоты осцилляций 1/δ
Экстремальные характеристики жесткости: доказано, что в пределе δ→0 перекрытие промежутков существует для любого α>0, указывая на то, что задача является сложной даже при малых плотностях ограничений
Регулируемость порога восстановления: в постановке "учитель-ученик" показано, что пороги восстановления алгоритмов передачи сообщений могут становиться произвольно большими при уменьшении δ
Перспективы криптографического применения: предоставлена теоретическая основа для криптографических конструкций на основе персептрона (например, устойчивых к коллизиям хеш-функций)

Подробное описание методов

Определение задач

Задача хранения

Дан набор данных D = {(x^μ, y^μ)}^P_{μ=1}, найти вектор весов w ∈ {-1,+1}^N такой, что:

y^μ = φ(1/√N · w · x^μ) ∀μ ∈ [P]

где x^μ_i ~ N(0,1) независимы и одинаково распределены, y^μ = ±1 с равной вероятностью.

Задача "учитель-ученик"

Существует "учитель" с весами w* ∈ {-1,+1}^N, метки генерируются учителем:

y^μ = φ(1/√N · w* · x^μ) ∀μ ∈ [P]

Цель состоит в восстановлении весов учителя или нахождении произвольного решения.

Архитектура модели

Функция активации квадратной волны

φ_δ(h) = -sgn(sin(πh/δ))

Эта функция активации имеет период T = 2δ и управляется параметром δ, контролирующим частоту осцилляций.

Представление Фурье

φ_δ(h) = -4/π ∑_{n=0}^∞ 1/(2n+1) sin((2n+1)πh/δ)

Анализ свойства перекрытия промежутков

Определение m-OGP

Для данного экземпляра D определим множество S_m(q,ε,D), содержащее все наборы m конфигураций {w^1,...,w^m}, удовлетворяющие:

Каждое w^a удовлетворяет ограничениям
Для любых a≠b: q < (w^a·w^b)/N < q+ε

Если Pr_DS_m(q,ε,D) ≠ ∅ → 0 (N→∞), то говорят, что свойство m-OGP выполняется.

Функция распределения клонов

N_m(q;D) = ∑_{w^1,...,w^m} ∏_{a=1}^m X_D(w^a) ∏_{a<b} δ(q - w^a·w^b/N)

Отожженная свободная энтропия

φ^{ann}_m(q) = lim_{N→∞} 1/(mN) ln E_D N_m(q;D)

Технические инновации

Регулируемая жесткость: непрерывная регулировка вычислительной жесткости задачи через параметр δ, достигая экстремальной жесткости при δ→0
Геометрический анализ: использование методов статистической физики для анализа геометрической структуры пространства решений
Многомасштабный анализ: комбинирование отожженного приближения и анализа симметрии реплик для теоретических предсказаний различной точности
Аналитическая обработка предела малых δ: точный анализ предельного случая через теорию возмущений

Экспериментальная установка

Методы теоретического анализа

Отожженные вычисления: верхние оценки порога OGP
Анализ симметрии реплик (RS): более точные вычисления свободной энтропии
Разложение по малым δ: теория возмущений для предела δ→0

Численные эксперименты

Размер системы: N = 4000-5000
Количество выборок: в среднем 80 независимых выборок на каждую точку данных
Тестируемые алгоритмы: использование усиленного алгоритма передачи приблизительных сообщений (RAMP)

Метрики оценки

Порог выполнимости: α_c(δ) - критическая плотность ограничений для существования решений
Порог OGP: α_OGP(m,δ) - порог появления m-перекрытия промежутков
Порог учителя: α_T(δ) - порог, при котором учитель становится единственным решением
Алгоритмический порог: α_alg(δ) - порог отказа алгоритма RAMP

Результаты экспериментов

Основные результаты

Пороги выполнимости

Для δ→∞ восстанавливается емкость ABP α^{ABP}_c ≈ 0,833
Для δ→0 емкость стремится к верхней границе α_c(0) = 1
RS-оценка совпадает с отожженной верхней границей в пределе малых δ

Пороги перекрытия промежутков

В пределе δ→0:

α^{ann}_{OGP}(m) = 1/m

Следовательно, α_(∞) = 0, что означает существование перекрытия промежутков для любого α > 0.

Результаты для задачи "учитель-ученик"

Порог учителя α_T(δ) стремится к 1 при δ→0
Порог восстановления α_r(δ) может становиться произвольно большим при уменьшении δ
В обратном клиновидном персептроне достигнута расходимость порога восстановления

Анализ производительности алгоритма

Тестирование производительности алгоритма RAMP показывает:

Алгоритмический порог α_alg(δ) снижается при уменьшении δ
Существует разрыв между оценкой OGP симметрии реплик и алгоритмическим порогом
Для δ = 1,5 разрыв близок к нулю, что согласуется с известными результатами для ABP

Анализ конкретного случая: обратный клиновидный персептрон

Через проектирование функции активации:

φ(h) = sgn((h-γ)h(h+γ))

При γ = γ* = √(2log2) порог восстановления расходится:

α_r ≈ (π/8)(log2)^{-3/2} ε^{-1}

где ε = |γ - γ*|.

Связанные работы

Теория персептрона

Классические результаты: анализ емкости хранения Gardner-Derrida
Бинарные персептроны: характеристики жесткости моделей ABP и SBP
Статистико-вычислительный разрыв: разница между алгоритмом Bansal-Spencer и информационно-теоретическими пределами

Свойство перекрытия промежутков

Определение и развитие: исходное определение Gamarnik-Zadik
Доказательства отказа алгоритмов: универсальные результаты для класса стабильных алгоритмов
Примеры применения: случайные графы, задачи удовлетворения ограничений

Методы статистической физики

Метод реплик: вычисление функции распределения и фазовых переходов
Геометрические фазовые переходы: изменения структуры кластеризации пространства решений
Передача сообщений: теоретический анализ алгоритмов BP и AMP

Выводы и обсуждение

Основные выводы

Экстремальная жесткость: SWP демонстрирует экстремальную вычислительную жесткость в пределе δ→0, с перекрытием промежутков, существующим для любой положительной плотности ограничений
Регулируемость: параметр δ позволяет непрерывно регулировать характеристики жесткости задачи
Криптографический потенциал: эти свойства делают SWP мощным кандидатом для криптографических приложений
Геометрическое понимание: осциллирующие функции активации нарушают связность пространства решений, приводя к отказу алгоритмов

Ограничения

Симметрия реплик: анализ RS может быть неточным в некоторых параметрических областях, требуя более высокого порядка нарушения симметрии реплик
Эффекты конечного размера: теоретический анализ основан на термодинамическом пределе, реальные конечные системы могут иметь отклонения
Алгоритмические ограничения: протестирован только алгоритм RAMP, производительность других алгоритмов требует дальнейшего исследования
Параметрическая зависимость: результаты сильно зависят от выбора параметра δ

Направления будущих исследований

Полный анализ RSB: развитие полной теории нарушения симметрии реплик
Другие алгоритмы: тестирование спектральных методов, SDP-релаксаций и других классов алгоритмов
Криптографическая реализация: разработка конкретных криптографических протоколов на основе SWP
Обобщение: исследование аналогичных свойств для других осциллирующих функций активации

Глубокая оценка

Преимущества

Теоретическая инновация: первое систематическое исследование вычислительной жесткости осциллирующих функций активации, предоставляющее новую теоретическую перспективу
Методологическая строгость: комбинирование методов статистической физики и теоретической информатики, всесторонний и глубокий анализ
Глубокие результаты: открытие нового механизма регулируемой жесткости, имеющего важное значение для понимания алгоритмических пределов
Прикладные перспективы: предоставление новых теоретических инструментов для криптографии

Недостатки

Техническая сложность: методы анализа достаточно сложны, что может ограничить доступность результатов
Экспериментальная верификация: в основном опирается на теоретический анализ, численные эксперименты относительно ограничены
Практическая применимость: осуществимость в экстремальных параметрах (δ→0) вызывает сомнения
Универсальность: универсальность результатов и их применимость к другим задачам требуют дальнейшей проверки

Влияние

Теоретический вклад: предоставление новых аналитических инструментов и перспектив для теории вычислительной сложности
Междисциплинарная ценность: связь статистической физики, машинного обучения и криптографии
Вдохновляющее значение: может вдохновить дальнейшие исследования геометрической жесткости
Практический потенциал: перспективы применения в криптографии и разработке алгоритмов

Применимые сценарии

Теоретические исследования: исследования теории вычислительной сложности и статистической физики
Анализ алгоритмов: понимание пределов и механизмов отказа алгоритмов передачи сообщений
Криптографический дизайн: разработка новых криптографических примитивов на основе предположений о жесткости
Машинное обучение: понимание вычислительных препятствий при обучении нейронных сетей

Библиография

Статья цитирует 75 связанных работ, основные из которых:

Rosenblatt (1958): исходное определение персептрона
Gardner & Derrida (1989): классические результаты о емкости хранения персептрона
Gamarnik & Zadik (2019): определение свойства перекрытия промежутков
Baldassi et al. (2015): анализ алгоритмических порогов бинарных персептронов
Mézard & Montanari (2009): систематическое введение методов статистической физики

Данная статья вносит важный вклад на пересечении теоретической информатики и статистической физики. Путем введения модели квадратно-волнового персептрона с регулируемой жесткостью она предоставляет новые инструменты и перспективы для понимания геометрических истоков алгоритмической жесткости. Обнаруженные характеристики экстремальной жесткости не только имеют теоретическую ценность, но также открывают новые возможности для криптографических приложений.