2025-11-24T00:19:17.738116

Overlap Gap and Computational Thresholds in the Square Wave Perceptron

Benedetti, Bogdanov, Malatesta et al.

Square Wave Perceptrons (SWPs) form a class of neural network models with oscillating activation function that exhibit intriguing ``hardness'' properties in the high-dimensional limit at a fixed constraint density $Î±= O(1)$. In this work, we examine two key aspects of these models. The first is related to the so-called \emph{overlap-gap property}, that is a disconnectivity feature of the geometry of the solution space of combinatorial optimization problems proven to cause the failure of a large family of solvers, and conjectured to be a symptom of algorithmic hardness. We identify, both in the storage and in the teacher-student settings, the emergence of an overlap gap at a threshold $Î±_{\mathrm{OGP}}(Î´)$, which can be made arbitrarily small by suitably increasing the frequency of oscillations $1/Î´$ of the activation. This suggests that in this small-$Î´$ regime, typical instances of the problem are hard to solve even for small values of $Î±$. Second, in the teacher-student setup, we show that the recovery threshold of the planted signal for message-passing algorithms can be made arbitrarily large by reducing $Î´$. These properties make SWPs both a challenging benchmark for algorithms and an interesting candidate for cryptographic applications.

academic

Chevauchement et Seuils Computationnels dans le Perceptron à Onde Carrée

Informations Fondamentales

ID de l'article: 2506.05197
Titre: Overlap Gap and Computational Thresholds in the Square Wave Perceptron
Auteurs: Marco Benedetti, Andrej Bogdanov, Enrico M. Malatesta, Marc Mézard, Gianmarco Perrupato, Alon Rosen, Nikolaj I. Schwartzbach, Riccardo Zecchina
Classification: cond-mat.dis-nn (Matière Condensée - Systèmes Désordonnés et Réseaux de Neurones)
Date de Publication: 13 octobre 2025 (prépublication arXiv)
Lien de l'article: https://arxiv.org/abs/2506.05197

Résumé

Les Perceptrons à Onde Carrée (SWPs) constituent une classe de modèles de réseaux de neurones dotés de fonctions d'activation oscillantes, présentant des propriétés intéressantes de « dureté » dans la limite haute dimension avec densité de contraintes fixée α = O(1). Cette étude examine deux aspects clés de ces modèles : premièrement, la propriété de chevauchement lacunaire (overlap-gap property), une caractéristique de déconnexion géométrique de l'espace des solutions des problèmes d'optimisation combinatoire, qui s'est avérée causer l'échec d'une multitude de solveurs et est conjecturée comme symptôme de dureté algorithmique ; deuxièmement, dans le cadre maître-élève, les seuils de récupération des algorithmes de passage de messages peuvent devenir arbitrairement grands en réduisant δ. Ces propriétés font des SWPs à la fois un repère algorithmiquement difficile et un candidat intéressant pour les applications cryptographiques.

Contexte et Motivation de la Recherche

Contexte du Problème

Cette étude se concentre sur la complexité computationnelle du problème du perceptron, en particulier sur l'analyse de dureté dans le domaine d'intersection entre la physique statistique et l'informatique théorique. Le perceptron, en tant que modèle de réseau de neurones le plus fondamental, revêt une importance capitale pour comprendre les limitations computationnelles des réseaux de neurones plus complexes dans les problèmes d'apprentissage et de stockage.

Problèmes Centraux

Écart statistique-computationnel: Dans de nombreux problèmes de satisfaction de contraintes, il existe un écart entre la région de paramètres réalisable sur le plan informatif et la région où les algorithmes polynomiaux en temps connus fonctionnent
Caractéristiques géométriques de dureté: Comment la structure géométrique de l'espace des solutions affecte la complexité computationnelle des algorithmes
Propriété de chevauchement lacunaire: La déconnexion géométrique comme indicateur prédictif de dureté algorithmique

Motivation de la Recherche

Les perceptrons binaires existants (tels que ABP, SBP) démontrent certes un écart statistique-computationnel, mais leurs seuils de dureté sont relativement fixes
La nécessité d'un modèle capable de moduler les propriétés de dureté pour mieux comprendre les causes géométriques de l'échec algorithmique
L'exploration du potentiel d'application en cryptographie de modèles présentant des propriétés de dureté extrême

Contributions Principales

Introduction du modèle de Perceptron à Onde Carrée: Proposition d'un nouveau modèle de perceptron doté d'une fonction d'activation oscillante φ_δ(h) = -sgn(sin(πh/δ))
Analyse du seuil de chevauchement lacunaire: Identification du seuil de chevauchement lacunaire α_OGP(δ) dans les cadres de stockage et maître-élève, seuil qui peut devenir arbitrairement petit en augmentant la fréquence d'oscillation 1/δ
Propriétés de dureté extrême: Démonstration que dans la limite δ→0, il existe un chevauchement lacunaire pour tout α>0, indiquant que le problème est difficile même à très faible densité de contraintes
Modularité du seuil de récupération: Démonstration dans le cadre maître-élève que le seuil de récupération des algorithmes de passage de messages peut devenir arbitrairement grand en réduisant δ
Perspectives d'application cryptographique: Fourniture d'une base théorique pour les constructions cryptographiques basées sur le perceptron (telles que les fonctions de hachage résistantes aux collisions)

Détails Méthodologiques

Définition des Tâches

Problème de Stockage

Étant donné un ensemble de données D = {(x^μ, y^μ)}^P_{μ=1}, trouver un vecteur de poids w ∈ {-1,+1}^N tel que :

y^μ = φ(1/√N · w · x^μ) ∀μ ∈ [P]

où x^μ_i ~ N(0,1) sont indépendants et identiquement distribués, y^μ = ±1 avec probabilité égale.

Problème Maître-Élève

Il existe un poids « maître » w* ∈ {-1,+1}^N, les étiquettes étant générées par le maître :

y^μ = φ(1/√N · w* · x^μ) ∀μ ∈ [P]

L'objectif est de récupérer le poids du maître ou de trouver une solution arbitraire.

Architecture du Modèle

Fonction d'Activation à Onde Carrée

φ_δ(h) = -sgn(sin(πh/δ))

Cette fonction d'activation possède une période T = 2δ, avec le paramètre δ contrôlant la fréquence d'oscillation.

Représentation de Fourier

φ_δ(h) = -4/π ∑_{n=0}^∞ 1/(2n+1) sin((2n+1)πh/δ)

Analyse de la Propriété de Chevauchement Lacunaire

Définition de m-OGP

Pour une instance donnée D, définir l'ensemble S_m(q,ε,D) contenant tous les ensembles de m configurations {w^1,...,w^m} satisfaisant :

Chaque w^a satisfait les contraintes
Pour tout a≠b : q < (w^a·w^b)/N < q+ε

Si Pr_DS_m(q,ε,D) ≠ ∅ → 0 (N→∞), la propriété m-OGP est dite satisfaite.

Fonction de Partition Clonée

N_m(q;D) = ∑_{w^1,...,w^m} ∏_{a=1}^m X_D(w^a) ∏_{a<b} δ(q - w^a·w^b/N)

Entropie Libre Recuite

φ^{ann}_m(q) = lim_{N→∞} 1/(mN) ln E_D N_m(q;D)

Points d'Innovation Technique

Dureté Modulable: Modulation continue de la dureté computationnelle du problème via le paramètre δ, atteignant une dureté extrême lorsque δ→0
Analyse Géométrique: Utilisation de méthodes de physique statistique pour analyser la structure géométrique de l'espace des solutions
Analyse Multi-Échelle: Combinaison de l'approximation recuite et de l'analyse de symétrie des répliques pour des prédictions théoriques de précisions différentes
Traitement Analytique de la Limite Petit δ: Analyse précise du cas limite via développement perturbatif

Configuration Expérimentale

Méthodes d'Analyse Théorique

Calcul Recuit: Fournit des estimations de borne supérieure du seuil OGP
Analyse de Symétrie des Répliques (RS): Calcul d'entropie libre plus précis
Développement Petit δ: Analyse perturbative pour la limite δ→0

Expériences Numériques

Taille des Systèmes: N = 4000-5000
Nombre d'Échantillons: En moyenne 80 échantillons indépendants par point de données
Tests Algorithmiques: Utilisation de l'algorithme de Passage de Messages Amplifié Renforcé (RAMP)

Indicateurs d'Évaluation

Seuil de Satisfiabilité: α_c(δ) - densité de contraintes critique pour l'existence de solutions
Seuil OGP: α_OGP(m,δ) - seuil d'apparition du chevauchement lacunaire m
Seuil Maître: α_T(δ) - seuil où le maître devient l'unique solution
Seuil Algorithmique: α_alg(δ) - seuil d'échec de l'algorithme RAMP

Résultats Expérimentaux

Résultats Principaux

Seuil de Satisfiabilité

Pour δ→∞, récupération de la capacité ABP α^{ABP}_c ≈ 0.833
Pour δ→0, la capacité tend vers la borne supérieure α_c(0) = 1
L'estimation RS dans la limite petit δ coïncide avec la borne supérieure recuite

Seuil de Chevauchement Lacunaire

Dans la limite δ→0 :

α^{ann}_{OGP}(m) = 1/m

Par conséquent α_(∞) = 0, signifiant qu'il existe un chevauchement lacunaire pour tout α > 0.

Résultats du Problème Maître-Élève

Le seuil maître α_T(δ) tend vers 1 lorsque δ→0
Le seuil de récupération α_r(δ) peut devenir arbitrairement grand en réduisant δ
Réalisation de la divergence du seuil de récupération dans le perceptron en coin inverse

Analyse de Performance Algorithmique

Les tests de performance de l'algorithme RAMP montrent :

Le seuil algorithmique α_alg(δ) diminue avec la réduction de δ
Existence d'un écart entre le seuil OGP estimé par RS et le seuil algorithmique
Pour δ = 1.5, l'écart est proche de zéro, en accord avec les résultats connus pour ABP

Étude de Cas : Perceptron en Coin Inverse

Par conception de la fonction d'activation :

φ(h) = sgn((h-γ)h(h+γ))

En γ = γ* = √(2log2), le seuil de récupération diverge :

α_r ≈ (π/8)(log2)^{-3/2} ε^{-1}

où ε = |γ - γ*|.

Travaux Connexes

Théorie du Perceptron

Résultats Classiques: Analyse de capacité de stockage de Gardner-Derrida
Perceptrons Binaires: Propriétés de dureté des modèles ABP et SBP
Écart Statistique-Computationnel: Différence entre l'algorithme de Bansal-Spencer et les limites informationnelles

Propriété de Chevauchement Lacunaire

Définition et Développement: Définition originale de Gamarnik-Zadik
Preuve d'Échec Algorithmique: Résultats d'universalité pour les classes d'algorithmes stables
Instances d'Application: Graphes aléatoires, problèmes de satisfiabilité, etc.

Méthodes de Physique Statistique

Méthode des Répliques: Calcul de fonction de partition et transitions de phase
Transitions Géométriques: Changements de structure de clustering de l'espace des solutions
Passage de Messages: Analyse théorique des algorithmes BP et AMP

Conclusions et Discussion

Conclusions Principales

Dureté Extrême: Le SWP dans la limite δ→0 exhibe une dureté computationnelle extrême, avec existence de chevauchement lacunaire pour toute densité de contraintes positive
Modularité: La dureté computationnelle du problème peut être modulée continuellement via le paramètre δ
Potentiel Cryptographique: Ces propriétés font du SWP un candidat puissant pour les applications cryptographiques
Compréhension Géométrique: Les fonctions d'activation oscillantes perturbent la connectivité de l'espace des solutions, causant l'échec algorithmique

Limitations

Symétrie des Répliques: L'analyse RS peut être inexacte dans certaines régions de paramètres, nécessitant une rupture de symétrie des répliques d'ordre supérieur
Effets de Taille Finie: L'analyse théorique repose sur la limite thermodynamique, les systèmes finis réels peuvent présenter des écarts
Limitations Algorithmiques: Seul l'algorithme RAMP a été testé, les performances d'autres algorithmes restent à étudier
Dépendance Paramétrique: Les résultats dépendent fortement du choix du paramètre δ

Directions Futures

Analyse RSB Complète: Développement d'une théorie complète de rupture de symétrie des répliques
Autres Algorithmes: Test de méthodes spectrales, relaxations SDP et autres classes d'algorithmes
Implémentation Cryptographique: Développement de protocoles cryptographiques concrets basés sur SWP
Généralisation: Étude de propriétés similaires pour d'autres fonctions d'activation oscillantes

Évaluation Approfondie

Points Forts

Innovation Théorique: Première étude systématique de la dureté computationnelle des fonctions d'activation oscillantes, offrant une nouvelle perspective théorique
Rigueur Méthodologique: Combinaison de méthodes de physique statistique et d'informatique théorique, analyse complète et approfondie
Profondeur des Résultats: Découverte d'un nouveau mécanisme de dureté modulable, d'importance majeure pour la compréhension des limites algorithmiques
Perspectives d'Application: Fourniture de nouveaux outils théoriques pour la cryptographie

Insuffisances

Complexité Technique: Les méthodes d'analyse sont relativement complexes, pouvant limiter l'accessibilité des résultats
Vérification Expérimentale: Reposant principalement sur l'analyse théorique, les expériences numériques sont relativement limitées
Praticité: La réalisabilité pratique dans les paramètres extrêmes (δ→0) est sujette à caution
Généralité: L'universalité des résultats et leur applicabilité à d'autres problèmes nécessitent une vérification supplémentaire

Impact

Contribution Théorique: Fourniture de nouveaux outils et perspectives d'analyse pour la théorie de la complexité computationnelle
Valeur Interdisciplinaire: Connexion de la physique statistique, l'apprentissage automatique et la cryptographie
Signification Inspirante: Peut inspirer davantage de recherches sur la dureté géométrique
Potentiel Pratique: Perspectives d'application en cryptographie et conception d'algorithmes

Scénarios d'Application

Recherche Théorique: Théorie de la complexité computationnelle et recherche en physique statistique
Analyse Algorithmique: Compréhension des limites et mécanismes d'échec des algorithmes de passage de messages
Conception Cryptographique: Développement de nouvelles primitives cryptographiques basées sur des hypothèses de dureté
Apprentissage Automatique: Compréhension des obstacles computationnels dans l'entraînement des réseaux de neurones

Références Bibliographiques

L'article cite 75 références pertinentes, incluant principalement :

Rosenblatt (1958): Définition originale du perceptron
Gardner & Derrida (1989): Résultats classiques sur la capacité de stockage du perceptron
Gamarnik & Zadik (2019): Définition de la propriété de chevauchement lacunaire
Baldassi et al. (2015): Analyse du seuil algorithmique des perceptrons binaires
Mézard & Montanari (2009): Introduction systématique des méthodes de physique statistique

Cet article apporte une contribution importante au domaine d'intersection entre l'informatique théorique et la physique statistique. En introduisant le modèle de Perceptron à Onde Carrée à dureté modulable, il fournit de nouveaux outils et perspectives pour comprendre l'origine géométrique de la dureté algorithmique. Les propriétés de dureté extrême découvertes possèdent non seulement une valeur théorique, mais ouvrent également de nouvelles possibilités pour les applications cryptographiques.