Overlap Gap and Computational Thresholds in the Square Wave Perceptron
Benedetti, Bogdanov, Malatesta et al.
Square Wave Perceptrons (SWPs) form a class of neural network models with oscillating activation function that exhibit intriguing ``hardness'' properties in the high-dimensional limit at a fixed constraint density $α= O(1)$. In this work, we examine two key aspects of these models. The first is related to the so-called \emph{overlap-gap property}, that is a disconnectivity feature of the geometry of the solution space of combinatorial optimization problems proven to cause the failure of a large family of solvers, and conjectured to be a symptom of algorithmic hardness. We identify, both in the storage and in the teacher-student settings, the emergence of an overlap gap at a threshold $α_{\mathrm{OGP}}(δ)$, which can be made arbitrarily small by suitably increasing the frequency of oscillations $1/δ$ of the activation. This suggests that in this small-$δ$ regime, typical instances of the problem are hard to solve even for small values of $α$. Second, in the teacher-student setup, we show that the recovery threshold of the planted signal for message-passing algorithms can be made arbitrarily large by reducing $δ$. These properties make SWPs both a challenging benchmark for algorithms and an interesting candidate for cryptographic applications.
academic
Überlappungslücke und Rechenschwellen im Rechteckwellen-Perzeptron
Titel: Overlap Gap and Computational Thresholds in the Square Wave Perceptron
Autoren: Marco Benedetti, Andrej Bogdanov, Enrico M. Malatesta, Marc Mézard, Gianmarco Perrupato, Alon Rosen, Nikolaj I. Schwartzbach, Riccardo Zecchina
Klassifizierung: cond-mat.dis-nn (Kondensierte Materie - Ungeordnete Systeme und Neuronale Netze)
Veröffentlichungsdatum: 13. Oktober 2025 (arXiv-Preprint)
Rechteckwellen-Perzeptrone (SWPs) sind eine Klasse von neuronalen Netzwerkmodellen mit oszillierenden Aktivierungsfunktionen, die in der hochdimensionalen Grenze bei fester Beschränkungsdichte α = O(1) interessante "Härte"-Eigenschaften aufweisen. Diese Untersuchung untersucht zwei kritische Aspekte dieser Modelle: erstens die Überlappungslücken-Eigenschaft (overlap-gap property), ein Merkmal der Unverbundenheit der Lösungsraumgeometrie von kombinatorischen Optimierungsproblemen, die bekanntermaßen zum Versagen vieler Löser führt und als Symptom algorithmischer Härte vermutet wird; zweitens können in der Lehrer-Schüler-Einstellung die Wiederherstellungsschwellen von Nachrichtenübergabe-Algorithmen durch Verringerung von δ beliebig groß werden. Diese Eigenschaften machen SWPs sowohl zu einer herausfordernden Benchmark für Algorithmen als auch zu interessanten Kandidaten für kryptographische Anwendungen.
Diese Untersuchung konzentriert sich auf die Rechenkomplexität des Perzeptron-Problems, insbesondere auf die Härteanalyse im Schnittbereich von statistischer Physik und theoretischer Informatik. Das Perzeptron als grundlegendstes neuronales Netzwerkmodell ist in seinem Lern- und Speicherproblem von großer Bedeutung für das Verständnis der Rechengrenzen komplexerer neuronaler Netze.
Statistisch-rechnerische Lücke: In vielen Constraint-Satisfaction-Problemen existiert eine Lücke zwischen dem informationstheoretisch machbaren Parameterbereich und dem Bereich, in dem bekannte Polynomzeit-Algorithmen funktionieren
Geometrische Härte-Charakteristiken: Wie die geometrische Struktur des Lösungsraums die rechnerische Komplexität von Algorithmen beeinflusst
Überlappungslücken-Eigenschaft: Geometrische Unverbundenheit als Vorhersageindikatoren für algorithmische Härte
Einführung des Rechteckwellen-Perzeptron-Modells: Vorschlag eines neuen Perzeptron-Modells mit oszillierender Aktivierungsfunktion φ_δ(h) = -sgn(sin(πh/δ))
Analyse der Überlappungslücken-Schwelle: Identifizierung der Überlappungslücken-Schwelle α_OGP(δ) in Speicher- und Lehrer-Schüler-Einstellungen, die durch Erhöhung der Oszillationsfrequenz 1/δ beliebig klein werden kann
Extreme Härte-Eigenschaften: Nachweis, dass in der Grenze δ→0 für jedes α>0 eine Überlappungslücke existiert, was zeigt, dass das Problem auch bei sehr kleinen Beschränkungsdichten schwierig ist
Regulierbarkeit der Wiederherstellungsschwelle: Demonstration in der Lehrer-Schüler-Einstellung, dass die Wiederherstellungsschwelle von Nachrichtenübergabe-Algorithmen durch Verringerung von δ beliebig groß werden kann
Kryptographische Anwendungsaussichten: Bereitstellung einer theoretischen Grundlage für kryptographische Konstruktionen auf Basis von Perzeptronen (wie kollisionsresistente Hash-Funktionen)
Theoretische Innovation: Erste systematische Untersuchung der Rechenhärte oszillierender Aktivierungsfunktionen mit neuer theoretischer Perspektive
Methodische Strenge: Umfassende und tiefgreifende Analyse durch Kombination von statistisch-physikalischen und theoretisch-informatischen Methoden
Tiefgreifende Ergebnisse: Entdeckung eines neuen Mechanismus für regulierbare Härte mit wichtiger Bedeutung für das Verständnis algorithmischer Grenzen
Anwendungsperspektiven: Bereitstellung neuer theoretischer Werkzeuge für die Kryptographie
Dieses Papier leistet wichtige Beiträge im Schnittbereich von theoretischer Informatik und statistischer Physik. Durch die Einführung des Rechteckwellen-Perzeptron-Modells mit regulierbarer Härte bietet es neue Werkzeuge und Perspektiven zum Verständnis der geometrischen Ursprünge algorithmischer Härte. Die entdeckten extremen Härte-Eigenschaften haben nicht nur theoretischen Wert, sondern eröffnen auch neue Möglichkeiten für kryptographische Anwendungen.