2025-11-24T00:19:17.738116

Overlap Gap and Computational Thresholds in the Square Wave Perceptron

Benedetti, Bogdanov, Malatesta et al.

Square Wave Perceptrons (SWPs) form a class of neural network models with oscillating activation function that exhibit intriguing ``hardness'' properties in the high-dimensional limit at a fixed constraint density $Î±= O(1)$. In this work, we examine two key aspects of these models. The first is related to the so-called \emph{overlap-gap property}, that is a disconnectivity feature of the geometry of the solution space of combinatorial optimization problems proven to cause the failure of a large family of solvers, and conjectured to be a symptom of algorithmic hardness. We identify, both in the storage and in the teacher-student settings, the emergence of an overlap gap at a threshold $Î±_{\mathrm{OGP}}(Î´)$, which can be made arbitrarily small by suitably increasing the frequency of oscillations $1/Î´$ of the activation. This suggests that in this small-$Î´$ regime, typical instances of the problem are hard to solve even for small values of $Î±$. Second, in the teacher-student setup, we show that the recovery threshold of the planted signal for message-passing algorithms can be made arbitrarily large by reducing $Î´$. These properties make SWPs both a challenging benchmark for algorithms and an interesting candidate for cryptographic applications.

academic

Brecha de Superposición y Umbrales Computacionales en el Perceptrón de Onda Cuadrada

Información Básica

ID del Artículo: 2506.05197
Título: Overlap Gap and Computational Thresholds in the Square Wave Perceptron
Autores: Marco Benedetti, Andrej Bogdanov, Enrico M. Malatesta, Marc Mézard, Gianmarco Perrupato, Alon Rosen, Nikolaj I. Schwartzbach, Riccardo Zecchina
Clasificación: cond-mat.dis-nn (Materia Condensada - Sistemas Desordenados y Redes Neuronales)
Fecha de Publicación: 13 de octubre de 2025 (preimpresión arXiv)
Enlace del Artículo: https://arxiv.org/abs/2506.05197

Resumen

Los Perceptrones de Onda Cuadrada (SWP, por sus siglas en inglés) constituyen una clase de modelos de redes neuronales con funciones de activación oscilatoria que exhiben interesantes características de "dureza" en el límite de alta dimensionalidad con densidad de restricciones fija α = O(1). Este estudio examina dos aspectos clave de estos modelos: primero, la propiedad de brecha de superposición (overlap-gap property), una característica de desconexión en la geometría del espacio de soluciones de problemas de optimización combinatoria que se ha demostrado causa el fracaso de numerosos solucionadores y se conjetura que es un síntoma de dureza algorítmica; segundo, en la configuración maestro-alumno, el umbral de recuperación de algoritmos de paso de mensajes puede hacerse arbitrariamente grande reduciendo δ. Estas propiedades hacen que los SWP sean tanto un punto de referencia desafiante para algoritmos como candidatos interesantes para aplicaciones criptográficas.

Antecedentes de Investigación y Motivación

Contexto del Problema

Esta investigación se centra en la complejidad computacional del problema del perceptrón, particularmente en el análisis de dureza en la intersección de la física estadística y la informática teórica. El perceptrón, como modelo de red neuronal más fundamental, tiene importancia significativa en la comprensión de las limitaciones computacionales de redes neuronales más complejas en problemas de aprendizaje y almacenamiento.

Problemas Centrales

Brecha Estadístico-Computacional: En muchos problemas de satisfacción de restricciones, existe una brecha entre la región de parámetros factible desde el punto de vista de la teoría de la información y la región donde se sabe que funcionan algoritmos de tiempo polinomial
Características Geométricas de Dureza: Cómo la estructura geométrica del espacio de soluciones afecta la complejidad computacional de los algoritmos
Propiedad de Brecha de Superposición: La desconexión geométrica como indicador predictivo de dureza algorítmica

Motivación de la Investigación

Los perceptrones binarios existentes (como ABP, SBP) aunque demuestran brechas estadístico-computacionales, tienen umbrales de dureza relativamente fijos
Se necesita un modelo que pueda ajustar características de dureza para comprender mejor las razones geométricas del fracaso algorítmico
Explorar aplicaciones potenciales en criptografía de modelos con características de dureza extrema

Contribuciones Principales

Introducción del Modelo de Perceptrón de Onda Cuadrada: Se propone un nuevo modelo de perceptrón con función de activación oscilatoria φ_δ(h) = -sgn(sin(πh/δ))
Análisis del Umbral de Brecha de Superposición: Se identifica el umbral de brecha de superposición α_OGP(δ) en configuraciones de almacenamiento y maestro-alumno, que puede hacerse arbitrariamente pequeño aumentando la frecuencia de oscilación 1/δ
Características de Dureza Extrema: Se demuestra que en el límite δ→0, existe brecha de superposición para cualquier α>0, indicando que el problema es difícil incluso con densidad de restricciones muy pequeña
Ajustabilidad del Umbral de Recuperación: En la configuración maestro-alumno, se demuestra que el umbral de recuperación de algoritmos de paso de mensajes puede hacerse arbitrariamente grande reduciendo δ
Perspectivas de Aplicación Criptográfica: Se proporciona base teórica para construcciones criptográficas basadas en perceptrón (como funciones hash resistentes a colisiones)

Explicación Detallada de Métodos

Definición de Tareas

Problema de Almacenamiento

Dado un conjunto de datos D = {(x^μ, y^μ)}^P_{μ=1}, encontrar un vector de pesos w ∈ {-1,+1}^N tal que:

y^μ = φ(1/√N · w · x^μ) ∀μ ∈ [P]

donde x^μ_i ~ N(0,1) son independientes e idénticamente distribuidas, y^μ = ±1 con probabilidad igual.

Problema Maestro-Alumno

Existe un peso "maestro" w* ∈ {-1,+1}^N, las etiquetas se generan por el maestro:

y^μ = φ(1/√N · w* · x^μ) ∀μ ∈ [P]

El objetivo es recuperar el peso del maestro o encontrar cualquier solución.

Arquitectura del Modelo

Función de Activación de Onda Cuadrada

φ_δ(h) = -sgn(sin(πh/δ))

Esta función de activación tiene período T = 2δ, controlando la frecuencia de oscilación mediante el parámetro δ.

Representación de Fourier

φ_δ(h) = -4/π ∑_{n=0}^∞ 1/(2n+1) sin((2n+1)πh/δ)

Análisis de la Propiedad de Brecha de Superposición

Definición de m-OGP

Para una instancia dada D, se define el conjunto S_m(q,ε,D) que contiene todos los conjuntos de m configuraciones {w^1,...,w^m} satisfaciendo:

Cada w^a satisface las restricciones
Para cualquier a≠b: q < (w^a·w^b)/N < q+ε

Si Pr_DS_m(q,ε,D) ≠ ∅ → 0 (N→∞), se dice que la propiedad m-OGP se cumple.

Función de Partición de Clones

N_m(q;D) = ∑_{w^1,...,w^m} ∏_{a=1}^m X_D(w^a) ∏_{a<b} δ(q - w^a·w^b/N)

Entropía Libre de Recocido

φ^{ann}_m(q) = lim_{N→∞} 1/(mN) ln E_D N_m(q;D)

Puntos de Innovación Técnica

Dureza Ajustable: Mediante el parámetro δ se ajusta continuamente la dureza computacional del problema, alcanzando dureza extrema cuando δ→0
Análisis Geométrico: Se utiliza el método de física estadística para analizar la estructura geométrica del espacio de soluciones
Análisis Multiescala: Se combina aproximación de recocido y análisis de simetría de réplicas para proporcionar predicciones teóricas de diferentes precisiones
Tratamiento Analítico del Límite de δ Pequeño: Mediante expansión de perturbación se analiza precisamente el caso límite

Configuración Experimental

Métodos de Análisis Teórico

Cálculo de Recocido: Proporciona estimaciones de cota superior del umbral OGP
Análisis de Simetría de Réplicas (RS): Cálculo más preciso de entropía libre
Expansión de δ Pequeño: Análisis de perturbación para el límite δ→0

Experimentos Numéricos

Escala del Sistema: N = 4000-5000
Cantidad de Muestras: Promedio de 80 muestras independientes por punto de datos
Algoritmos Probados: Uso del algoritmo de Paso de Mensajes Aproximado Reforzado (RAMP)

Métricas de Evaluación

Umbral de Satisfacibilidad: α_c(δ) - densidad de restricciones crítica donde existen soluciones
Umbral OGP: α_OGP(m,δ) - umbral donde aparece brecha de superposición m-plicada
Umbral del Maestro: α_T(δ) - umbral donde el maestro es la única solución
Umbral Algorítmico: α_alg(δ) - umbral donde falla el algoritmo RAMP

Resultados Experimentales

Resultados Principales

Umbral de Satisfacibilidad

Para δ→∞, se recupera la capacidad ABP α^{ABP}_c ≈ 0.833
Para δ→0, la capacidad tiende a la cota superior α_c(0) = 1
La estimación RS en el límite de δ pequeño coincide con la cota superior de recocido

Umbral de Brecha de Superposición

En el límite δ→0:

α^{ann}_{OGP}(m) = 1/m

Por lo tanto α_(∞) = 0, lo que significa que existe brecha de superposición para cualquier α > 0.

Resultados del Problema Maestro-Alumno

El umbral del maestro α_T(δ) tiende a 1 cuando δ→0
El umbral de recuperación α_r(δ) puede hacerse arbitrariamente grande reduciendo δ
Se logró la divergencia del umbral de recuperación en el perceptrón de cuña inversa

Análisis de Rendimiento Algorítmico

Las pruebas de rendimiento del algoritmo RAMP muestran:

El umbral algorítmico α_alg(δ) disminuye conforme δ se reduce
Existe una brecha entre el umbral OGP estimado por RS y el umbral algorítmico
Para δ = 1.5, la brecha es cercana a cero, consistente con resultados conocidos de ABP

Análisis de Caso: Perceptrón de Cuña Inversa

Mediante el diseño de la función de activación:

φ(h) = sgn((h-γ)h(h+γ))

En γ = γ* = √(2log2), el umbral de recuperación diverge:

α_r ≈ (π/8)(log2)^{-3/2} ε^{-1}

donde ε = |γ - γ*|.

Trabajo Relacionado

Teoría del Perceptrón

Resultados Clásicos: Análisis de capacidad de almacenamiento de Gardner-Derrida
Perceptrones Binarios: Características de dureza de modelos ABP y SBP
Brecha Estadístico-Computacional: Diferencia entre algoritmos de Bansal-Spencer y límites de teoría de la información

Propiedad de Brecha de Superposición

Definición y Desarrollo: Definición original de Gamarnik-Zadik
Prueba de Fracaso Algorítmico: Resultados de universalidad para clases de algoritmos estables
Ejemplos de Aplicación: Grafos aleatorios, problemas de satisfacibilidad, etc.

Métodos de Física Estadística

Método de Réplicas: Cálculo de función de partición y transiciones de fase
Transiciones Geométricas: Cambios en la estructura de agrupamiento del espacio de soluciones
Paso de Mensajes: Análisis teórico de algoritmos BP y AMP

Conclusiones y Discusión

Conclusiones Principales

Dureza Extrema: El SWP en el límite δ→0 exhibe dureza computacional extrema, con brecha de superposición existente para cualquier densidad de restricciones positiva
Ajustabilidad: Mediante el parámetro δ se puede ajustar continuamente las características de dureza del problema
Potencial Criptográfico: Estas propiedades hacen del SWP un candidato fuerte para aplicaciones criptográficas
Comprensión Geométrica: Las funciones de activación oscilatoria rompen la conectividad del espacio de soluciones, causando fracaso algorítmico

Limitaciones

Simetría de Réplicas: El análisis RS puede ser inexacto en ciertas regiones de parámetros, requiriendo ruptura de simetría de réplicas de orden superior
Efectos de Tamaño Finito: El análisis teórico se basa en el límite termodinámico, sistemas finitos reales pueden tener desviaciones
Limitaciones Algorítmicas: Solo se probó el algoritmo RAMP, el rendimiento de otros algoritmos aún requiere investigación
Dependencia de Parámetros: Los resultados dependen fuertemente de la elección del parámetro δ

Direcciones Futuras

Análisis RSB Completo: Desarrollar teoría completa de ruptura de simetría de réplicas
Otros Algoritmos: Probar métodos espectrales, relajaciones SDP y otras clases de algoritmos
Implementación Criptográfica: Desarrollar protocolos criptográficos concretos basados en SWP
Generalización: Investigar propiedades similares de otras funciones de activación oscilatoria

Evaluación Profunda

Fortalezas

Innovación Teórica: Primer estudio sistemático de dureza computacional de funciones de activación oscilatoria, proporcionando nueva perspectiva teórica
Metodología Rigurosa: Combinación de métodos de física estadística e informática teórica, análisis integral y profundo
Resultados Profundos: Descubrimiento de nuevo mecanismo de dureza ajustable, significativo para comprender límites algorítmicos
Perspectivas de Aplicación: Proporciona nuevas herramientas teóricas para criptografía

Deficiencias

Complejidad Técnica: Los métodos de análisis son relativamente complejos, lo que puede limitar la accesibilidad de los resultados
Verificación Experimental: Depende principalmente de análisis teórico, experimentos numéricos relativamente limitados
Practicidad: La viabilidad de implementación real en parámetros extremos (δ→0) es cuestionable
Generalidad: La universalidad de los resultados y aplicabilidad a otros problemas requiere verificación adicional

Impacto

Contribución Teórica: Proporciona nuevas herramientas y perspectivas de análisis para teoría de complejidad computacional
Valor Interdisciplinario: Conecta física estadística, aprendizaje automático y criptografía
Significado Inspirador: Puede inspirar más investigación sobre dureza geométrica
Potencial Práctico: Tiene perspectivas de aplicación en criptografía y diseño de algoritmos

Escenarios Aplicables

Investigación Teórica: Investigación en teoría de complejidad computacional y física estadística
Análisis Algorítmico: Comprensión de límites y mecanismos de fracaso de algoritmos de paso de mensajes
Diseño Criptográfico: Desarrollo de nuevas primitivas criptográficas basadas en supuestos de dureza
Aprendizaje Automático: Comprensión de obstáculos computacionales en entrenamiento de redes neuronales

Referencias

El artículo cita 75 referencias relacionadas, incluyendo principalmente:

Rosenblatt (1958): Definición original del perceptrón
Gardner & Derrida (1989): Resultados clásicos de capacidad de almacenamiento del perceptrón
Gamarnik & Zadik (2019): Definición de propiedad de brecha de superposición
Baldassi et al. (2015): Análisis de umbral algorítmico de perceptrones binarios
Mézard & Montanari (2009): Introducción sistemática de métodos de física estadística

Este artículo realiza contribuciones importantes en la intersección de la informática teórica y la física estadística. Mediante la introducción del modelo de perceptrón de onda cuadrada con dureza ajustable, proporciona nuevas herramientas y perspectivas para comprender el origen geométrico de la dureza algorítmica. Las características de dureza extrema descubiertas no solo tienen valor teórico, sino que también abren nuevas posibilidades para aplicaciones criptográficas.