The application of deep learning to the area of communications systems has been a growing field of interest in recent years. Forward-forward (FF) learning is an efficient alternative to the backpropagation (BP) algorithm, which is the typically used training procedure for neural networks. Among its several advantages, FF learning does not require the communication channel to be differentiable and does not rely on the global availability of partial derivatives, allowing for an energy-efficient implementation. In this work, we design end-to-end learned autoencoders using the FF algorithm and numerically evaluate their performance for the additive white Gaussian noise and Rayleigh block fading channels. We demonstrate their competitiveness with BP-trained systems in the case of joint coding and modulation, and in a scenario where a fixed, non-differentiable modulation stage is applied. Moreover, we provide further insights into the design principles of the FF network, its training convergence behavior, and significant memory and processing time savings compared to BP-based approaches.
- ID del Artículo: 2510.11418
- Título: Forward-Forward Autoencoder Architectures for Energy-Efficient Wireless Communications
- Autores: Daniel Seifert, Onur Günlü, Rafael F. Schaefer
- Clasificación: cs.IT cs.LG math.IT
- Fecha de Publicación: 13 de octubre de 2025 (preimpresión en arXiv)
- Enlace del Artículo: https://arxiv.org/abs/2510.11418
La aplicación del aprendizaje profundo en sistemas de comunicación ha recibido considerable atención en años recientes. El aprendizaje forward-forward (FF) constituye una alternativa eficiente al algoritmo de retropropagación (BP), que es el procedimiento de entrenamiento típico de redes neuronales. Las numerosas ventajas del aprendizaje FF incluyen: no requiere que el canal de comunicación sea diferenciable, no depende de la disponibilidad global de derivadas parciales, permitiendo así implementaciones energéticamente eficientes. Este estudio diseña autocodificadores de aprendizaje de extremo a extremo utilizando el algoritmo FF y evalúa numéricamente su desempeño en canales de ruido blanco gaussiano aditivo (AWGN) y desvanecimiento de bloque Rayleigh. La investigación demuestra la competitividad con sistemas entrenados con BP en escenarios de codificación-modulación conjunta, así como en aplicaciones con fases de modulación fija no diferenciable. Además, se proporcionan perspectivas profundas sobre los principios de diseño de redes FF, comportamiento de convergencia del entrenamiento, y ahorros significativos de memoria y tiempo de procesamiento en comparación con métodos BP.
El algoritmo de retropropagación tradicional presenta tres problemas principales en sistemas de comunicación:
- Requisito de Ruta Diferenciable: BP requiere una ruta completamente diferenciable a través de toda la red neuronal, mientras que los canales reales frecuentemente no son diferenciables
- Baja Eficiencia de Memoria y Energía: Necesita almacenar derivadas parciales en cada nodo, resultando en alto consumo de memoria y energía
- Mecanismo de Bloqueo: Existe bloqueo hacia atrás, donde todas las capas deben esperar la finalización del cálculo de gradientes de capas posteriores
El despliegue de métodos de aprendizaje profundo en sistemas de comunicación enfrenta desafíos prácticos, particularmente en dispositivos periféricos con recursos limitados. Las limitaciones del algoritmo BP tradicional obstaculizan la implementación eficiente de redes neuronales en sistemas de comunicación reales.
- Métodos de Aprendizaje por Refuerzo: Requieren enlaces de retroalimentación adicionales sin ruido para estimar gradientes del transmisor
- Redes Generativas Adversariales/Modelos de Difusión: Aunque diferenciables, presentan alta complejidad computacional
- Estimadores de Paso Directo (STE): Desempeño significativamente reducido en escenarios de cuantización
El algoritmo FF posee las siguientes ventajas que lo hacen particularmente adecuado para sistemas de comunicación:
- No requiere canales diferenciables
- Permite circuitos completamente analógicos y de bajo consumo
- Permite procesos de entrenamiento en pipeline
- Reduce significativamente el uso de memoria
- Propone arquitecturas de autocodificadores de extremo a extremo basadas en el algoritmo FF, diseñadas específicamente para sistemas de comunicación inalámbrica
- Diseña estrategias de generación de datos de entrada contrastivos, incluyendo métodos de construcción de muestras positivas, negativas y neutrales
- Valida desempeño competitivo en canales AWGN y desvanecimiento de bloque Rayleigh, con ventajas particulares en escenarios no diferenciables
- Proporciona análisis profundo de principios de diseño de redes, incluyendo efectos de profundidad y ancho de red en el desempeño
- Cuantifica ahorros significativos de memoria y tiempo de procesamiento, demostrando ventajas prácticas del algoritmo FF
Dado un mensaje m∈M={0,…,2k−1}, el autocodificador debe:
- Codificar el mensaje de k bits en una palabra de código de dimensión n
- Transmitir a través de un canal ruidoso
- Decodificar correctamente el mensaje original en el extremo receptor
- El objetivo de optimización es minimizar la tasa de error de bloque (BLER)
Como se muestra en la Figura 1, el autocodificador FF contiene:
- Codificador: L capas completamente conectadas con salida normalizada/cuantizada
- Canal: Canal AWGN o desvanecimiento de bloque Rayleigh
- Decodificador: K capas completamente conectadas
- Clasificador: Clasificador de una sola capa con salida softmax probabilística
La innovación clave del algoritmo FF es el diseño de datos de entrada contrastivos:
- Muestras Positivas: v=(1m∣∣1m) (etiqueta verdadera replicada)
- Muestras Negativas: v=(1m∣∣1mˉ) (etiqueta verdadera + etiqueta de error aleatoria)
- Muestras Neutrales: v=(1m∣∣0) (para inferencia)
Donde 1m denota la codificación one-hot del mensaje m, y ∣∣ denota la operación de concatenación.
La optimización de cada capa se basa en la métrica de "bondad" gi=∣∣ai∣∣22, con función de pérdida definida como:
undefined