2025-11-14T20:28:11.411800

Local Timescale Gates for Timescale-Robust Continual Spiking Neural Networks

Tiwari, Chauhan

Spiking neural networks (SNNs) promise energy-efficient artificial intelligence on neuromorphic hardware but struggle with tasks requiring both fast adaptation and long-term memory, especially in continual learning. We propose Local Timescale Gating (LT-Gate), a neuron model that combines dual time-constant dynamics with an adaptive gating mechanism. Each spiking neuron tracks information on a fast and a slow timescale in parallel, and a learned gate locally adjusts their influence. This design enables individual neurons to preserve slow contextual information while responding to fast signals, addressing the stability-plasticity dilemma. We further introduce a variance-tracking regularization that stabilizes firing activity, inspired by biological homeostasis. Empirically, LT-Gate yields significantly improved accuracy and retention in sequential learning tasks: on a challenging temporal classification benchmark it achieves about 51 percent final accuracy, compared to about 46 percent for a recent Hebbian continual-learning baseline and lower for prior SNN methods. Unlike approaches that require external replay or expensive orthogonalizations, LT-Gate operates with local updates and is fully compatible with neuromorphic hardware. In particular, it leverages features of Intel's Loihi chip (multiple synaptic traces with different decay rates) for on-chip learning. Our results demonstrate that multi-timescale gating can substantially enhance continual learning in SNNs, narrowing the gap between spiking and conventional deep networks on lifelong-learning tasks.

academic

Compuertas de Escala de Tiempo Local para Redes Neuronales de Picos Continuas Robustas a Escala de Tiempo

Información Básica

ID del Artículo: 2510.12843
Título: Local Timescale Gates for Timescale-Robust Continual Spiking Neural Networks
Autores: Ansh Tiwari, Ayush Chauhan
Clasificación: cs.LG (Aprendizaje Automático)
Fecha de Publicación: 13 de octubre de 2025 (Preimpresión)
Enlace del Artículo: https://arxiv.org/abs/2510.12843

Resumen

Las redes neuronales de picos (SNNs) poseen ventajas de eficiencia energética en hardware neuromórfico, pero tienen un desempeño deficiente en tareas que requieren adaptación rápida y memoria a largo plazo, particularmente en escenarios de aprendizaje continuo. Este artículo propone Compuertas de Escala de Tiempo Local (LT-Gate), un modelo neuronal que combina dinámicas de doble constante de tiempo y mecanismos de compuerta adaptativa. Cada neurona de pico rastrea en paralelo información de escala de tiempo rápida y lenta, regulando localmente su influencia mediante mecanismos de compuerta aprendidos. Este diseño permite que las neuronas individuales mantengan información de contexto lento mientras responden a señales rápidas, abordando el dilema estabilidad-plasticidad. El estudio también introduce regularización de seguimiento de varianza inspirada en homeostasis biológica para estabilizar la actividad de disparo. Los experimentos demuestran que LT-Gate alcanza aproximadamente 51% de precisión final en puntos de referencia de clasificación temporal, una mejora significativa respecto al 46% de la línea base de aprendizaje continuo Hebbiano reciente (HLOP).

Contexto de Investigación y Motivación

Problemas Centrales

Olvido Catastrófico en Aprendizaje Continuo: Las SNNs, como las redes neuronales tradicionales, olvidan el conocimiento previamente adquirido al aprender nuevas tareas
Dilema Estabilidad-Plasticidad: Necesidad de equilibrio entre mantener la estabilidad del conocimiento adquirido y la plasticidad para aprender nuevo conocimiento
Adaptabilidad de Escala de Tiempo: Los métodos existentes tienen dificultades para manejar tareas que requieren respuestas en diferentes escalas de tiempo

Importancia

La computación neuromórfica ha ganado considerable atención por sus ventajas de eficiencia energética impulsada por eventos
El aprendizaje continuo es una tecnología clave para lograr sistemas de IA de aprendizaje de por vida
Los sistemas neurales biológicos resuelven este problema mediante múltiples procesos adaptativos y diferentes escalas de tiempo intrínsecas

Limitaciones de Métodos Existentes

Regularización de Pesos y Repetición de Experiencia: Requieren sobrecarga adicional de almacenamiento y computación
Método HLOP: Requiere cálculos iterativos de subespacio con alta complejidad computacional
DSD-SNN: Necesita estrategias complejas de expansión de red
Falta de Plausibilidad Biológica: La mayoría de métodos no cumplen con restricciones de computación local de hardware neuromórfico

Contribuciones Principales

Propuesta del Modelo Neuronal LT-Gate: Combina dinámicas de doble escala de tiempo y mecanismos de compuerta local, implementando asignación flexible de crédito temporal
Diseño de Mecanismo de Regularización de Varianza: Basado en teoría de homeostasis biológica, mantiene activaciones neuronales en rango saludable, previniendo inestabilidad durante cambios de tarea
Logro de Mejora Significativa de Desempeño: Mejora sustancial del desempeño de aprendizaje continuo en tareas heterogéneas temporales, sin requerir memoria externa o crecimiento arquitectónico
Compatibilidad con Hardware Neuromórfico: Mapeo eficiente al chip Intel Loihi 2, soportando operaciones locales de filtrado y compuerta para aprendizaje en chip

Explicación Detallada del Método

Definición de Tarea

La investigación se enfoca en tareas de aprendizaje incremental en dominio temporal: la red debe realizar aprendizaje continuo entre dominios de entrada en diferentes escalas de tiempo, como cambiar de dominio de entrada de alta frecuencia (1000Hz) a baja frecuencia (50Hz), mientras mantiene capacidad de clasificación en dominios anteriores.

Arquitectura del Modelo

Modelo Neuronal de Doble Escala de Tiempo

La neurona LT-Gate contiene dos unidades de Integración y Disparo con Fuga (LIF) en paralelo:

Dinámica de Potencial de Membrana Rápida:

U^f_i(t+1) = ρ_f · U^f_i(t) + I_i(t)

Dinámica de Potencial de Membrana Lenta:

U^s_i(t+1) = ρ_s · U^s_i(t) + I_i(t)

donde 0 < ρ_f < ρ_s < 1 son factores de decaimiento, ρ = e^(-dt/τ)

Compuerta de Escala de Tiempo Local

Los dos potenciales de membrana se combinan mediante variable de compuerta aprendible γ_i ∈ 0,1:

U_i(t) = γ_i · U^s_i(t) + (1-γ_i) · U^f_i(t)

γ_i ≈ 1: la neurona actúa como unidad de escala de tiempo largo, preservando entradas pasadas
γ_i ≈ 0: prioriza respuestas rápidas

Regularización de Homeostasis con Seguimiento de Varianza

Se introduce término de regularización que incentiva a cada neurona mantener tasa de disparo objetivo y varianza:

L_var = λ_var Σ_i [(μ_i - μ*)² + (σ_i - σ*)²]

donde (μ*, σ*) son valores objetivo y λ_var es coeficiente de ponderación.

Puntos de Innovación Técnica

Mecanismo de Compuerta Distribuida: A diferencia de unidades de compuerta explícitas en LSTM, el mecanismo de compuerta LT-Gate se localiza en cada estado neuronal de pico
Proceso Dual de Homeostasis: Dinámicas rápidas responden cambios de entrada, dinámicas lentas y compuerta proporcionan retroalimentación negativa, manteniendo estadísticas de tasa de disparo general
Diseño Consciente del Hardware: Todos los cálculos (decaimiento, acumulación, umbral, compuerta) son locales a cada neurona o sinapsis, sin requerir coordinación global
Asignación Adaptativa de Constante de Tiempo: Mediante aprendizaje de γ, la red puede distribuir espectro efectivo de constante de tiempo entre neuronas

Configuración Experimental

Conjuntos de Datos

Conjunto de Datos MNIST con Variación de Frecuencia: Codifica imágenes MNIST estándar como secuencias de picos en diferentes velocidades de fotogramas
- Dominio rápido: tasa de presentación de entrada 1000Hz
- Dominio lento: tasa de presentación de entrada 50Hz

Métricas de Evaluación

Precisión Final: Precisión de clasificación en conjunto de prueba combinado
Tasa de Olvido: Disminución de precisión en tareas antiguas después de aprender nuevas tareas
Velocidad de Convergencia: Número de épocas de entrenamiento requeridas para alcanzar 90% de precisión final

Métodos de Comparación

HLOP: Método de Proyección Ortogonal con Aprendizaje Hebbiano
DSD-SNN: Red Neuronal de Picos con Desarrollo de Estructura Dinámica
SNN Estándar: Línea base LIF de escala de tiempo único

Detalles de Implementación

Arquitectura de Red: SNN convolucional de 3 capas (32→64→128 unidades)
Optimizador: Adam, tasa de aprendizaje 0.001
Constantes de Tiempo: τ_f = 5ms, τ_s = 50ms
Tasa de Disparo Objetivo: 2%, peso de regularización de varianza λ_var = 0.01

Resultados Experimentales

Resultados Principales

Método	Precisión Final (%)	Tasa de Olvido Tarea A (%)	Precisión Tarea B (%)	Velocidad de Convergencia (épocas)
SNN Estándar	38.2	12.5	41.8	45
HLOP	45.2	5.8	47.1	40
DSD-SNN	42.8	7.1	44.5	35
LT-Gate	51.0	3.2	52.8	25

Hallazgos Clave

Mejora Significativa de Desempeño: LT-Gate alcanza 51.0% de precisión final, 5.8 puntos porcentuales superior a HLOP
Olvido Mínimo: Tasa de olvido de solo 3.2%, manteniendo aproximadamente 95% del desempeño original
Convergencia Rápida: Convergencia en 25 épocas, 40-60% más rápido que métodos de línea base

Experimentos de Ablación

LT-Gate sin Compuerta: Precisión disminuye a 46.5%, tasa de olvido aumenta a 8.9%
Sin Regularización de Varianza: Precisión 49.8%, inestabilidad de entrenamiento ocasional

Generalización Entre Escalas de Tiempo

Después de entrenamiento solo en 1000Hz, LT-Gate alcanza 48% de precisión en dominio lento no entrenado (10Hz), mientras que SNN estándar solo alcanza 20%, demostrando fuerte capacidad de generalización entre dominios.

Trabajo Relacionado

Métodos de Aprendizaje Continuo en SNN

Regularización de Pesos: Versión de picos de Consolidación de Pesos Elásticos
Repetición de Experiencia: Mecanismo de repetición de memoria para proteger conocimiento antiguo
Métodos Inspirados en Cerebro: HLOP utiliza actualizaciones Hebbiana/Anti-Hebbiana, DSD-SNN crece/poda dinámicamente neuronas

Computación Neuronal Multi-Escala de Tiempo

Modelo LSNN: Mezcla heterogénea de neuronas con diferentes constantes de tiempo de adaptación
Modelos de Neurona Biológica: Adaptación de umbral y neuronas adaptativas con cambios de corriente lenta

Hardware Neuromórfico

El chip Intel Loihi soporta múltiples trazas sinápticas con diferentes tasas de decaimiento, proporcionando soporte de hardware natural para LT-Gate.

Conclusiones y Discusión

Conclusiones Principales

El Procesamiento Multi-Escala de Tiempo es Solución Efectiva para el Dilema Estabilidad-Plasticidad
Los Mecanismos de Compuerta Local Superan Compuertas Centralizadas, Mejor Adaptados a Hardware Neuromórfico
Los Mecanismos de Homeostasis Inspirados en Biología son Críticos para Estabilidad de Red
**El Diseño Consciente del Hardware Implementa Aprendizaje Eficiente en Chip

Limitaciones

Dependencia de Retropropagación de Gradiente Sustituto: Limita plausibilidad biológica
Rango de Evaluación Limitado: Solo prueba dos dominios secuenciales, escenarios multi-tarea requieren verificación adicional
Constantes de Tiempo Fijas: No implementa aprendizaje adaptativo de constante de tiempo por neurona
Escalabilidad en Tareas Complejas: Puede requerir suplemento de repetición ligera o regularización

Direcciones Futuras

Reglas de Aprendizaje Local: Desarrollar mecanismos de adaptación de compuerta basados en STDP
Extensión Multi-Escala de Tiempo: Utilizar tres o más escalas de tiempo
Diseño Colaborativo Hardware: Desarrollar circuitos de compuerta de tiempo dedicados
Aplicaciones a Gran Escala: Extender a SNNs de visión profunda y voz

Evaluación Profunda

Fortalezas

Innovación Fuerte: Primera implementación de compuerta multi-escala de tiempo distribuida en SNNs
Experimentación Completa: Experimentos de ablación exhaustivos y verificación de compatibilidad de hardware
Resultados Convincentes: Mejora significativa sobre métodos SOTA en múltiples métricas
Valor Práctico Alto: Mapeo directo a chips neuromórficos comerciales

Deficiencias

Análisis Teórico Insuficiente: Falta análisis teórico de dinámicas de aprendizaje de compuerta
Limitaciones de Conjunto de Datos: Validación principalmente en datos temporales sintéticos, carencia de puntos de referencia del mundo real
Equidad de Comparación: Algunos métodos de línea base pueden no estar completamente optimizados

Impacto

Contribución a Disciplina: Proporciona nuevo paradigma de diseño para aprendizaje continuo en SNN
Impulso de Hardware: Promueve desarrollo de funcionalidad multi-escala de tiempo en hardware neuromórfico
Reproducibilidad: Proporciona código completo y detalles de implementación detallados

Escenarios Aplicables

Dispositivos de IA de Borde: Sistemas inteligentes de bajo consumo que requieren adaptación continua
Robótica: Aprendizaje y adaptación en tiempo real en entornos dinámicos
Redes de Sensores: Procesamiento de señales bajo tasas de muestreo variables
Computación Neuromórfica: Aplicaciones que aprovechan características de hardware especializado

Referencias

1 Bellec et al. "Long short-term memory and learning-to-learn in networks of spiking neurons." NeurIPS 2018. 2 Cannon & Miller. "Stable control of firing rate mean and variance by dual homeostatic mechanisms." J Math Neurosci 2017. 3 Davies et al. "Loihi: A neuromorphic manycore processor with on-chip learning." IEEE Micro 2018. 7 Xiao et al. "Hebbian learning based orthogonal projection for continual learning of snns." ICLR 2024.