2025-11-14T20:28:11.411800

Local Timescale Gates for Timescale-Robust Continual Spiking Neural Networks

Tiwari, Chauhan
Spiking neural networks (SNNs) promise energy-efficient artificial intelligence on neuromorphic hardware but struggle with tasks requiring both fast adaptation and long-term memory, especially in continual learning. We propose Local Timescale Gating (LT-Gate), a neuron model that combines dual time-constant dynamics with an adaptive gating mechanism. Each spiking neuron tracks information on a fast and a slow timescale in parallel, and a learned gate locally adjusts their influence. This design enables individual neurons to preserve slow contextual information while responding to fast signals, addressing the stability-plasticity dilemma. We further introduce a variance-tracking regularization that stabilizes firing activity, inspired by biological homeostasis. Empirically, LT-Gate yields significantly improved accuracy and retention in sequential learning tasks: on a challenging temporal classification benchmark it achieves about 51 percent final accuracy, compared to about 46 percent for a recent Hebbian continual-learning baseline and lower for prior SNN methods. Unlike approaches that require external replay or expensive orthogonalizations, LT-Gate operates with local updates and is fully compatible with neuromorphic hardware. In particular, it leverages features of Intel's Loihi chip (multiple synaptic traces with different decay rates) for on-chip learning. Our results demonstrate that multi-timescale gating can substantially enhance continual learning in SNNs, narrowing the gap between spiking and conventional deep networks on lifelong-learning tasks.
academic

Compuertas de Escala de Tiempo Local para Redes Neuronales de Picos Continuas Robustas a Escala de Tiempo

Información Básica

  • ID del Artículo: 2510.12843
  • Título: Local Timescale Gates for Timescale-Robust Continual Spiking Neural Networks
  • Autores: Ansh Tiwari, Ayush Chauhan
  • Clasificación: cs.LG (Aprendizaje Automático)
  • Fecha de Publicación: 13 de octubre de 2025 (Preimpresión)
  • Enlace del Artículo: https://arxiv.org/abs/2510.12843

Resumen

Las redes neuronales de picos (SNNs) poseen ventajas de eficiencia energética en hardware neuromórfico, pero tienen un desempeño deficiente en tareas que requieren adaptación rápida y memoria a largo plazo, particularmente en escenarios de aprendizaje continuo. Este artículo propone Compuertas de Escala de Tiempo Local (LT-Gate), un modelo neuronal que combina dinámicas de doble constante de tiempo y mecanismos de compuerta adaptativa. Cada neurona de pico rastrea en paralelo información de escala de tiempo rápida y lenta, regulando localmente su influencia mediante mecanismos de compuerta aprendidos. Este diseño permite que las neuronas individuales mantengan información de contexto lento mientras responden a señales rápidas, abordando el dilema estabilidad-plasticidad. El estudio también introduce regularización de seguimiento de varianza inspirada en homeostasis biológica para estabilizar la actividad de disparo. Los experimentos demuestran que LT-Gate alcanza aproximadamente 51% de precisión final en puntos de referencia de clasificación temporal, una mejora significativa respecto al 46% de la línea base de aprendizaje continuo Hebbiano reciente (HLOP).

Contexto de Investigación y Motivación

Problemas Centrales

  1. Olvido Catastrófico en Aprendizaje Continuo: Las SNNs, como las redes neuronales tradicionales, olvidan el conocimiento previamente adquirido al aprender nuevas tareas
  2. Dilema Estabilidad-Plasticidad: Necesidad de equilibrio entre mantener la estabilidad del conocimiento adquirido y la plasticidad para aprender nuevo conocimiento
  3. Adaptabilidad de Escala de Tiempo: Los métodos existentes tienen dificultades para manejar tareas que requieren respuestas en diferentes escalas de tiempo

Importancia

  • La computación neuromórfica ha ganado considerable atención por sus ventajas de eficiencia energética impulsada por eventos
  • El aprendizaje continuo es una tecnología clave para lograr sistemas de IA de aprendizaje de por vida
  • Los sistemas neurales biológicos resuelven este problema mediante múltiples procesos adaptativos y diferentes escalas de tiempo intrínsecas

Limitaciones de Métodos Existentes

  1. Regularización de Pesos y Repetición de Experiencia: Requieren sobrecarga adicional de almacenamiento y computación
  2. Método HLOP: Requiere cálculos iterativos de subespacio con alta complejidad computacional
  3. DSD-SNN: Necesita estrategias complejas de expansión de red
  4. Falta de Plausibilidad Biológica: La mayoría de métodos no cumplen con restricciones de computación local de hardware neuromórfico

Contribuciones Principales

  1. Propuesta del Modelo Neuronal LT-Gate: Combina dinámicas de doble escala de tiempo y mecanismos de compuerta local, implementando asignación flexible de crédito temporal
  2. Diseño de Mecanismo de Regularización de Varianza: Basado en teoría de homeostasis biológica, mantiene activaciones neuronales en rango saludable, previniendo inestabilidad durante cambios de tarea
  3. Logro de Mejora Significativa de Desempeño: Mejora sustancial del desempeño de aprendizaje continuo en tareas heterogéneas temporales, sin requerir memoria externa o crecimiento arquitectónico
  4. Compatibilidad con Hardware Neuromórfico: Mapeo eficiente al chip Intel Loihi 2, soportando operaciones locales de filtrado y compuerta para aprendizaje en chip

Explicación Detallada del Método

Definición de Tarea

La investigación se enfoca en tareas de aprendizaje incremental en dominio temporal: la red debe realizar aprendizaje continuo entre dominios de entrada en diferentes escalas de tiempo, como cambiar de dominio de entrada de alta frecuencia (1000Hz) a baja frecuencia (50Hz), mientras mantiene capacidad de clasificación en dominios anteriores.

Arquitectura del Modelo

Modelo Neuronal de Doble Escala de Tiempo

La neurona LT-Gate contiene dos unidades de Integración y Disparo con Fuga (LIF) en paralelo:

Dinámica de Potencial de Membrana Rápida:

U^f_i(t+1) = ρ_f · U^f_i(t) + I_i(t)

Dinámica de Potencial de Membrana Lenta:

U^s_i(t+1) = ρ_s · U^s_i(t) + I_i(t)

donde 0 < ρ_f < ρ_s < 1 son factores de decaimiento, ρ = e^(-dt/τ)

Compuerta de Escala de Tiempo Local

Los dos potenciales de membrana se combinan mediante variable de compuerta aprendible γ_i ∈ 0,1:

U_i(t) = γ_i · U^s_i(t) + (1-γ_i) · U^f_i(t)
  • γ_i ≈ 1: la neurona actúa como unidad de escala de tiempo largo, preservando entradas pasadas
  • γ_i ≈ 0: prioriza respuestas rápidas

Regularización de Homeostasis con Seguimiento de Varianza

Se introduce término de regularización que incentiva a cada neurona mantener tasa de disparo objetivo y varianza:

L_var = λ_var Σ_i [(μ_i - μ*)² + (σ_i - σ*)²]

donde (μ*, σ*) son valores objetivo y λ_var es coeficiente de ponderación.

Puntos de Innovación Técnica

  1. Mecanismo de Compuerta Distribuida: A diferencia de unidades de compuerta explícitas en LSTM, el mecanismo de compuerta LT-Gate se localiza en cada estado neuronal de pico
  2. Proceso Dual de Homeostasis: Dinámicas rápidas responden cambios de entrada, dinámicas lentas y compuerta proporcionan retroalimentación negativa, manteniendo estadísticas de tasa de disparo general
  3. Diseño Consciente del Hardware: Todos los cálculos (decaimiento, acumulación, umbral, compuerta) son locales a cada neurona o sinapsis, sin requerir coordinación global
  4. Asignación Adaptativa de Constante de Tiempo: Mediante aprendizaje de γ, la red puede distribuir espectro efectivo de constante de tiempo entre neuronas

Configuración Experimental

Conjuntos de Datos

  • Conjunto de Datos MNIST con Variación de Frecuencia: Codifica imágenes MNIST estándar como secuencias de picos en diferentes velocidades de fotogramas
    • Dominio rápido: tasa de presentación de entrada 1000Hz
    • Dominio lento: tasa de presentación de entrada 50Hz

Métricas de Evaluación

  • Precisión Final: Precisión de clasificación en conjunto de prueba combinado
  • Tasa de Olvido: Disminución de precisión en tareas antiguas después de aprender nuevas tareas
  • Velocidad de Convergencia: Número de épocas de entrenamiento requeridas para alcanzar 90% de precisión final

Métodos de Comparación

  • HLOP: Método de Proyección Ortogonal con Aprendizaje Hebbiano
  • DSD-SNN: Red Neuronal de Picos con Desarrollo de Estructura Dinámica
  • SNN Estándar: Línea base LIF de escala de tiempo único

Detalles de Implementación

  • Arquitectura de Red: SNN convolucional de 3 capas (32→64→128 unidades)
  • Optimizador: Adam, tasa de aprendizaje 0.001
  • Constantes de Tiempo: τ_f = 5ms, τ_s = 50ms
  • Tasa de Disparo Objetivo: 2%, peso de regularización de varianza λ_var = 0.01

Resultados Experimentales

Resultados Principales

MétodoPrecisión Final (%)Tasa de Olvido Tarea A (%)Precisión Tarea B (%)Velocidad de Convergencia (épocas)
SNN Estándar38.212.541.845
HLOP45.25.847.140
DSD-SNN42.87.144.535
LT-Gate51.03.252.825

Hallazgos Clave

  1. Mejora Significativa de Desempeño: LT-Gate alcanza 51.0% de precisión final, 5.8 puntos porcentuales superior a HLOP
  2. Olvido Mínimo: Tasa de olvido de solo 3.2%, manteniendo aproximadamente 95% del desempeño original
  3. Convergencia Rápida: Convergencia en 25 épocas, 40-60% más rápido que métodos de línea base

Experimentos de Ablación

  • LT-Gate sin Compuerta: Precisión disminuye a 46.5%, tasa de olvido aumenta a 8.9%
  • Sin Regularización de Varianza: Precisión 49.8%, inestabilidad de entrenamiento ocasional

Generalización Entre Escalas de Tiempo

Después de entrenamiento solo en 1000Hz, LT-Gate alcanza 48% de precisión en dominio lento no entrenado (10Hz), mientras que SNN estándar solo alcanza 20%, demostrando fuerte capacidad de generalización entre dominios.

Trabajo Relacionado

Métodos de Aprendizaje Continuo en SNN

  1. Regularización de Pesos: Versión de picos de Consolidación de Pesos Elásticos
  2. Repetición de Experiencia: Mecanismo de repetición de memoria para proteger conocimiento antiguo
  3. Métodos Inspirados en Cerebro: HLOP utiliza actualizaciones Hebbiana/Anti-Hebbiana, DSD-SNN crece/poda dinámicamente neuronas

Computación Neuronal Multi-Escala de Tiempo

  1. Modelo LSNN: Mezcla heterogénea de neuronas con diferentes constantes de tiempo de adaptación
  2. Modelos de Neurona Biológica: Adaptación de umbral y neuronas adaptativas con cambios de corriente lenta

Hardware Neuromórfico

El chip Intel Loihi soporta múltiples trazas sinápticas con diferentes tasas de decaimiento, proporcionando soporte de hardware natural para LT-Gate.

Conclusiones y Discusión

Conclusiones Principales

  1. El Procesamiento Multi-Escala de Tiempo es Solución Efectiva para el Dilema Estabilidad-Plasticidad
  2. Los Mecanismos de Compuerta Local Superan Compuertas Centralizadas, Mejor Adaptados a Hardware Neuromórfico
  3. Los Mecanismos de Homeostasis Inspirados en Biología son Críticos para Estabilidad de Red
  4. **El Diseño Consciente del Hardware Implementa Aprendizaje Eficiente en Chip

Limitaciones

  1. Dependencia de Retropropagación de Gradiente Sustituto: Limita plausibilidad biológica
  2. Rango de Evaluación Limitado: Solo prueba dos dominios secuenciales, escenarios multi-tarea requieren verificación adicional
  3. Constantes de Tiempo Fijas: No implementa aprendizaje adaptativo de constante de tiempo por neurona
  4. Escalabilidad en Tareas Complejas: Puede requerir suplemento de repetición ligera o regularización

Direcciones Futuras

  1. Reglas de Aprendizaje Local: Desarrollar mecanismos de adaptación de compuerta basados en STDP
  2. Extensión Multi-Escala de Tiempo: Utilizar tres o más escalas de tiempo
  3. Diseño Colaborativo Hardware: Desarrollar circuitos de compuerta de tiempo dedicados
  4. Aplicaciones a Gran Escala: Extender a SNNs de visión profunda y voz

Evaluación Profunda

Fortalezas

  1. Innovación Fuerte: Primera implementación de compuerta multi-escala de tiempo distribuida en SNNs
  2. Experimentación Completa: Experimentos de ablación exhaustivos y verificación de compatibilidad de hardware
  3. Resultados Convincentes: Mejora significativa sobre métodos SOTA en múltiples métricas
  4. Valor Práctico Alto: Mapeo directo a chips neuromórficos comerciales

Deficiencias

  1. Análisis Teórico Insuficiente: Falta análisis teórico de dinámicas de aprendizaje de compuerta
  2. Limitaciones de Conjunto de Datos: Validación principalmente en datos temporales sintéticos, carencia de puntos de referencia del mundo real
  3. Equidad de Comparación: Algunos métodos de línea base pueden no estar completamente optimizados

Impacto

  1. Contribución a Disciplina: Proporciona nuevo paradigma de diseño para aprendizaje continuo en SNN
  2. Impulso de Hardware: Promueve desarrollo de funcionalidad multi-escala de tiempo en hardware neuromórfico
  3. Reproducibilidad: Proporciona código completo y detalles de implementación detallados

Escenarios Aplicables

  1. Dispositivos de IA de Borde: Sistemas inteligentes de bajo consumo que requieren adaptación continua
  2. Robótica: Aprendizaje y adaptación en tiempo real en entornos dinámicos
  3. Redes de Sensores: Procesamiento de señales bajo tasas de muestreo variables
  4. Computación Neuromórfica: Aplicaciones que aprovechan características de hardware especializado

Referencias

1 Bellec et al. "Long short-term memory and learning-to-learn in networks of spiking neurons." NeurIPS 2018. 2 Cannon & Miller. "Stable control of firing rate mean and variance by dual homeostatic mechanisms." J Math Neurosci 2017. 3 Davies et al. "Loihi: A neuromorphic manycore processor with on-chip learning." IEEE Micro 2018. 7 Xiao et al. "Hebbian learning based orthogonal projection for continual learning of snns." ICLR 2024.