Local Timescale Gates for Timescale-Robust Continual Spiking Neural Networks
Tiwari, Chauhan
Spiking neural networks (SNNs) promise energy-efficient artificial intelligence on neuromorphic hardware but struggle with tasks requiring both fast adaptation and long-term memory, especially in continual learning. We propose Local Timescale Gating (LT-Gate), a neuron model that combines dual time-constant dynamics with an adaptive gating mechanism. Each spiking neuron tracks information on a fast and a slow timescale in parallel, and a learned gate locally adjusts their influence. This design enables individual neurons to preserve slow contextual information while responding to fast signals, addressing the stability-plasticity dilemma. We further introduce a variance-tracking regularization that stabilizes firing activity, inspired by biological homeostasis. Empirically, LT-Gate yields significantly improved accuracy and retention in sequential learning tasks: on a challenging temporal classification benchmark it achieves about 51 percent final accuracy, compared to about 46 percent for a recent Hebbian continual-learning baseline and lower for prior SNN methods. Unlike approaches that require external replay or expensive orthogonalizations, LT-Gate operates with local updates and is fully compatible with neuromorphic hardware. In particular, it leverages features of Intel's Loihi chip (multiple synaptic traces with different decay rates) for on-chip learning. Our results demonstrate that multi-timescale gating can substantially enhance continual learning in SNNs, narrowing the gap between spiking and conventional deep networks on lifelong-learning tasks.
academic
Porte di Scala Temporale Locale per Reti Neurali Spike Robuste alla Scala Temporale in Apprendimento Continuo
Le reti neurali spike (SNNs) presentano vantaggi di efficienza energetica su hardware neuromorfo, ma mostrano prestazioni insufficienti in compiti che richiedono adattamento rapido e memoria a lungo termine, in particolare in scenari di apprendimento continuo. Questo articolo propone le Porte di Scala Temporale Locale (LT-Gate), un modello neuronale che combina dinamiche a doppia costante di tempo e meccanismi di gating adattivi. Ogni neurone spike traccia in parallelo informazioni a scala temporale veloce e lenta, modulando localmente la loro influenza attraverso meccanismi di gating appresi. Questo design consente ai singoli neuroni di mantenere informazioni di contesto lento mentre rispondono a segnali veloci, affrontando il dilemma stabilità-plasticità. Lo studio introduce inoltre una regolarizzazione di tracciamento della varianza ispirata all'omeostasi biologica per stabilizzare l'attività di scarica. Gli esperimenti dimostrano che LT-Gate raggiunge circa il 51% di accuratezza finale su benchmark di classificazione temporale, un miglioramento significativo rispetto al recente baseline di apprendimento continuo Hebbiano (HLOP) del 46%.
Dimenticanza Catastrofica nell'Apprendimento Continuo: Le SNNs, come le reti neurali tradizionali, dimenticano le conoscenze precedentemente apprese quando imparano nuovi compiti
Dilemma Stabilità-Plasticità: Necessità di bilanciare la stabilità nel mantenere conoscenze acquisite con la plasticità nell'apprendimento di nuove conoscenze
Adattabilità della Scala Temporale: I metodi esistenti faticano a gestire compiti che richiedono risposte a scale temporali diverse
Propone il Modello Neuronale LT-Gate: Combina dinamiche a doppia scala temporale e meccanismi di gating locale, realizzando un'assegnazione flessibile del credito temporale
Progetta un Meccanismo di Regolarizzazione della Varianza: Basato sulla teoria dell'omeostasi biologica, mantiene l'attivazione neuronale in un intervallo sano, prevenendo instabilità durante i cambi di compito
Realizza Miglioramenti Significativi delle Prestazioni: Migliora notevolmente le prestazioni di apprendimento continuo su compiti eterogenei temporali, senza richiedere memoria esterna o crescita architettonica
Compatibilità con Hardware Neuromorfo: Mappatura efficiente al chip Intel Loihi 2, supportando operazioni di filtraggio e gating locali per l'apprendimento on-chip
La ricerca si concentra su compiti di apprendimento incrementale nel dominio temporale: la rete deve eseguire apprendimento continuo tra domini di input a scale temporali diverse, come il passaggio da domini di input ad alta frequenza (1000Hz) a domini a bassa frequenza (50Hz), mantenendo al contempo la capacità di classificazione nei domini precedenti.
Meccanismo di Gating Distribuito: A differenza delle unità di gating esplicite dell'LSTM, il meccanismo di gating di LT-Gate è localizzato allo stato di ogni neurone spike
Processo Omeostatico Duale: La dinamica veloce risponde ai cambiamenti di input, mentre la dinamica lenta e il gating forniscono retroazione negativa, mantenendo le statistiche del tasso di scarica complessivo
Design Consapevole dell'Hardware: Tutti i calcoli (decadimento, accumulo, soglia, gating) sono locali a ogni neurone o sinapsi, senza necessità di coordinamento globale
Allocazione Adattiva della Costante di Tempo: Attraverso l'apprendimento di γ, la rete può distribuire uno spettro efficace di costanti di tempo tra i neuroni
Dopo l'addestramento solo a 1000Hz, LT-Gate raggiunge il 48% di accuratezza nel dominio lento non addestrato (10Hz), mentre l'SNN standard raggiunge solo il 20%, dimostrando una forte capacità di generalizzazione tra domini.
1 Bellec et al. "Long short-term memory and learning-to-learn in networks of spiking neurons." NeurIPS 2018.
2 Cannon & Miller. "Stable control of firing rate mean and variance by dual homeostatic mechanisms." J Math Neurosci 2017.
3 Davies et al. "Loihi: A neuromorphic manycore processor with on-chip learning." IEEE Micro 2018.
7 Xiao et al. "Hebbian learning based orthogonal projection for continual learning of snns." ICLR 2024.