2025-11-14T20:28:11.411800

Local Timescale Gates for Timescale-Robust Continual Spiking Neural Networks

Tiwari, Chauhan

Spiking neural networks (SNNs) promise energy-efficient artificial intelligence on neuromorphic hardware but struggle with tasks requiring both fast adaptation and long-term memory, especially in continual learning. We propose Local Timescale Gating (LT-Gate), a neuron model that combines dual time-constant dynamics with an adaptive gating mechanism. Each spiking neuron tracks information on a fast and a slow timescale in parallel, and a learned gate locally adjusts their influence. This design enables individual neurons to preserve slow contextual information while responding to fast signals, addressing the stability-plasticity dilemma. We further introduce a variance-tracking regularization that stabilizes firing activity, inspired by biological homeostasis. Empirically, LT-Gate yields significantly improved accuracy and retention in sequential learning tasks: on a challenging temporal classification benchmark it achieves about 51 percent final accuracy, compared to about 46 percent for a recent Hebbian continual-learning baseline and lower for prior SNN methods. Unlike approaches that require external replay or expensive orthogonalizations, LT-Gate operates with local updates and is fully compatible with neuromorphic hardware. In particular, it leverages features of Intel's Loihi chip (multiple synaptic traces with different decay rates) for on-chip learning. Our results demonstrate that multi-timescale gating can substantially enhance continual learning in SNNs, narrowing the gap between spiking and conventional deep networks on lifelong-learning tasks.

academic

স্থানীয় সময়মাপক দরজা সহ সময়মাপক-শক্তিশালী ক্রমাগত স্পাইকিং নিউরাল নেটওয়ার্ক

মৌলিক তথ্য

পেপার আইডি: 2510.12843
শিরোনাম: স্থানীয় সময়মাপক দরজা সহ সময়মাপক-শক্তিশালী ক্রমাগত স্পাইকিং নিউরাল নেটওয়ার্ক
লেখক: অনশ তিওয়ারি, আয়ুষ চৌহান
শ্রেণীবিভাগ: cs.LG (মেশিন লার্নিং)
প্রকাশনার সময়: ২০২৫ সালের ১৩ অক্টোবর (প্রাক-প্রিন্ট)
পেপার লিঙ্ক: https://arxiv.org/abs/2510.12843

সারসংক্ষেপ

স্পাইকিং নিউরাল নেটওয়ার্ক (SNNs) নিউরোমর্ফিক হার্ডওয়্যারে শক্তি দক্ষতার সুবিধা প্রদান করে, কিন্তু দ্রুত অভিযোজন এবং দীর্ঘমেয়াদী স্মৃতি প্রয়োজনীয় কাজে দুর্বল পারফরম্যান্স প্রদর্শন করে, বিশেষত ক্রমাগত শেখার পরিস্থিতিতে। এই পেপারটি স্থানীয় সময়মাপক দরজা (LT-Gate) প্রস্তাব করে, যা দ্বৈত সময় ধ্রুবক গতিশীলতা এবং অভিযোজনযোগ্য দরজা প্রক্রিয়া সমন্বিত একটি নিউরন মডেল। প্রতিটি স্পাইকিং নিউরন সমান্তরালে দ্রুত এবং ধীর সময়মাপক তথ্য ট্র্যাক করে, শেখা দরজার মাধ্যমে স্থানীয়ভাবে তাদের প্রভাব নিয়ন্ত্রণ করে। এই ডিজাইন একক নিউরনকে ধীর প্রসঙ্গ তথ্য বজায় রেখে দ্রুত সংকেতে সাড়া দিতে সক্ষম করে, স্থিতিশীলতা-প্লাস্টিসিটি দ্বিধা সমাধান করে। গবেষণা জৈব হোমিওস্ট্যাসিস দ্বারা অনুপ্রাণিত ভেরিয়েন্স ট্র্যাকিং নিয়মিতকরণও প্রবর্তন করে যা স্রাব কার্যকলাপ স্থিতিশীল করে। পরীক্ষা-নিরীক্ষা দেখায় যে LT-Gate সময়ক্রমিক শ্রেণীবিভাগ বেঞ্চমার্কে প্রায় ৫১% চূড়ান্ত নির্ভুলতা অর্জন করে, সাম্প্রতিক হেবিয়ান ক্রমাগত শেখার ভিত্তিরেখা (HLOP) এর ৪৬% এর তুলনায় উল্লেখযোগ্য উন্নতি।

গবেষণা পটভূমি এবং প্রেরণা

মূল সমস্যা

১. ক্রমাগত শেখায় বিপর্যয়কর বিস্মৃতি: SNNs ঐতিহ্যবাহী নিউরাল নেটওয়ার্কের মতো, নতুন কাজ শিখতে গিয়ে আগে শেখা জ্ঞান ভুলে যায় २. স্থিতিশীলতা-প্লাস্টিসিটি দ্বিধা: শেখা জ্ঞানের স্থিতিশীলতা এবং নতুন জ্ঞান শেখার প্লাস্টিসিটির মধ্যে ভারসাম্য বজায় রাখা প্রয়োজন ३. সময়মাপক অভিযোজনযোগ্যতা: বিদ্যমান পদ্ধতি বিভিন্ন সময়মাপক প্রতিক্রিয়া প্রয়োজনীয় কাজ পরিচালনা করতে অসুবিধা পায়

গুরুত্ব

নিউরোমর্ফিক কম্পিউটিং তার ইভেন্ট-চালিত শক্তি দক্ষতার সুবিধার জন্য ব্যাপক মনোযোগ আকর্ষণ করছে
ক্রমাগত শেখা আজীবন শেখার AI সিস্টেম বাস্তবায়নের জন্য মূল প্রযুক্তি
জৈব স্নায়ুতন্ত্র বিভিন্ন অভিযোজন প্রক্রিয়া এবং ভিন্ন অন্তর্নিহিত সময়মাপকের মাধ্যমে এই সমস্যা সমাধান করে

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

१. ওজন নিয়মিতকরণ এবং অভিজ্ঞতা পুনরাবৃত্তি: অতিরিক্ত সংরক্ষণ এবং গণনা ওভারহেড প্রয়োজন २. HLOP পদ্ধতি: পুনরাবৃত্তিমূলক সাবস্পেস গণনা প্রয়োজন, উচ্চ গণনামূলক জটিলতা ३. DSD-SNN: জটিল নেটওয়ার্ক সম্প্রসারণ কৌশল প্রয়োজন ४. জৈব যুক্তিসঙ্গততার অভাব: বেশিরভাগ পদ্ধতি নিউরোমর্ফিক হার্ডওয়্যারের স্থানীয় গণনা সীমাবদ্ধতার সাথে সামঞ্জস্যপূর্ণ নয়

মূল অবদান

१. LT-Gate নিউরন মডেল প্রস্তাব: দ্বৈত সময়মাপক গতিশীলতা এবং স্থানীয় দরজা প্রক্রিয়া সমন্বয় করে, নমনীয় সময় ক্রেডিট বরাদ্দ বাস্তবায়ন করে २. ভেরিয়েন্স নিয়মিতকরণ প্রক্রিয়া ডিজাইন: জৈব হোমিওস্ট্যাসিস তত্ত্বের উপর ভিত্তি করে, নিউরন সক্রিয়করণ স্বাস্থ্যকর পরিসরে বজায় রাখে, কাজ স্যুইচিং সময় অস্থিরতা প্রতিরোধ করে ३. উল্লেখযোগ্য কর্মক্ষমতা উন্নতি বাস্তবায়ন: সময়ক্রমিক বিষমজাত কাজে ক্রমাগত শেখার কর্মক্ষমতা ব্যাপকভাবে উন্নত করে, বাহ্যিক স্মৃতি বা স্থাপত্য বৃদ্ধি ছাড়াই ४. নিউরোমর্ফিক হার্ডওয়্যার সামঞ্জস্য: Intel Loihi 2 চিপে দক্ষতার সাথে ম্যাপ করা, চিপ-অন-লার্নিং এর স্থানীয় ফিল্টারিং এবং দরজা অপারেশন সমর্থন করে

পদ্ধতির বিস্তারিত বিবরণ

কাজের সংজ্ঞা

গবেষণা সময়ক্রমিক ডোমেন বর্ধমান শেখায় ফোকাস করে: নেটওয়ার্ককে বিভিন্ন সময়মাপকের ইনপুট ডোমেনের মধ্যে ক্রমাগত শিখতে হবে, যেমন উচ্চ ফ্রিকোয়েন্সি (১০০০Hz) ইনপুট ডোমেন থেকে নিম্ন ফ্রিকোয়েন্সি (৫০Hz) ইনপুট ডোমেনে স্যুইচ করা, একই সাথে পূর্ববর্তী ডোমেনের শ্রেণীবিভাগ ক্ষমতা বজায় রাখা।

মডেল স্থাপত্য

দ্বৈত সময়মাপক নিউরন মডেল

LT-Gate নিউরন দুটি সমান্তরাল লিক ইন্টিগ্রেট-এন্ড-ফায়ার (LIF) ইউনিট অন্তর্ভুক্ত করে:

দ্রুত ঝিল্লি সম্ভাবনা গতিশীলতা:

U^f_i(t+1) = ρ_f · U^f_i(t) + I_i(t)

ধীর ঝিল্লি সম্ভাবনা গতিশীলতা:

U^s_i(t+1) = ρ_s · U^s_i(t) + I_i(t)

যেখানে 0 < ρ_f < ρ_s < 1 ক্ষয় ফ্যাক্টর, ρ = e^(-dt/τ)

স্থানীয় সময়মাপক দরজা

দুটি ঝিল্লি সম্ভাবনা শেখা দরজা ভেরিয়েবল γ_i ∈ 0,1 এর মাধ্যমে সমন্বিত:

U_i(t) = γ_i · U^s_i(t) + (1-γ_i) · U^f_i(t)

γ_i ≈ 1: নিউরন দীর্ঘ সময়মাপক ইউনিট হিসাবে কাজ করে, অতীত ইনপুট বজায় রাখে
γ_i ≈ 0: দ্রুত প্রতিক্রিয়া অগ্রাধিকার দেয়

ভেরিয়েন্স ট্র্যাকিং হোমিওস্ট্যাসিস নিয়মিতকরণ

প্রতিটি নিউরনকে লক্ষ্য স্রাব হার এবং ভেরিয়েন্স বজায় রাখতে উৎসাহিত করার জন্য নিয়মিতকরণ শব্দ প্রবর্তন করা হয়:

L_var = λ_var Σ_i [(μ_i - μ*)² + (σ_i - σ*)²]

যেখানে (μ*, σ*) লক্ষ্য মান, λ_var ওজন সহগ।

প্রযুক্তিগত উদ্ভাবনী পয়েন্ট

१. বিতরণকৃত দরজা প্রক্রিয়া: LSTM এর স্পষ্ট দরজা ইউনিটের বিপরীতে, LT-Gate এর দরজা প্রক্রিয়া প্রতিটি স্পাইকিং নিউরন অবস্থায় স্থানীয়করিত २. দ্বৈত হোমিওস্ট্যাসিস প্রক্রিয়া: দ্রুত গতিশীলতা ইনপুট পরিবর্তনে সাড়া দেয়, ধীর গতিশীলতা এবং দরজা নেতিবাচক প্রতিক্রিয়া প্রদান করে, সামগ্রিক স্রাব হার পরিসংখ্যান বজায় রাখে ३. হার্ডওয়্যার-সচেতন ডিজাইন: সমস্ত গণনা (ক্ষয়, সংগ্রহ, থ্রেশহোল্ড, দরজা) প্রতিটি নিউরন বা সিন্যাপ্সে স্থানীয়, বৈশ্বিক সমন্বয়ের প্রয়োজন নেই ४. অভিযোজনযোগ্য সময় ধ্রুবক বরাদ্দ: γ শিখে, নেটওয়ার্ক নিউরনের মধ্যে কার্যকর সময়মাপক বর্ণালী বিতরণ করতে পারে

পরীক্ষা-নিরীক্ষা সেটআপ

ডেটাসেট

ফ্রিকোয়েন্সি-ভেরিয়েন্ট MNIST ডেটাসেট: মান MNIST চিত্রগুলি বিভিন্ন ফ্রেম রেটের স্পাইক সিকোয়েন্সে এনকোড করা হয়
- দ্রুত ডোমেন: ১০০০Hz ইনপুট উপস্থাপনা হার
- ধীর ডোমেন: ৫০Hz ইনপুট উপস্থাপনা হার

মূল্যায়ন মেট্রিক্স

চূড়ান্ত নির্ভুলতা: সমন্বিত পরীক্ষা সেটে শ্রেণীবিভাগ নির্ভুলতা
বিস্মৃতি হার: নতুন কাজ শেখার পরে পুরানো কাজে নির্ভুলতা হ্রাস
সংগ্রহ গতি: ৯০% চূড়ান্ত নির্ভুলতায় পৌঁছাতে প্রয়োজনীয় প্রশিক্ষণ যুগ

তুলনামূলক পদ্ধতি

HLOP: হেবিয়ান শেখার অর্থোগোনাল প্রজেকশন পদ্ধতি
DSD-SNN: গতিশীল কাঠামো উন্নয়ন স্পাইকিং নিউরাল নেটওয়ার্ক
মান SNN: একক সময়মাপক LIF ভিত্তিরেখা

বাস্তবায়ন বিবরণ

নেটওয়ার্ক স্থাপত্য: ৩-স্তরীয় কনভোলিউশনাল SNN (32→64→128 ইউনিট)
অপ্টিমাইজার: Adam, শেখার হার ০.০০१
সময় ধ্রুবক: τ_f = 5ms, τ_s = 50ms
লক্ষ্য স্রাব হার: 2%, ভেরিয়েন্স নিয়মিতকরণ ওজন λ_var = 0.01

পরীক্ষা-নিরীক্ষা ফলাফল

প্রধান ফলাফল

পদ্ধতি	চূড়ান্ত নির্ভুলতা(%)	কাজ A বিস্মৃতি হার(%)	কাজ B নির্ভুলতা(%)	সংগ্রহ গতি(যুগ)
মান SNN	38.2	12.5	41.8	45
HLOP	45.2	5.8	47.1	40
DSD-SNN	42.8	7.1	44.5	35
LT-Gate	51.0	3.2	52.8	25

মূল আবিষ্কার

१. উল্লেখযোগ্য কর্মক্ষমতা উন্নতি: LT-Gate ৫१.০% চূড়ান্ত নির্ভুলতা অর্জন করে, HLOP এর চেয়ে ৫.८ শতাংশ পয়েন্ট বেশি २. ন্যূনতম বিস্মৃতি: মাত্র ३.२% বিস্মৃতি হার, মূল কর্মক্ষমতার প্রায় ९५% বজায় রাখে ३. দ্রুত সংগ্রহ: २५ যুগে সংগ্রহ, ভিত্তিরেখা পদ্ধতির চেয়ে ४०-६०% দ্রুত

বিলোপন পরীক্ষা-নিরীক্ষা

দরজা ছাড়া LT-Gate: নির্ভুলতা ४६.५% এ হ্রাস পায়, বিস্মৃতি হার ८.९% এ বৃদ্ধি পায়
ভেরিয়েন্স নিয়মিতকরণ ছাড়া: নির্ভুলতা ४९.८%, প্রশিক্ষণ অস্থিরতা মাঝে মধ্যে ঘটে

ক্রস-সময়মাপক সাধারণীকরণ

শুধুমাত্র १००० Hz প্রশিক্ষণের পরে, LT-Gate অপ্রশিক্ষিত ধীর ডোমেনে (१० Hz) ४८% নির্ভুলতা অর্জন করে, মান SNN মাত্র २०%, শক্তিশালী ক্রস-ডোমেন সাধারণীকরণ ক্ষমতা প্রদর্শন করে।

সিদ্ধান্ত এবং আলোচনা

প্রধান সিদ্ধান্ত

१. বহু-সময়মাপক প্রক্রিয়াকরণ স্থিতিশীলতা-প্লাস্টিসিটি দ্বিধা সমাধানের কার্যকর সমাধান २. স্থানীয় দরজা প্রক্রিয়া কেন্দ্রীভূত দরজার চেয়ে উন্নত, নিউরোমর্ফিক হার্ডওয়্যারের জন্য আরও উপযুক্ত ३. জৈব-অনুপ্রাণিত হোমিওস্ট্যাসিস প্রক্রিয়া নেটওয়ার্ক স্থিতিশীলতার জন্য গুরুত্বপূর্ণ ४. হার্ডওয়্যার-সচেতন ডিজাইন দক্ষ চিপ-অন-লার্নিং বাস্তবায়ন করে

সীমাবদ্ধতা

१. প্রক্সি গ্রেডিয়েন্ট ব্যাকপ্রপাগেশনের উপর নির্ভরতা: জৈব যুক্তিসঙ্গততা সীমিত করে २. মূল্যায়ন পরিসীমা সীমিত: শুধুমাত্র দুটি সিকোয়েন্স ডোমেন পরীক্ষা করা হয়েছে, বহু-কাজ পরিস্থিতি আরও যাচাইকরণ প্রয়োজন ३. স্থির সময় ধ্রুবক: প্রতি-নিউরন অভিযোজনযোগ্য সময় ধ্রুবক শেখা বাস্তবায়ন করা হয়নি ४. জটিল কাজ স্কেলেবিলিটি: হালকা ওজনের পুনরাবৃত্তি বা নিয়মিতকরণ সম্পূরক প্রয়োজন হতে পারে

ভবিষ্যত দিকনির্দেশনা

१. স্থানীয় শেখার নিয়ম: STDP-ভিত্তিক দরজা অভিযোজন প্রক্রিয়া উন্নয়ন २. বহু-সময়মাপক সম্প্রসারণ: তিন বা আরও বেশি সময়মাপক ব্যবহার ३. হার্ডওয়্যার সহ-ডিজাইন: নিবেদিত সময় দরজা সার্কিট উন্নয়ন ४. বৃহৎ-স্কেল প্রয়োগ: গভীর দৃষ্টি এবং কণ্ঠস্বর SNN এ সম্প্রসারণ

গভীর মূল্যায়ন

সুবিধা

१. শক্তিশালী উদ্ভাবনী: SNN তে প্রথমবারের মতো বিতরণকৃত বহু-সময়মাপক দরজা বাস্তবায়ন २. পর্যাপ্ত পরীক্ষা-নিরীক্ষা: ব্যাপক বিলোপন পরীক্ষা-নিরীক্ষা এবং হার্ডওয়্যার সামঞ্জস্য যাচাইকরণ ३. ফলাফল প্রভাবশালী: একাধিক মেট্রিক্সে SOTA পদ্ধতির চেয়ে উল্লেখযোগ্যভাবে উন্নত ४. উচ্চ ব্যবহারিক মূল্য: বাণিজ্যিক নিউরোমর্ফিক চিপে সরাসরি ম্যাপ করা

অপূর্ণতা

१. তাত্ত্বিক বিশ্লেষণ অপর্যাপ্ত: দরজা শেখার গতিশীলতার তাত্ত্বিক বিশ্লেষণের অভাব २. ডেটাসেট সীমাবদ্ধতা: প্রধানত সিন্থেটিক সময়ক্রমিক ডেটায় যাচাই করা হয়েছে, বাস্তব-বিশ্ব বেঞ্চমার্ক অভাব ३. তুলনা ন্যায্যতা: কিছু ভিত্তিরেখা পদ্ধতি সম্পূর্ণভাবে অপ্টিমাইজ করা হয়নি

প্রভাব

१. ক্ষেত্র অবদান: SNN ক্রমাগত শেখার জন্য নতুন ডিজাইন প্যারাডাইম প্রদান করে २. হার্ডওয়্যার চালনা: নিউরোমর্ফিক হার্ডওয়্যারের বহু-সময়মাপক কার্যকারিতা উন্নয়ন প্রচার করে ३. পুনরুৎপাদনযোগ্যতা: সম্পূর্ণ কোড এবং বিস্তারিত বাস্তবায়ন বিবরণ প্রদান করে

প্রযোজ্য পরিস্থিতি

१. এজ AI ডিভাইস: ক্রমাগত অভিযোজন প্রয়োজনীয় নিম্ন-শক্তি স্মার্ট সিস্টেম २. রোবোটিক্স: গতিশীল পরিবেশে রিয়েল-টাইম শেখা এবং অভিযোজন ३. সেন্সর নেটওয়ার্ক: পরিবর্তনশীল নমুনা হার অধীনে সংকেত প্রক্রিয়াকরণ ४. নিউরোমর্ফিক কম্পিউটিং: নিবেদিত হার্ডওয়্যার বৈশিষ্ট্য ব্যবহার করে অ্যাপ্লিকেশন

সংদর্ভ

1 Bellec et al. "স্পাইকিং নিউরনের নেটওয়ার্কে দীর্ঘ স্বল্পমেয়াদী স্মৃতি এবং শেখা-থেকে-শেখা।" NeurIPS 2018. 2 Cannon & Miller. "দ্বৈত হোমিওস্ট্যাটিক প্রক্রিয়া দ্বারা স্রাব হার গড় এবং ভেরিয়েন্সের স্থিতিশীল নিয়ন্ত্রণ।" J Math Neurosci 2017. 3 Davies et al. "Loihi: চিপ-অন-লার্নিং সহ একটি নিউরোমর্ফিক মানিকোর প্রসেসর।" IEEE Micro 2018. 7 Xiao et al. "SNNs এর ক্রমাগত শেখার জন্য হেবিয়ান শেখা ভিত্তিক অর্থোগোনাল প্রজেকশন।" ICLR 2024.