Scaling Equilibrium Propagation to Deeper Neural Network Architectures
Elayedam, Srinivasan
Equilibrium propagation has been proposed as a biologically plausible alternative to the backpropagation algorithm. The local nature of gradient computations, combined with the use of convergent RNNs to reach equilibrium states, make this approach well-suited for implementation on neuromorphic hardware. However, previous studies on equilibrium propagation have been restricted to networks containing only dense layers or relatively small architectures with a few convolutional layers followed by a final dense layer. These networks have a significant gap in accuracy compared to similarly sized feedforward networks trained with backpropagation. In this work, we introduce the Hopfield-Resnet architecture, which incorporates residual (or skip) connections in Hopfield networks with clipped $\mathrm{ReLU}$ as the activation function. The proposed architectural enhancements enable the training of networks with nearly twice the number of layers reported in prior works. For example, Hopfield-Resnet13 achieves 93.92\% accuracy on CIFAR-10, which is $\approx$3.5\% higher than the previous best result and comparable to that provided by Resnet13 trained using backpropagation.
academic
توسيع نشر التوازن إلى معماريات الشبكات العصبية الأعمق
تم اقتراح نشر التوازن (Equilibrium Propagation) كبديل معقول بيولوجياً لخوارزمية الانتشار العكسي. تجعل الطبيعة المحلية لحساب التدرجات، مقترنة باستخدام شبكات RNN المتقاربة للوصول إلى حالة التوازن، هذه الطريقة مناسبة جداً للتنفيذ على الأجهزة العصبية الشكلية. ومع ذلك، اقتصرت الأبحاث السابقة حول نشر التوازن على الشبكات التي تحتوي على طبقات كثيفة أو معماريات صغيرة نسبياً، والتي تظهر فجوات دقة كبيرة مقارنة بشبكات التغذية الأمامية ذات الحجم المماثل المدربة باستخدام الانتشار العكسي. يقدم هذا العمل معمارية Hopfield-Resnet، التي تدمج الاتصالات المتبقية في شبكات Hopfield، وتستخدم ReLU المقطوع كدالة تفعيل. تسمح التحسينات المعمارية المقترحة للشبكة بتدريب عدد من الطبقات يقترب من الضعف مما أبلغت عنه الأعمال السابقة. على سبيل المثال، يحقق Hopfield-Resnet13 دقة 93.92% على CIFAR-10، أعلى بحوالي 3.5% من أفضل النتائج السابقة، وقابل للمقارنة مع أداء Resnet13 المدرب باستخدام الانتشار العكسي.
يدرس هذا العمل كيفية استخدام طريقة نشر التوازن لتدريب الشبكات العصبية الالتفافية العميقة لمهام تصنيف الصور. المدخل هو صورة x، والمخرج هو تسمية الفئة y، مع القيد المتمثل في الحفاظ على المعقولية البيولوجية لطريقة EP وخصائص حساب التدرجات المحلية.
Scellier, B. & Bengio, Y. (2017). Equilibrium propagation: Bridging the gap between energy-based models and backpropagation. Frontiers in Computational Neuroscience.
Laborieux, A. et al. (2021). Scaling equilibrium propagation to deep convnets by drastically reducing its gradient estimator bias. Frontiers in Neuroscience.
Laborieux, A. & Zenke, F. (2022). Holomorphic equilibrium propagation computes exact gradients through finite size oscillations. NeurIPS.
He, K. et al. (2016). Deep residual learning for image recognition. CVPR.
حققت هذه الورقة اختراقاً مهماً في توسيع شبكات نشر التوازن العميقة، وحسّنت بشكل كبير من جدوى طريقة EP من خلال تصميم معماري ذكي، وقدمت مساهمة قيمة لتطور الحوسبة العصبية الشكلية وخوارزميات التعلم المستوحاة من البيولوجيا.