Scaling Equilibrium Propagation to Deeper Neural Network Architectures
Elayedam, Srinivasan
Equilibrium propagation has been proposed as a biologically plausible alternative to the backpropagation algorithm. The local nature of gradient computations, combined with the use of convergent RNNs to reach equilibrium states, make this approach well-suited for implementation on neuromorphic hardware. However, previous studies on equilibrium propagation have been restricted to networks containing only dense layers or relatively small architectures with a few convolutional layers followed by a final dense layer. These networks have a significant gap in accuracy compared to similarly sized feedforward networks trained with backpropagation. In this work, we introduce the Hopfield-Resnet architecture, which incorporates residual (or skip) connections in Hopfield networks with clipped $\mathrm{ReLU}$ as the activation function. The proposed architectural enhancements enable the training of networks with nearly twice the number of layers reported in prior works. For example, Hopfield-Resnet13 achieves 93.92\% accuracy on CIFAR-10, which is $\approx$3.5\% higher than the previous best result and comparable to that provided by Resnet13 trained using backpropagation.
평형 전파(Equilibrium Propagation)는 역전파 알고리즘의 생물학적으로 타당한 대안으로 제안되었습니다. 수렴하는 RNN을 사용하여 평형 상태에 도달하는 것과 결합된 그래디언트 계산의 국소적 특성으로 인해, 이 방법은 신경형태 하드웨어에서의 구현에 매우 적합합니다. 그러나 평형 전파에 관한 이전 연구는 밀집층을 포함하거나 상대적으로 작은 아키텍처를 가진 네트워크에만 국한되었으며, 이는 역전파로 훈련된 유사 규모의 피드포워드 네트워크와 비교하여 상당한 정확도 격차를 보입니다. 본 연구는 Hopfield-Resnet 아키텍처를 도입하여 Hopfield 네트워크에 잔차 연결을 통합하고 클리핑된 ReLU를 활성화 함수로 사용합니다. 제안된 아키텍처 개선으로 인해 네트워크는 이전 연구에서 보고된 층 수의 거의 2배를 훈련할 수 있습니다. 예를 들어, Hopfield-Resnet13은 CIFAR-10에서 93.92%의 정확도를 달성하여 이전의 최고 결과보다 약 3.5% 높으며, 역전파로 훈련된 Resnet13의 성능과 동등합니다.
Scellier, B. & Bengio, Y. (2017). Equilibrium propagation: Bridging the gap between energy-based models and backpropagation. Frontiers in Computational Neuroscience.
Laborieux, A. et al. (2021). Scaling equilibrium propagation to deep convnets by drastically reducing its gradient estimator bias. Frontiers in Neuroscience.
Laborieux, A. & Zenke, F. (2022). Holomorphic equilibrium propagation computes exact gradients through finite size oscillations. NeurIPS.
He, K. et al. (2016). Deep residual learning for image recognition. CVPR.
본 논문은 평형 전파 깊은 네트워크 확장 분야에서 중요한 돌파를 이루었으며, 영리한 아키텍처 설계를 통해 EP 방법의 실용성을 현저히 향상시켰고, 신경형태 컴퓨팅과 생물 영감 학습 알고리즘의 발전에 가치 있는 기여를 했습니다.