Unraveling the Black Box of Neural Networks: A Dynamic Extremum Mapper
Chen
We point out that neural networks are not black boxes, and their generalization stems from the ability to dynamically map a dataset to the extrema of the model function. We further prove that the number of extrema in a neural network is positively correlated with the number of its parameters. We then propose a new algorithm that is significantly different from back-propagation algorithm, which mainly obtains the values of parameters by solving a system of linear equations. Some difficult situations, such as gradient vanishing and overfitting, can be simply explained and dealt with in this framework.
본 논문은 신경망이 블랙박스가 아니며, 그 일반화 능력이 데이터셋을 모델 함수의 극값점으로 동적으로 매핑하는 능력에서 비롯된다고 주장합니다. 저자는 신경망의 극값점 개수가 매개변수 개수와 양의 상관관계를 가지며, 역전파 알고리즘과 현저히 다른 새로운 알고리즘을 제안합니다. 이 알고리즘은 주로 선형 방정식계를 풀어 매개변수 값을 획득합니다. 이러한 프레임워크 하에서 기울기 소실, 과적합 등의 어려운 상황을 간단히 설명하고 처리할 수 있습니다.
저자는 먼저 이상적 모델의 특징을 정의합니다: 데이터셋 D = {(x^(i), y^(i))|i ∈ 1, 3}에 대해, 목표는 y^(i) = F(x^(i))를 만족하는 함수 F를 찾는 것입니다. 동일 유형의 샘플이 존재할 때, 함수 곡선은 새로운 샘플을 수용하기 위해 형태를 변경해야 하므로 여러 국소 극값점이 형성됩니다.
본 논문은 수학적 관점에서 신경망의 작동 원리를 규명하고, 극값 매핑을 기반으로 한 EI 알고리즘 프레임워크를 제안합니다. 실제 응용 측면에서 추가 완성이 필요하지만(특히 극화 알고리즘), 신경망의 이론적 이해와 해석 가능성 연구에 중요한 기여를 제공합니다. 본 연구는 신경망의 블랙박스 특성과 수학적 해석 가능성을 연결하는 중요한 다리가 될 것으로 기대됩니다.