On the impact of the parametrization of deep convolutional neural networks on post-training quantization
Houache, Aujol, Traonmilin
This paper introduces novel theoretical approximation bounds for the output of quantized neural networks, with a focus on convolutional neural networks (CNN). By considering layerwise parametrization and focusing on the quantization of weights, we provide bounds that gain several orders of magnitude compared to state-of-the-art results on classical deep convolutional neural networks such as MobileNetV2 or ResNets. These gains are achieved by improving the behaviour of the approximation bounds with respect to the depth parameter, which has the most impact on the approximation error induced by quantization. To complement our theoretical result, we provide a numerical exploration of our bounds on MobileNetV2 and ResNets.
본 논문은 양자화된 신경망의 출력에 대한 새로운 이론적 근사 경계를 제시하며, 특히 합성곱 신경망(CNN)에 초점을 맞춘다. 계층별 매개변수화를 고려하고 가중치 양자화에 집중함으로써, 저자들은 MobileNetV2 또는 ResNets와 같은 고전적인 심층 합성곱 신경망에서 기존의 최첨단 결과보다 수 개 수준의 크기만큼 개선된 경계를 제공한다. 이러한 개선은 양자화로 인한 근사 오차에 가장 큰 영향을 미치는 깊이 매개변수에 대한 근사 경계의 동작을 개선함으로써 달성된다. 이론적 결과를 보완하기 위해 저자들은 MobileNetV2 및 ResNets에 대한 수치 탐색을 제공한다.
Gonon, A., et al. (2023). Approximation speed of quantized vs. unquantized relu neural networks and beyond. IEEE Transactions on Information Theory.
Nagel, M., et al. (2020). Up or down? adaptive rounding for post-training quantization. ICML.
Sandler, M., et al. (2018). Mobilenetv2: Inverted residuals and linear bottlenecks. CVPR.
He, K., et al. (2016). Deep residual learning for image recognition. CVPR.
요약: 본 논문은 신경망 양자화의 이론적 분석 측면에서 중요한 진전을 이루었으며, 더 정교한 계층별 분석 및 기하 평균 전략을 통해 기존의 근사 경계를 현저히 개선했다. 경계가 여전히 상대적으로 보수적이지만, 수 개 수준의 크기 개선과 완화된 제약 조건은 이를 중요한 이론적 가치와 실용적 의미를 갖게 한다.