2025-11-17T11:07:14.013317

On the impact of the parametrization of deep convolutional neural networks on post-training quantization

Houache, Aujol, Traonmilin

This paper introduces novel theoretical approximation bounds for the output of quantized neural networks, with a focus on convolutional neural networks (CNN). By considering layerwise parametrization and focusing on the quantization of weights, we provide bounds that gain several orders of magnitude compared to state-of-the-art results on classical deep convolutional neural networks such as MobileNetV2 or ResNets. These gains are achieved by improving the behaviour of the approximation bounds with respect to the depth parameter, which has the most impact on the approximation error induced by quantization. To complement our theoretical result, we provide a numerical exploration of our bounds on MobileNetV2 and ResNets.

academic

심층 합성곱 신경망의 매개변수화가 학습 후 양자화에 미치는 영향

기본 정보

논문 ID: 2502.01156
제목: On the impact of the parametrization of deep convolutional neural networks on post-training quantization
저자: Samy Houache (Univ. Bordeaux, Thales AVS), Jean-François Aujol (Univ. Bordeaux), Yann Traonmilin (Univ. Bordeaux)
분류: cs.IT (정보 이론), math.IT (수학 정보 이론)
발표 시간: 2025년 2월 (arXiv 사전인쇄본)
논문 링크: https://arxiv.org/abs/2502.01156

초록

본 논문은 양자화된 신경망의 출력에 대한 새로운 이론적 근사 경계를 제시하며, 특히 합성곱 신경망(CNN)에 초점을 맞춘다. 계층별 매개변수화를 고려하고 가중치 양자화에 집중함으로써, 저자들은 MobileNetV2 또는 ResNets와 같은 고전적인 심층 합성곱 신경망에서 기존의 최첨단 결과보다 수 개 수준의 크기만큼 개선된 경계를 제공한다. 이러한 개선은 양자화로 인한 근사 오차에 가장 큰 영향을 미치는 깊이 매개변수에 대한 근사 경계의 동작을 개선함으로써 달성된다. 이론적 결과를 보완하기 위해 저자들은 MobileNetV2 및 ResNets에 대한 수치 탐색을 제공한다.

연구 배경 및 동기

문제 정의

핵심 문제: 자원이 제한된 환경에서 심층 신경망을 배포할 때, 양자화 기술은 성능 저하를 초래하므로 이러한 저하 정도를 정량화하기 위한 이론적 경계를 수립해야 한다.
중요성:
- 모바일 장치 및 임베디드 시스템에서의 신경망 배포 수요 증가
- 안전 관련 애플리케이션에서 견고한 이론적 보장 필요
- 양자화는 모델 크기 및 계산 비용 감소의 핵심 기술
기존 방법의 한계:
- Gonon 등(2023)의 경계는 지나치게 비관적이어서 실제 응용 가치가 제한적
- 최대 매개변수 범수 r > 1의 엄격한 가정이 적용 가능성을 제한
- 상수 C는 O(NL²)의 의존성을 나타내어 현대적 심층 아키텍처에 비실용적
연구 동기:
- 기존 경계는 심층 네트워크에 대해 지나치게 보수적
- 실제 양자화 전략을 지도하기 위한 더 타이트한 이론적 경계 필요
- 가중치 정규화로 인해 r < 1인 경우가 일반적이므로 제약 조건 완화 필요

핵심 기여

더 타이트한 근사 경계: Gonon 등의 NL² 인수를 ∑ᴸₗ₌₁Nₗ₋₁로 개선하며, 일정한 너비 네트워크의 경우 NL로 단순화
범수 제약 완화: 임의의 양수 rₗ(제l층 연산자 범수)을 허용하여 결과를 매개변수 범수가 작은 네트워크에 적용 가능하게 함
개선된 기하 평균 항: 최대 매개변수 범수 r을 rmean으로 대체하여 더 덜 비관적인 추정 제공
합성곱 네트워크 특화: 합성곱 구조에 대한 전문화된 경계 제공, 필터 크기 및 채널 수만 고려
실제 검증: 고전적인 사전 학습된 CNN 모델에서 이론적 개선 검증, 수 개 수준의 크기 향상 입증

방법론 상세 설명

작업 정의

신경망 Rθ 및 그 양자화 버전 Rθ'에 대해 다음 형태의 경계를 찾는다:

sup_{x∈Ω} ||Rθ(x) - Rθ'(x)||∞ ≤ C||θ - θ'||∞

여기서 Ω는 입력 영역이고 C는 네트워크 아키텍처에 의존하는 상수이다.

핵심 이론적 결과

일반 근사 경계(정리 4.1)

아키텍처(L,N)에 대해, 두 네트워크가 동일한 편향을 가지며 가중치만 양자화된다고 가정:

sup_{x∈Ω} ||Rθ(x̃) - Rθ'(x̃)||∞ ≤ max(D,1) ∑ᴸₗ₌₁ Nₗ₋₁ × r^{L-1}_{mean} ||θ - θ'||∞

여기서 기하 평균 항은 다음과 같이 정의된다:

r_mean := ^{L-1}√(max_{l=1,...,L} max_{i=1,...,l-1} ∏_{j=i,j≠l}^L r_j)

합성곱 네트워크 전용 경계(정리 4.4)

순수 합성곱 네트워크(편향 없음)의 경우, 각 계층에서 pₗ×pₗ 크기의 cₗ개 필터 적용:

sup_{x∈Ω} ||Rθ(x) - Rθ'(x)||∞ ≤ D × ∑ᴸₗ₌₁ p²ₗcₗ₋₁ × r^{L-1}_{conv} ||θ - θ'||∞

여기서:

r_conv := ^{L-1}√(max_{l=1,...,L} ∏_{k=1,k≠l}^L r^{conv}_k)

기술적 혁신 사항

계층별 매개변수화 방법: 계층별 분석을 통해 매개변수 범수를 분석하여 전역 최댓값 사용 회피
희소 구조 활용: 합성곱 행렬의 희소성을 효과적으로 활용하여 완전한 Nₗ₋₁을 p²ₗcₗ₋₁로 대체
기하 평균 전략: rmean은 계층 간 매개변수 범수의 변동성을 고려하여 단순 최댓값보다 더 정확함

실험 설정

데이터셋

Tiny ImageNet: 110,000개의 64×64 이미지, 200개 클래스 포함
MNIST: 손글씨 숫자 인식, MLP 실험용
CIFAR-10: 32×32 컬러 이미지, 10개 클래스

모델 아키텍처

ResNet18/50: BatchNorm 제거된 잔차 네트워크
MobileNetV2: BatchNorm 제거된 경량 네트워크
다층 퍼셉트론: 깊이 영향 분석을 위한 다양한 깊이(5,7,9,11층)

양자화 방법

균일 양자화: Q_unif(θ) = ⌊θ/η⌋η
반올림 양자화: Q_round(θ) = round(θ/η)η
AdaRound: 적응형 반올림, 반올림 오프셋 최적화

평가 지표

이론적 경계의 타이트함 비교
양자화 후 모델 정확도
다양한 비트 너비에서의 성능

실험 결과

주요 결과

경계 개선 효과

ResNet18: 새로운 경계가 Gonon 등의 결과보다 10⁸배 타이트함
MobileNetV2: 개선이 10⁵⁶배 달성
ResNet50: 개선이 10²⁷배 달성

매개변수 분석 비교

모델	깊이L	이전 경계 너비	이전 경계 범수r	새 경계 너비	새 경계 범수r_conv	개선 비율
MobileNetV2	53	1.2×10⁶	≈101	8641	≈9	≈10⁵⁶
ResNet18	18	8×10⁵	≈84	4609	≈44	≈10⁸
ResNet50	50	8×10⁵	≈108	4609	≈37	≈10²⁷

깊이 영향 분석

MLP 실험을 통해 경계 개선이 깊이에 따라 지수적으로 증가함을 검증:

깊이 5: 약 10³배 개선
깊이 11: 약 10⁸배 개선

양자화 성능 분석

Tiny ImageNet에서의 다양한 양자화 방법 성능:

AdaRound는 극단적 양자화(≤4비트)에서 최고 성능
MobileNetV2는 ResNets보다 양자화에 대한 허용도 우수
깊이는 양자화 오차에 상당한 영향을 미치며, 이론적 예측 검증

가중치 분포 영향

실험은 가중치 범수 분포의 중요성을 보여줌:

MobileNetV2: r≈101 vs r_conv≈9 (11배 개선)
ResNet50: r≈108 vs r_conv≈37 (3배 개선)
가중치 분포의 변동성이 클수록 r_conv의 r에 대한 상대적 이점이 더 명확함

결론 및 논의

주요 결론

현저한 이론적 개선: 새로운 경계는 실제 네트워크에서 기존 결과보다 수 개 수준의 크기만큼 타이트함
깊이 의존성 최적화: L² 의존성에서 더 온화한 증가로 개선
실용성 향상: 매개변수 제약 완화로 정규화된 네트워크에 적용 가능
아키텍처 인식: 합성곱 구조의 희소성이 효과적으로 활용됨

한계

여전히 보수적: 경계와 실제 관찰 오차 사이에 여전히 수 개 수준의 크기 차이 존재
최악의 경우 분석: 이론적 경계는 극단적 경우에 기반하며, 실제 응용에서는 거의 발생하지 않음
아키텍처 제한: 주로 CNN에 초점이며, Transformer 등 현대 아키텍처로의 확장 미흡
BatchNorm 처리: 실험에서 이론적 조건을 만족하기 위해 BatchNorm 제거

향후 방향

Transformer 확장: 계층 정규화 및 다중 헤드 주의 메커니즘 처리
확률적 방법: 전형적인 작동 조건을 반영하는 확률적 경계 개발
타이트한 경계: 이론적 경계와 실제 오차 간의 간격 추가 축소
실용적 도구: 이론적 결과를 양자화 전략 지도 도구로 변환

심층 평가

장점

이론적 기여 두드러짐: 양자화 이론적 경계 측면에서 현저한 진전 달성, 수 개 수준의 크기 개선이 중요한 의미 가짐
수학적 엄밀성: 증명 과정이 완전하고 수학적 유도가 엄밀하고 신뢰할 수 있음
실용적 가치: 기존 방법의 엄격한 가정을 완화하여 적용 가능성 향상
충분한 실험 검증: 다양한 고전적 아키텍처에서 이론적 개선 검증
명확한 작성: 논문 구조가 합리적이고 기술 세부사항 표현이 정확함

부족한 점

경계 여전히 느슨함: 현저한 개선에도 불구하고 이론적 경계와 실제 오차 간에 여전히 큰 차이 존재
아키텍처 제한성: 주로 CNN에 초점이며 현대적 Transformer 아키텍처로의 확장성 제한적
가정 조건: BatchNorm 제거 등 구성 요소가 실제 응용 가치에 영향을 미칠 수 있음
확률적 분석 부재: 전형적 경우의 성능에 대한 확률적 분석 부족

영향력

이론적 가치: 양자화 이론에 새로운 분석 프레임워크 및 도구 제공
실용적 지도: 양자화 전략 설계를 지도할 수 있으며, 특히 Cross-Layer Equalization 등 기술에 활용 가능
연구 영감: 후속 연구에 개선 방향 및 기초 제공
재현 가능성: 실험 설정이 명확하고 결과 재현 가능

적용 가능 시나리오

안전 관련 애플리케이션: 이론적 보장이 필요한 양자화 배포
임베디드 시스템: 자원이 제한된 환경에서의 모델 압축
양자화 전략 설계: 계층별 양자화 및 전처리 기술 지도
이론적 연구: 추가적인 양자화 이론 연구의 기초 제공

참고문헌

Gonon, A., et al. (2023). Approximation speed of quantized vs. unquantized relu neural networks and beyond. IEEE Transactions on Information Theory.
Nagel, M., et al. (2020). Up or down? adaptive rounding for post-training quantization. ICML.
Sandler, M., et al. (2018). Mobilenetv2: Inverted residuals and linear bottlenecks. CVPR.
He, K., et al. (2016). Deep residual learning for image recognition. CVPR.

요약: 본 논문은 신경망 양자화의 이론적 분석 측면에서 중요한 진전을 이루었으며, 더 정교한 계층별 분석 및 기하 평균 전략을 통해 기존의 근사 경계를 현저히 개선했다. 경계가 여전히 상대적으로 보수적이지만, 수 개 수준의 크기 개선과 완화된 제약 조건은 이를 중요한 이론적 가치와 실용적 의미를 갖게 한다.