2025-11-17T11:07:14.013317

On the impact of the parametrization of deep convolutional neural networks on post-training quantization

Houache, Aujol, Traonmilin

This paper introduces novel theoretical approximation bounds for the output of quantized neural networks, with a focus on convolutional neural networks (CNN). By considering layerwise parametrization and focusing on the quantization of weights, we provide bounds that gain several orders of magnitude compared to state-of-the-art results on classical deep convolutional neural networks such as MobileNetV2 or ResNets. These gains are achieved by improving the behaviour of the approximation bounds with respect to the depth parameter, which has the most impact on the approximation error induced by quantization. To complement our theoretical result, we provide a numerical exploration of our bounds on MobileNetV2 and ResNets.

academic

Sobre el impacto de la parametrización de redes neuronales convolucionales profundas en la cuantización post-entrenamiento

Información Básica

ID del Artículo: 2502.01156
Título: On the impact of the parametrization of deep convolutional neural networks on post-training quantization
Autores: Samy Houache (Univ. Bordeaux, Thales AVS), Jean-François Aujol (Univ. Bordeaux), Yann Traonmilin (Univ. Bordeaux)
Clasificación: cs.IT (Teoría de la Información), math.IT (Teoría Matemática de la Información)
Fecha de Publicación: Febrero de 2025 (preimpresión en arXiv)
Enlace del Artículo: https://arxiv.org/abs/2502.01156

Resumen

Este artículo introduce nuevas cotas teóricas de aproximación para la salida de redes neuronales cuantizadas, con especial énfasis en redes neuronales convolucionales (CNN). Al considerar la parametrización capa por capa y enfocarse en la cuantización de pesos, los autores proporcionan cotas que logran mejoras de varios órdenes de magnitud respecto a los resultados del estado del arte en redes convolucionales profundas clásicas (como MobileNetV2 o ResNets). Estas mejoras se logran mediante la optimización del comportamiento de las cotas de aproximación respecto al parámetro de profundidad, que tiene el mayor impacto en el error de aproximación causado por la cuantización. Para complementar los resultados teóricos, los autores proporcionan exploraciones numéricas en MobileNetV2 y ResNets.

Contexto de Investigación y Motivación

Definición del Problema

Problema Central: Al desplegar redes neuronales profundas en entornos con recursos limitados, las técnicas de cuantización introducen degradación del rendimiento, requiriendo establecer cotas teóricas para cuantificar este deterioro.
Importancia:
- Creciente demanda de despliegue de redes neuronales en dispositivos móviles y sistemas embebidos
- Aplicaciones críticas para la seguridad requieren garantías teóricas robustas
- La cuantización es una técnica clave para reducir el tamaño del modelo y los costos computacionales
Limitaciones de Métodos Existentes:
- Las cotas de Gonon et al. (2023) son excesivamente pesimistas, con valor práctico limitado
- Supuestos restrictivos que requieren norma máxima de parámetros r > 1 limitan la aplicabilidad
- La constante C exhibe dependencia O(NL²), impráctica para arquitecturas profundas modernas
Motivación de la Investigación:
- Las cotas existentes son demasiado conservadoras para redes profundas
- Se necesitan cotas teóricas más ajustadas para guiar estrategias de cuantización práctica
- La regularización de pesos hace que casos con r < 1 sean comunes, requiriendo relajar restricciones

Contribuciones Principales

Cotas de Aproximación Más Ajustadas: Mejora del factor NL² de Gonon et al. a ∑ᴸₗ₌₁Nₗ₋₁, simplificándose a NL para redes de ancho constante
Relajación de Restricciones de Norma: Permite valores rₗ positivos arbitrarios (norma del operador en la capa l), haciendo los resultados aplicables a redes con normas de parámetros pequeñas
Término de Media Geométrica Mejorado: Reemplaza la norma máxima de parámetros r con rmean, proporcionando estimaciones menos pesimistas
Especialización para Redes Convolucionales: Proporciona cotas especializadas para estructuras convolucionales, considerando solo tamaño de filtros y número de canales
Verificación Práctica: Valida mejoras teóricas en modelos CNN preentrenados clásicos, demostrando mejoras de varios órdenes de magnitud

Detalle de la Metodología

Definición de la Tarea

Para una red neuronal Rθ y su versión cuantizada Rθ', se busca una cota de la forma:

sup_{x∈Ω} ||Rθ(x) - Rθ'(x)||∞ ≤ C||θ - θ'||∞

donde Ω es el dominio de entrada y C es una constante que depende de la arquitectura de la red.

Resultados Teóricos Principales

Cota de Aproximación Universal (Teorema 4.1)

Para arquitectura (L,N), asumiendo dos redes con sesgos idénticos y solo cuantización de pesos:

sup_{x∈Ω} ||Rθ(x̃) - Rθ'(x̃)||∞ ≤ max(D,1) ∑ᴸₗ₌₁ Nₗ₋₁ × r^{L-1}_{mean} ||θ - θ'||∞

donde el término de media geométrica se define como:

r_mean := ^{L-1}√(max_{l=1,...,L} max_{i=1,...,l-1} ∏_{j=i,j≠l}^L r_j)

Cota Especializada para Redes Convolucionales (Teorema 4.4)

Para redes puramente convolucionales (sin sesgos), aplicando cₗ filtros de tamaño pₗ×pₗ en cada capa:

sup_{x∈Ω} ||Rθ(x) - Rθ'(x)||∞ ≤ D × ∑ᴸₗ₌₁ p²ₗcₗ₋₁ × r^{L-1}_{conv} ||θ - θ'||∞

donde:

r_conv := ^{L-1}√(max_{l=1,...,L} ∏_{k=1,k≠l}^L r^{conv}_k)

Puntos de Innovación Técnica

Método de Parametrización Capa por Capa: Mediante análisis capa por capa de normas de parámetros, evita el uso de valores máximos globales
Explotación de Estructura Dispersa: La dispersidad de matrices convolucionales se aprovecha efectivamente, reemplazando Nₗ₋₁ completo con p²ₗcₗ₋₁
Estrategia de Media Geométrica: rmean considera la variabilidad de normas de parámetros entre capas, siendo más precisa que un simple máximo

Configuración Experimental

Conjuntos de Datos

Tiny ImageNet: 110,000 imágenes de 64×64, con 200 clases
MNIST: Reconocimiento de dígitos manuscritos, utilizado para experimentos con MLP
CIFAR-10: Imágenes en color de 32×32, 10 clases

Arquitecturas de Modelos

ResNet18/50: Redes residuales con BatchNorm removido
MobileNetV2: Red ligera con BatchNorm removido
Perceptrón Multicapa: Diferentes profundidades (5, 7, 9, 11 capas) para análisis de impacto de profundidad

Métodos de Cuantización

Cuantización Uniforme: Q_unif(θ) = ⌊θ/η⌋η
Cuantización por Redondeo: Q_round(θ) = round(θ/η)η
AdaRound: Redondeo adaptativo, optimizando desplazamientos de redondeo

Métricas de Evaluación

Comparación de ajuste de cotas teóricas
Precisión del modelo después de cuantización
Rendimiento bajo diferentes anchos de bits

Resultados Experimentales

Resultados Principales

Efectos de Mejora de Cotas

ResNet18: Nueva cota 10⁸ veces más ajustada que resultados de Gonon et al.
MobileNetV2: Mejora de 10⁵⁶ veces
ResNet50: Mejora de 10²⁷ veces

Comparación de Análisis de Parámetros

Modelo	Profundidad L	Ancho Cota Anterior	Norma r Anterior	Ancho Nueva Cota	Norma r_conv Nueva	Ratio de Mejora
MobileNetV2	53	1.2×10⁶	≈101	8641	≈9	≈10⁵⁶
ResNet18	18	8×10⁵	≈84	4609	≈44	≈10⁸
ResNet50	50	8×10⁵	≈108	4609	≈37	≈10²⁷

Análisis del Impacto de Profundidad

Validado mediante experimentos con MLP, la mejora de cotas crece exponencialmente con la profundidad:

Profundidad 5: Mejora aproximada de 10³ veces
Profundidad 11: Mejora aproximada de 10⁸ veces

Análisis de Rendimiento de Cuantización

Desempeño de diferentes métodos de cuantización en Tiny ImageNet:

AdaRound muestra mejor rendimiento en cuantización extrema (≤4 bits)
MobileNetV2 tiene mayor tolerancia a cuantización que ResNets
La profundidad impacta significativamente el error de cuantización, validando predicciones teóricas

Impacto de Distribución de Pesos

Los experimentos muestran la importancia de la distribución de normas de pesos:

MobileNetV2: r≈101 vs r_conv≈9 (mejora de 11 veces)
ResNet50: r≈108 vs r_conv≈37 (mejora de 3 veces)
Mayor variabilidad en distribución de pesos amplifica la ventaja de r_conv respecto a r

Trabajo Relacionado

Investigación en Cotas de Aproximación

Gonon et al. (2023): Proporciona cotas generales para redes ReLU, pero excesivamente pesimistas para redes profundas
Neyshabur et al. (2018): Casos específicos con perturbaciones controladas, no aplicable a cuantización arbitraria
Berner et al. (2020): Caso de norma L∞, pero limitado a d_out=1

Técnicas de Cuantización

AdaRound (Nagel et al. 2020): Redondeo adaptativo impulsado por datos
Ecualización Entre Capas: Uniformización de distribución de pesos entre capas
Cuantización de Bajo Bit: Pesos binarios, inferencia de precisión extremadamente baja

Análisis Teórico

Investigación de Propiedades Topológicas: Continuidad Lipschitz de mapeos realizados
Capacidad de Aproximación: Extensiones del teorema de aproximación universal de redes neuronales

Conclusiones y Discusión

Conclusiones Principales

Mejora Teórica Significativa: Las nuevas cotas son varios órdenes de magnitud más ajustadas que resultados existentes en redes prácticas
Optimización de Dependencia de Profundidad: Mejora de dependencia L² a crecimiento más moderado
Mejora de Practicidad: Relajación de restricciones de parámetros, aplicable a redes regularizadas
Sensibilidad a Arquitectura: La dispersidad de estructuras convolucionales se aprovecha efectivamente

Limitaciones

Aún Conservadora: Las cotas teóricas siguen siendo varios órdenes de magnitud mayores que errores observados
Análisis de Peor Caso: Las cotas teóricas se basan en casos extremos, raramente ocurrentes en aplicaciones prácticas
Restricciones de Arquitectura: Enfoque principal en CNN, extensión limitada a arquitecturas modernas como Transformers
Tratamiento de BatchNorm: BatchNorm fue removido en experimentos para satisfacer condiciones teóricas

Direcciones Futuras

Extensión a Transformers: Manejo de normalización de capas y mecanismos de atención multicabeza
Métodos Probabilísticos: Desarrollo de cotas probabilísticas reflejando condiciones operativas típicas
Cotas Más Ajustadas: Reducción adicional de la brecha entre cotas teóricas y errores reales
Herramientas Prácticas: Conversión de resultados teóricos en herramientas de guía para estrategias de cuantización

Evaluación Profunda

Fortalezas

Contribución Teórica Destacada: Progreso significativo en cotas teóricas de cuantización, con mejoras de órdenes de magnitud de importancia crítica
Rigor Matemático: Pruebas completas, derivaciones matemáticas confiables y rigurosas
Valor Práctico: Relajación de supuestos restrictivos de métodos existentes, mejorando aplicabilidad
Validación Experimental Suficiente: Verificación de mejoras teóricas en múltiples arquitecturas clásicas
Escritura Clara: Estructura de artículo razonable, expresión técnica precisa de detalles

Deficiencias

Cotas Aún Holgadas: A pesar de mejoras significativas, brecha considerable entre cotas teóricas y errores reales
Limitaciones de Arquitectura: Enfoque principal en CNN, extensibilidad limitada a arquitecturas Transformer modernas
Condiciones de Supuestos: Remoción de BatchNorm y otros componentes puede afectar valor de aplicación práctica
Análisis Probabilístico Ausente: Carencia de análisis probabilístico de rendimiento en casos típicos

Impacto

Valor Teórico: Proporciona nuevo marco analítico y herramientas para teoría de cuantización
Guía Práctica: Puede guiar diseño de estrategias de cuantización, particularmente técnicas como Ecualización Entre Capas
Inspiración para Investigación: Proporciona direcciones de mejora y fundamentos para investigación subsecuente
Reproducibilidad: Configuración experimental clara, resultados reproducibles

Escenarios de Aplicación

Aplicaciones Críticas para Seguridad: Despliegue de cuantización requiriendo garantías teóricas
Sistemas Embebidos: Compresión de modelos en entornos con recursos limitados
Diseño de Estrategias de Cuantización: Guía para cuantización capa por capa y técnicas de preprocesamiento
Investigación Teórica: Fundamento para investigación adicional en teoría de cuantización

Referencias

Gonon, A., et al. (2023). Approximation speed of quantized vs. unquantized relu neural networks and beyond. IEEE Transactions on Information Theory.
Nagel, M., et al. (2020). Up or down? adaptive rounding for post-training quantization. ICML.
Sandler, M., et al. (2018). Mobilenetv2: Inverted residuals and linear bottlenecks. CVPR.
He, K., et al. (2016). Deep residual learning for image recognition. CVPR.

Resumen: Este artículo logra progreso importante en análisis teórico de cuantización de redes neuronales, mejorando significativamente cotas de aproximación existentes mediante análisis capa por capa más refinado y estrategia de media geométrica. Aunque las cotas permanecen relativamente conservadoras, sus mejoras de órdenes de magnitud y condiciones de restricción relajadas les confieren importancia teórica y valor práctico significativo.