2025-11-17T11:07:14.013317

On the impact of the parametrization of deep convolutional neural networks on post-training quantization

Houache, Aujol, Traonmilin
This paper introduces novel theoretical approximation bounds for the output of quantized neural networks, with a focus on convolutional neural networks (CNN). By considering layerwise parametrization and focusing on the quantization of weights, we provide bounds that gain several orders of magnitude compared to state-of-the-art results on classical deep convolutional neural networks such as MobileNetV2 or ResNets. These gains are achieved by improving the behaviour of the approximation bounds with respect to the depth parameter, which has the most impact on the approximation error induced by quantization. To complement our theoretical result, we provide a numerical exploration of our bounds on MobileNetV2 and ResNets.
academic

Sobre el impacto de la parametrización de redes neuronales convolucionales profundas en la cuantización post-entrenamiento

Información Básica

  • ID del Artículo: 2502.01156
  • Título: On the impact of the parametrization of deep convolutional neural networks on post-training quantization
  • Autores: Samy Houache (Univ. Bordeaux, Thales AVS), Jean-François Aujol (Univ. Bordeaux), Yann Traonmilin (Univ. Bordeaux)
  • Clasificación: cs.IT (Teoría de la Información), math.IT (Teoría Matemática de la Información)
  • Fecha de Publicación: Febrero de 2025 (preimpresión en arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2502.01156

Resumen

Este artículo introduce nuevas cotas teóricas de aproximación para la salida de redes neuronales cuantizadas, con especial énfasis en redes neuronales convolucionales (CNN). Al considerar la parametrización capa por capa y enfocarse en la cuantización de pesos, los autores proporcionan cotas que logran mejoras de varios órdenes de magnitud respecto a los resultados del estado del arte en redes convolucionales profundas clásicas (como MobileNetV2 o ResNets). Estas mejoras se logran mediante la optimización del comportamiento de las cotas de aproximación respecto al parámetro de profundidad, que tiene el mayor impacto en el error de aproximación causado por la cuantización. Para complementar los resultados teóricos, los autores proporcionan exploraciones numéricas en MobileNetV2 y ResNets.

Contexto de Investigación y Motivación

Definición del Problema

  1. Problema Central: Al desplegar redes neuronales profundas en entornos con recursos limitados, las técnicas de cuantización introducen degradación del rendimiento, requiriendo establecer cotas teóricas para cuantificar este deterioro.
  2. Importancia:
    • Creciente demanda de despliegue de redes neuronales en dispositivos móviles y sistemas embebidos
    • Aplicaciones críticas para la seguridad requieren garantías teóricas robustas
    • La cuantización es una técnica clave para reducir el tamaño del modelo y los costos computacionales
  3. Limitaciones de Métodos Existentes:
    • Las cotas de Gonon et al. (2023) son excesivamente pesimistas, con valor práctico limitado
    • Supuestos restrictivos que requieren norma máxima de parámetros r > 1 limitan la aplicabilidad
    • La constante C exhibe dependencia O(NL²), impráctica para arquitecturas profundas modernas
  4. Motivación de la Investigación:
    • Las cotas existentes son demasiado conservadoras para redes profundas
    • Se necesitan cotas teóricas más ajustadas para guiar estrategias de cuantización práctica
    • La regularización de pesos hace que casos con r < 1 sean comunes, requiriendo relajar restricciones

Contribuciones Principales

  1. Cotas de Aproximación Más Ajustadas: Mejora del factor NL² de Gonon et al. a ∑ᴸₗ₌₁Nₗ₋₁, simplificándose a NL para redes de ancho constante
  2. Relajación de Restricciones de Norma: Permite valores rₗ positivos arbitrarios (norma del operador en la capa l), haciendo los resultados aplicables a redes con normas de parámetros pequeñas
  3. Término de Media Geométrica Mejorado: Reemplaza la norma máxima de parámetros r con rmean, proporcionando estimaciones menos pesimistas
  4. Especialización para Redes Convolucionales: Proporciona cotas especializadas para estructuras convolucionales, considerando solo tamaño de filtros y número de canales
  5. Verificación Práctica: Valida mejoras teóricas en modelos CNN preentrenados clásicos, demostrando mejoras de varios órdenes de magnitud

Detalle de la Metodología

Definición de la Tarea

Para una red neuronal Rθ y su versión cuantizada Rθ', se busca una cota de la forma:

sup_{x∈Ω} ||Rθ(x) - Rθ'(x)||∞ ≤ C||θ - θ'||∞

donde Ω es el dominio de entrada y C es una constante que depende de la arquitectura de la red.

Resultados Teóricos Principales

Cota de Aproximación Universal (Teorema 4.1)

Para arquitectura (L,N), asumiendo dos redes con sesgos idénticos y solo cuantización de pesos:

sup_{x∈Ω} ||Rθ(x̃) - Rθ'(x̃)||∞ ≤ max(D,1) ∑ᴸₗ₌₁ Nₗ₋₁ × r^{L-1}_{mean} ||θ - θ'||∞

donde el término de media geométrica se define como:

r_mean := ^{L-1}√(max_{l=1,...,L} max_{i=1,...,l-1} ∏_{j=i,j≠l}^L r_j)

Cota Especializada para Redes Convolucionales (Teorema 4.4)

Para redes puramente convolucionales (sin sesgos), aplicando cₗ filtros de tamaño pₗ×pₗ en cada capa:

sup_{x∈Ω} ||Rθ(x) - Rθ'(x)||∞ ≤ D × ∑ᴸₗ₌₁ p²ₗcₗ₋₁ × r^{L-1}_{conv} ||θ - θ'||∞

donde:

r_conv := ^{L-1}√(max_{l=1,...,L} ∏_{k=1,k≠l}^L r^{conv}_k)

Puntos de Innovación Técnica

  1. Método de Parametrización Capa por Capa: Mediante análisis capa por capa de normas de parámetros, evita el uso de valores máximos globales
  2. Explotación de Estructura Dispersa: La dispersidad de matrices convolucionales se aprovecha efectivamente, reemplazando Nₗ₋₁ completo con p²ₗcₗ₋₁
  3. Estrategia de Media Geométrica: rmean considera la variabilidad de normas de parámetros entre capas, siendo más precisa que un simple máximo

Configuración Experimental

Conjuntos de Datos

  • Tiny ImageNet: 110,000 imágenes de 64×64, con 200 clases
  • MNIST: Reconocimiento de dígitos manuscritos, utilizado para experimentos con MLP
  • CIFAR-10: Imágenes en color de 32×32, 10 clases

Arquitecturas de Modelos

  • ResNet18/50: Redes residuales con BatchNorm removido
  • MobileNetV2: Red ligera con BatchNorm removido
  • Perceptrón Multicapa: Diferentes profundidades (5, 7, 9, 11 capas) para análisis de impacto de profundidad

Métodos de Cuantización

  1. Cuantización Uniforme: Q_unif(θ) = ⌊θ/η⌋η
  2. Cuantización por Redondeo: Q_round(θ) = round(θ/η)η
  3. AdaRound: Redondeo adaptativo, optimizando desplazamientos de redondeo

Métricas de Evaluación

  • Comparación de ajuste de cotas teóricas
  • Precisión del modelo después de cuantización
  • Rendimiento bajo diferentes anchos de bits

Resultados Experimentales

Resultados Principales

Efectos de Mejora de Cotas

  • ResNet18: Nueva cota 10⁸ veces más ajustada que resultados de Gonon et al.
  • MobileNetV2: Mejora de 10⁵⁶ veces
  • ResNet50: Mejora de 10²⁷ veces

Comparación de Análisis de Parámetros

ModeloProfundidad LAncho Cota AnteriorNorma r AnteriorAncho Nueva CotaNorma r_conv NuevaRatio de Mejora
MobileNetV2531.2×10⁶≈1018641≈9≈10⁵⁶
ResNet18188×10⁵≈844609≈44≈10⁸
ResNet50508×10⁵≈1084609≈37≈10²⁷

Análisis del Impacto de Profundidad

Validado mediante experimentos con MLP, la mejora de cotas crece exponencialmente con la profundidad:

  • Profundidad 5: Mejora aproximada de 10³ veces
  • Profundidad 11: Mejora aproximada de 10⁸ veces

Análisis de Rendimiento de Cuantización

Desempeño de diferentes métodos de cuantización en Tiny ImageNet:

  • AdaRound muestra mejor rendimiento en cuantización extrema (≤4 bits)
  • MobileNetV2 tiene mayor tolerancia a cuantización que ResNets
  • La profundidad impacta significativamente el error de cuantización, validando predicciones teóricas

Impacto de Distribución de Pesos

Los experimentos muestran la importancia de la distribución de normas de pesos:

  • MobileNetV2: r≈101 vs r_conv≈9 (mejora de 11 veces)
  • ResNet50: r≈108 vs r_conv≈37 (mejora de 3 veces)
  • Mayor variabilidad en distribución de pesos amplifica la ventaja de r_conv respecto a r

Trabajo Relacionado

Investigación en Cotas de Aproximación

  • Gonon et al. (2023): Proporciona cotas generales para redes ReLU, pero excesivamente pesimistas para redes profundas
  • Neyshabur et al. (2018): Casos específicos con perturbaciones controladas, no aplicable a cuantización arbitraria
  • Berner et al. (2020): Caso de norma L∞, pero limitado a d_out=1

Técnicas de Cuantización

  • AdaRound (Nagel et al. 2020): Redondeo adaptativo impulsado por datos
  • Ecualización Entre Capas: Uniformización de distribución de pesos entre capas
  • Cuantización de Bajo Bit: Pesos binarios, inferencia de precisión extremadamente baja

Análisis Teórico

  • Investigación de Propiedades Topológicas: Continuidad Lipschitz de mapeos realizados
  • Capacidad de Aproximación: Extensiones del teorema de aproximación universal de redes neuronales

Conclusiones y Discusión

Conclusiones Principales

  1. Mejora Teórica Significativa: Las nuevas cotas son varios órdenes de magnitud más ajustadas que resultados existentes en redes prácticas
  2. Optimización de Dependencia de Profundidad: Mejora de dependencia L² a crecimiento más moderado
  3. Mejora de Practicidad: Relajación de restricciones de parámetros, aplicable a redes regularizadas
  4. Sensibilidad a Arquitectura: La dispersidad de estructuras convolucionales se aprovecha efectivamente

Limitaciones

  1. Aún Conservadora: Las cotas teóricas siguen siendo varios órdenes de magnitud mayores que errores observados
  2. Análisis de Peor Caso: Las cotas teóricas se basan en casos extremos, raramente ocurrentes en aplicaciones prácticas
  3. Restricciones de Arquitectura: Enfoque principal en CNN, extensión limitada a arquitecturas modernas como Transformers
  4. Tratamiento de BatchNorm: BatchNorm fue removido en experimentos para satisfacer condiciones teóricas

Direcciones Futuras

  1. Extensión a Transformers: Manejo de normalización de capas y mecanismos de atención multicabeza
  2. Métodos Probabilísticos: Desarrollo de cotas probabilísticas reflejando condiciones operativas típicas
  3. Cotas Más Ajustadas: Reducción adicional de la brecha entre cotas teóricas y errores reales
  4. Herramientas Prácticas: Conversión de resultados teóricos en herramientas de guía para estrategias de cuantización

Evaluación Profunda

Fortalezas

  1. Contribución Teórica Destacada: Progreso significativo en cotas teóricas de cuantización, con mejoras de órdenes de magnitud de importancia crítica
  2. Rigor Matemático: Pruebas completas, derivaciones matemáticas confiables y rigurosas
  3. Valor Práctico: Relajación de supuestos restrictivos de métodos existentes, mejorando aplicabilidad
  4. Validación Experimental Suficiente: Verificación de mejoras teóricas en múltiples arquitecturas clásicas
  5. Escritura Clara: Estructura de artículo razonable, expresión técnica precisa de detalles

Deficiencias

  1. Cotas Aún Holgadas: A pesar de mejoras significativas, brecha considerable entre cotas teóricas y errores reales
  2. Limitaciones de Arquitectura: Enfoque principal en CNN, extensibilidad limitada a arquitecturas Transformer modernas
  3. Condiciones de Supuestos: Remoción de BatchNorm y otros componentes puede afectar valor de aplicación práctica
  4. Análisis Probabilístico Ausente: Carencia de análisis probabilístico de rendimiento en casos típicos

Impacto

  1. Valor Teórico: Proporciona nuevo marco analítico y herramientas para teoría de cuantización
  2. Guía Práctica: Puede guiar diseño de estrategias de cuantización, particularmente técnicas como Ecualización Entre Capas
  3. Inspiración para Investigación: Proporciona direcciones de mejora y fundamentos para investigación subsecuente
  4. Reproducibilidad: Configuración experimental clara, resultados reproducibles

Escenarios de Aplicación

  1. Aplicaciones Críticas para Seguridad: Despliegue de cuantización requiriendo garantías teóricas
  2. Sistemas Embebidos: Compresión de modelos en entornos con recursos limitados
  3. Diseño de Estrategias de Cuantización: Guía para cuantización capa por capa y técnicas de preprocesamiento
  4. Investigación Teórica: Fundamento para investigación adicional en teoría de cuantización

Referencias

  1. Gonon, A., et al. (2023). Approximation speed of quantized vs. unquantized relu neural networks and beyond. IEEE Transactions on Information Theory.
  2. Nagel, M., et al. (2020). Up or down? adaptive rounding for post-training quantization. ICML.
  3. Sandler, M., et al. (2018). Mobilenetv2: Inverted residuals and linear bottlenecks. CVPR.
  4. He, K., et al. (2016). Deep residual learning for image recognition. CVPR.

Resumen: Este artículo logra progreso importante en análisis teórico de cuantización de redes neuronales, mejorando significativamente cotas de aproximación existentes mediante análisis capa por capa más refinado y estrategia de media geométrica. Aunque las cotas permanecen relativamente conservadoras, sus mejoras de órdenes de magnitud y condiciones de restricción relajadas les confieren importancia teórica y valor práctico significativo.