On the impact of the parametrization of deep convolutional neural networks on post-training quantization
Houache, Aujol, Traonmilin
This paper introduces novel theoretical approximation bounds for the output of quantized neural networks, with a focus on convolutional neural networks (CNN). By considering layerwise parametrization and focusing on the quantization of weights, we provide bounds that gain several orders of magnitude compared to state-of-the-art results on classical deep convolutional neural networks such as MobileNetV2 or ResNets. These gains are achieved by improving the behaviour of the approximation bounds with respect to the depth parameter, which has the most impact on the approximation error induced by quantization. To complement our theoretical result, we provide a numerical exploration of our bounds on MobileNetV2 and ResNets.
academic
تأثير معاملات الشبكات العصبية الالتفافية العميقة على تكميم ما بعد التدريب
تقدم هذه الورقة حدوداً نظرية تقريبية جديدة لمخرجات الشبكات العصبية المكممة، مع التركيز بشكل خاص على الشبكات العصبية الالتفافية (CNN). من خلال النظر في المعاملات على مستوى كل طبقة والتركيز على تكميم الأوزان، يقدم المؤلفون حدوداً تحقق تحسيناً بعدة رتب من حيث الحجم على النتائج الحالية الأفضل في الشبكات الالتفافية العميقة الكلاسيكية (مثل MobileNetV2 أو ResNets). يتم تحقيق هذه التحسينات من خلال تحسين سلوك حدود التقريب بالنسبة لمعامل العمق، الذي يؤثر بشكل أكبر على خطأ التقريب الناجم عن التكميم. لاستكمال النتائج النظرية، يقدم المؤلفون استكشافات عددية على MobileNetV2 و ResNets.
المشكلة الأساسية: عند نشر الشبكات العصبية العميقة في بيئات محدودة الموارد، تقنيات التكميم تدخل تدهوراً في الأداء، مما يتطلب إنشاء حدود نظرية لتحديد مقدار هذا التدهور.
الأهمية:
الطلب المتزايد على نشر الشبكات العصبية على الأجهزة المحمولة والأنظمة المدمجة
التطبيقات الحرجة من حيث السلامة تتطلب ضمانات نظرية قوية
التكميم هو تقنية أساسية لتقليل حجم النموذج وتكاليف الحساب
قيود الطرق الموجودة:
الحدود المقترحة من قبل Gonon وآخرون (2023) متشائمة جداً، مما يحد من القيمة العملية
تتطلب افتراضات صارمة بأن أقصى معيار معامل r > 1 مما يحد من قابلية التطبيق
الثابت C يظهر اعتماداً O(NL²)، غير عملي للبنى العميقة الحديثة
الدافع للبحث:
الحدود الموجودة متحفظة جداً للشبكات العميقة
الحاجة إلى حدود نظرية أكثر إحكاماً لتوجيه استراتيجيات التكميم العملية
تنظيم الأوزان يجعل حالة r < 1 شائعة، مما يتطلب تخفيف القيود
Gonon, A., et al. (2023). سرعة التقريب للشبكات العصبية ReLU المكممة مقابل غير المكممة وما بعدها. IEEE Transactions on Information Theory.
Nagel, M., et al. (2020). لأعلى أم لأسفل؟ تقريب تكيفي لتكميم ما بعد التدريب. ICML.
Sandler, M., et al. (2018). MobileNetV2: البقايا المقلوبة والاختناقات الخطية. CVPR.
He, K., et al. (2016). التعلم المتبقي العميق للتعرف على الصور. CVPR.
الملخص: تحقق هذه الورقة تقدماً مهماً في التحليل النظري لتكميم الشبكات العصبية، من خلال تحليل طبقي أكثر دقة واستراتيجية الوسط الهندسي، مما يحسن بشكل كبير الحدود التقريبية الموجودة. على الرغم من أن الحدود لا تزال نسبياً متحفظة، فإن تحسيناتها بعدة رتب من حيث الحجم وشروطها المخففة توفر قيمة نظرية وعملية مهمة.