Boosting Adversarial Transferability via Commonality-Oriented Gradient Optimization
Gao, Liu, Liu et al.
Exploring effective and transferable adversarial examples is vital for understanding the characteristics and mechanisms of Vision Transformers (ViTs). However, adversarial examples generated from surrogate models often exhibit weak transferability in black-box settings due to overfitting. Existing methods improve transferability by diversifying perturbation inputs or applying uniform gradient regularization within surrogate models, yet they have not fully leveraged the shared and unique features of surrogate models trained on the same task, leading to suboptimal transfer performance. Therefore, enhancing perturbations of common information shared by surrogate models and suppressing those tied to individual characteristics offers an effective way to improve transferability. Accordingly, we propose a commonality-oriented gradient optimization strategy (COGO) consisting of two components: Commonality Enhancement (CE) and Individuality Suppression (IS). CE perturbs the mid-to-low frequency regions, leveraging the fact that ViTs trained on the same dataset tend to rely more on mid-to-low frequency information for classification. IS employs adaptive thresholds to evaluate the correlation between backpropagated gradients and model individuality, assigning weights to gradients accordingly. Extensive experiments demonstrate that COGO significantly improves the transfer success rates of adversarial attacks, outperforming current state-of-the-art methods.
academic
تعزيز قابلية نقل الهجمات الخصومة عبر تحسين التدرج الموجه نحو الخصائص المشتركة
يعتبر استكشاف العينات الخصومة الفعالة والقابلة للنقل أمراً حاسماً لفهم خصائص وآليات محولات الرؤية (Vision Transformers - ViTs). ومع ذلك، فإن العينات الخصومة المولدة من نماذج بديلة غالباً ما تظهر قابلية نقل ضعيفة في إعدادات الصندوق الأسود بسبب الإفراط في التدريب. تحاول الطرق الموجودة تحسين قابلية النقل من خلال تنويع المدخلات المضطربة أو تطبيق تنظيم التدرج الموحد داخل النماذج البديلة، لكنها تفشل في الاستفادة الكاملة من الخصائص المشتركة والفريدة للنماذج البديلة المدربة على نفس المهمة، مما يؤدي إلى أداء نقل دون الأمثل. لذلك، فإن تعزيز الاضطرابات التي تشارك المعلومات المشتركة بين النماذج وقمع الاضطرابات المرتبطة بالخصائص الفردية يوفر مساراً فعالاً لتحسين قابلية النقل. بناءً على ذلك، نقترح استراتيجية تحسين التدرج الموجهة نحو الخصائص المشتركة (COGO)، والتي تتضمن مكونين: تعزيز الخصائص المشتركة (CE) وقمع الخصائص الفردية (IS). يقوم CE بتعطيل المناطق منخفضة التردد في الاضطرابات، مستفيداً من حقيقة أن محولات الرؤية المدربة على نفس مجموعة البيانات تميل إلى الاعتماد بشكل أكبر على معلومات التردد المتوسط والمنخفض للتصنيف. يستخدم IS عتبة تكيفية لتقييم الارتباط بين التدرجات المنتشرة للخلف وخصائص النموذج الفردية، مع تخصيص الأوزان للتدرجات وفقاً لذلك. تُظهر التجارب الموسعة أن COGO يحسن بشكل كبير معدل نجاح الهجمات الخصومة، متفوقاً على الطرق الحديثة الأخرى.
تتناول هذه الورقة بشكل أساسي مشكلة قابلية النقل في الهجمات الخصومة على محولات الرؤية (ViTs). بشكل محدد، عند استخدام نموذج بديل لتوليد عينات خصومة لمهاجمة نموذج هدف غير معروف، فإن العينات المولدة غالباً ما تفشل في الانتقال بفعالية إلى النموذج الهدف، مما يؤدي إلى فشل الهجوم.
التطبيقات الحساسة للأمان: تتعرض موثوقية ViTs في التطبيقات الحساسة للأمان لتهديد خطير من الهجمات الخصومة
واقعية الهجمات ذات الصندوق الأسود: في السيناريوهات العملية، لا يستطيع المهاجمون عادة الوصول إلى البنية الداخلية للنموذج الهدف، مما يجعل قابلية النقل حاسمة
تقييم قوة النموذج: يساعد فهم قابلية نقل العينات الخصومة في تقييم وتحسين قوة النموذج
الإفراط في التدريب: تحتوي العينات الخصومة المولدة بالطرق الموجودة على الكثير من المعلومات الخاصة بالنموذج البديل، مما يؤدي إلى ضعف القدرة على التعميم
المعالجة الموحدة: تعتمد طرق مثل TGR و GNS-HFA فقط على الخصائص الإحصائية لتعديل التدرجات بشكل موحد، دون الأخذ في الاعتبار الارتباط بين التدرجات والخصائص الخاصة بالنموذج
الاستخدام غير الصحيح للمجال الترددي: تركز طرق مثل HFA فقط على المكونات عالية التردد، متجاهلة حقيقة أن ViTs تعتمد بشكل أكبر على معلومات التردد المتوسط والمنخفض
لاحظ المؤلفون أنه على الرغم من الاختلافات المعمارية، فإن محولات الرؤية المختلفة المدربة على نفس مجموعة البيانات تشترك في أنماط القرار، خاصة في اعتمادها على معلومات التردد المتوسط والمنخفض. لذلك، من خلال تعزيز الخصائص المشتركة وقمع الخصائص الفردية، يمكن توليد عينات خصومة أكثر قابلية للنقل.
اقتراح استراتيجية تحسين موجهة نحو الخصائص المشتركة: تأخذ في الاعتبار للمرة الأولى العلاقة بين التدرجات والخصائص الخاصة بالنموذج، متجاوزة طرق تعديل التدرج الموحدة التقليدية
تصميم إطار عمل COGO: يجمع بين مكونين: تعزيز الخصائص المشتركة (CE) وقمع الخصائص الفردية (IS)، مستفيداً من تعزيز الطاقة في المجال الترددي وآليات العتبة التكيفية
تحسن أداء كبير: يتفوق بشكل كبير على الطرق الحديثة الموجودة في اختبارات معايير متعددة، بما في ذلك GNS-HFA و ATT
التحقق التجريبي الشامل: حقق أداء ممتازة في نقل البيانات بين ViTs والنقل عبر الهندسة المعمارية من ViT إلى CNN
بالنظر إلى صورة إدخال نظيفة Xclean∈RN، الهدف هو توليد اضطراب خصومة δ، بحيث يكون Xadv=Xclean+δ قادراً على مهاجمة النموذج البديل بنجاح مع امتلاك قابلية نقل جيدة إلى نموذج هدف غير معروف.
استخدام الخصائص المشتركة في المجال الترددي: بخلاف HFA الذي يركز فقط على التردد العالي، يعزز CE بشكل استهدافي المكونات متوسطة ومنخفضة التردد التي تعتمد عليها ViTs
قمع التدرج التكيفي: يستخدم IS عتبة تكيفية بدلاً من عتبة ثابتة، مما يحسن تحديد وقمع التدرجات الخاصة بالنموذج
استراتيجية التحسين المزدوجة: يعمل CE و IS من اتجاهات أمامية وعكسية معاً، مما يشكل تأثيراً متكاملاً
تستشهد الورقة بالأعمال المهمة في المجالات ذات الصلة، بما في ذلك:
أعمال أساسية في محولات الرؤية Dosovitskiy et al., 2020
الطرق الكلاسيكية للهجمات الخصومة Goodfellow, 2014; Madry et al., 2017
طرق الهجوم الخاصة بـ ViT Zhang et al., 2023; Zhu et al., 2024
أبحاث الهجمات في المجال الترددي Long et al., 2022
التقييم الإجمالي: هذه ورقة بحثية عالية الجودة في مجال الهجمات الخصومة، تتمتع بأداء ممتازة من حيث الابتكار المنهجي وتصميم التجارب وتحليل النتائج. توفر طريقة COGO من خلال استراتيجية مزدوجة لتعزيز الخصائص المشتركة وقمع الخصائص الفردية حلاً فعالاً لتحسين قابلية نقل العينات الخصومة، وتتمتع بقيمة مهمة لأبحاث أمان ViT.