Boosting Adversarial Transferability via Commonality-Oriented Gradient Optimization
Gao, Liu, Liu et al.
Exploring effective and transferable adversarial examples is vital for understanding the characteristics and mechanisms of Vision Transformers (ViTs). However, adversarial examples generated from surrogate models often exhibit weak transferability in black-box settings due to overfitting. Existing methods improve transferability by diversifying perturbation inputs or applying uniform gradient regularization within surrogate models, yet they have not fully leveraged the shared and unique features of surrogate models trained on the same task, leading to suboptimal transfer performance. Therefore, enhancing perturbations of common information shared by surrogate models and suppressing those tied to individual characteristics offers an effective way to improve transferability. Accordingly, we propose a commonality-oriented gradient optimization strategy (COGO) consisting of two components: Commonality Enhancement (CE) and Individuality Suppression (IS). CE perturbs the mid-to-low frequency regions, leveraging the fact that ViTs trained on the same dataset tend to rely more on mid-to-low frequency information for classification. IS employs adaptive thresholds to evaluate the correlation between backpropagated gradients and model individuality, assigning weights to gradients accordingly. Extensive experiments demonstrate that COGO significantly improves the transfer success rates of adversarial attacks, outperforming current state-of-the-art methods.
academic
सामान्यता-उन्मुख ग्रेडिएंट अनुकूलन के माध्यम से प्रतिकूल स्थानांतरणीयता को बढ़ावा देना
Vision Transformers (ViTs) की विशेषताओं और तंत्र को समझने के लिए प्रभावी और स्थानांतरणीय प्रतिकूल नमूनों की खोज महत्वपूर्ण है। हालांकि, प्रॉक्सी मॉडल द्वारा उत्पन्न प्रतिकूल नमूने काले बॉक्स सेटिंग में अधिक फिटिंग के कारण कमजोर स्थानांतरणीयता प्रदर्शित करते हैं। मौजूदा विधियां विक्षोभ इनपुट में विविधता लाकर या प्रॉक्सी मॉडल के भीतर एकीकृत ग्रेडिएंट नियमितकरण लागू करके स्थानांतरणीयता में सुधार करती हैं, लेकिन एक ही कार्य पर प्रशिक्षित प्रॉक्सी मॉडल की साझा और अद्वितीय विशेषताओं का पूरी तरह से उपयोग नहीं करती हैं, जिससे स्थानांतरण प्रदर्शन उप-इष्टतम होता है। इसलिए, प्रॉक्सी मॉडल की साझा जानकारी को बढ़ाने वाले विक्षोभ को बढ़ाना और व्यक्तिगत विशेषताओं से संबंधित विक्षोभ को दबाना स्थानांतरणीयता में सुधार का एक प्रभावी मार्ग प्रदान करता है। इसके अनुसार, हम एक सामान्यता-उन्मुख ग्रेडिएंट अनुकूलन रणनीति (COGO) प्रस्तावित करते हैं, जिसमें दो घटक हैं: सामान्यता वृद्धि (CE) और व्यक्तित्व दमन (IS)। CE विक्षोभ में निम्न-आवृत्ति क्षेत्रों को लक्षित करता है, इस तथ्य का लाभ उठाते हुए कि एक ही डेटासेट पर प्रशिक्षित ViTs वर्गीकरण के लिए मध्य-निम्न आवृत्ति जानकारी पर अधिक निर्भर होते हैं। IS प्रतिलोम प्रसार ग्रेडिएंट और मॉडल व्यक्तित्व के बीच सहसंबंध का मूल्यांकन करने के लिए अनुकूली थ्रेसहोल्ड का उपयोग करता है, तदनुसार ग्रेडिएंट को भार आवंटित करता है। व्यापक प्रयोग दर्शाते हैं कि COGO प्रतिकूल हमलों की स्थानांतरण सफलता दर में उल्लेखनीय सुधार करता है, वर्तमान अत्याधुनिक विधियों से बेहतर है।
यह पेपर Vision Transformers (ViTs) में प्रतिकूल हमलों में स्थानांतरणीयता समस्या को हल करता है। विशेष रूप से, जब प्रॉक्सी मॉडल का उपयोग करके अज्ञात लक्ष्य मॉडल पर हमला करने के लिए प्रतिकूल नमूने उत्पन्न किए जाते हैं, तो उत्पन्न प्रतिकूल नमूने अक्सर लक्ष्य मॉडल में प्रभावी ढंग से स्थानांतरित नहीं हो सकते, जिससे हमला विफल हो जाता है।
सुरक्षा-महत्वपूर्ण अनुप्रयोग: ViTs की विश्वसनीयता सुरक्षा-महत्वपूर्ण अनुप्रयोगों में प्रतिकूल हमलों के गंभीर खतरे में है
काले बॉक्स हमले की वास्तविकता: व्यावहारिक परिदृश्यों में, हमलावर आमतौर पर लक्ष्य मॉडल की आंतरिक संरचना तक पहुंच नहीं सकते, जिससे स्थानांतरणीयता महत्वपूर्ण हो जाती है
मॉडल मजबूती मूल्यांकन: प्रतिकूल नमूनों की स्थानांतरणीयता को समझना मॉडल की मजबूती का मूल्यांकन और सुधार करने में सहायता करता है
अत्यधिक फिटिंग: मौजूदा विधियां द्वारा उत्पन्न प्रतिकूल नमूनों में प्रॉक्सी मॉडल-विशिष्ट जानकारी बहुत अधिक होती है, जिससे सामान्यीकरण क्षमता कम होती है
एकीकृत उपचार: TGR और GNS-HFA जैसी विधियां केवल सांख्यिकीय विशेषताओं के आधार पर ग्रेडिएंट को समायोजित करती हैं, ग्रेडिएंट और मॉडल-विशिष्ट विशेषताओं के सहसंबंध पर विचार नहीं करती हैं
अनुचित आवृत्ति उपयोग: HFA जैसी विधियां केवल उच्च-आवृत्ति घटकों पर ध्यान केंद्रित करती हैं, यह भूल जाती हैं कि ViTs मध्य-निम्न आवृत्ति जानकारी पर अधिक निर्भर होते हैं
लेखकों ने देखा कि एक ही डेटासेट पर प्रशिक्षित विभिन्न ViTs, हालांकि आर्किटेक्चर में भिन्न हैं, निर्णय पैटर्न में सामान्यता प्रदर्शित करते हैं, विशेष रूप से मध्य-निम्न आवृत्ति जानकारी पर निर्भरता में। इसलिए, सामान्य विशेषताओं को बढ़ाकर और व्यक्तिगत विशेषताओं को दबाकर, अधिक स्थानांतरणीय प्रतिकूल नमूने उत्पन्न किए जा सकते हैं।
सामान्यता-उन्मुख अनुकूलन रणनीति प्रस्तावित करना: पहली बार ग्रेडिएंट और मॉडल विशेषताओं के बीच संबंध पर विचार करना, पारंपरिक एकीकृत ग्रेडिएंट समायोजन विधियों से परे जाना
COGO फ्रेमवर्क डिजाइन करना: सामान्यता वृद्धि (CE) और व्यक्तित्व दमन (IS) दोनों घटकों को जोड़ना, आवृत्ति-डोमेन ऊर्जा वृद्धि और अनुकूली थ्रेसहोल्ड तंत्र का उपयोग करना
महत्वपूर्ण प्रदर्शन सुधार: GNS-HFA और ATT सहित कई बेंचमार्क में मौजूदा अत्याधुनिक विधियों से काफी बेहतर
व्यापक प्रयोग सत्यापन: ViT के बीच स्थानांतरण और ViT से CNN तक क्रॉस-आर्किटेक्चर स्थानांतरण दोनों में उत्कृष्ट प्रदर्शन
स्वच्छ इनपुट छवि Xclean∈RN दी गई है, लक्ष्य प्रतिकूल विक्षोभ δ उत्पन्न करना है, जैसे कि Xadv=Xclean+δ प्रॉक्सी मॉडल पर सफलतापूर्वक हमला कर सके और अज्ञात लक्ष्य मॉडल में काले बॉक्स स्थानांतरणीयता अच्छी हो।
आवृत्ति-डोमेन सामान्यता उपयोग: HFA केवल उच्च-आवृत्ति पर ध्यान केंद्रित करने के विपरीत, CE ViTs द्वारा निर्भर मध्य-निम्न आवृत्ति घटकों को लक्षित रूप से बढ़ाता है
अनुकूली ग्रेडिएंट दमन: IS निश्चित थ्रेसहोल्ड के बजाय अनुकूली थ्रेसहोल्ड का उपयोग करता है, मॉडल-विशिष्ट ग्रेडिएंट को बेहतर ढंग से पहचानता और दबाता है
दोहरी अनुकूलन रणनीति: CE और IS आगे और पीछे दोनों दिशाओं से सहक्रियात्मक रूप से अनुकूलन करते हैं, पूरक प्रभाव बनाते हैं
सामान्यता-उन्मुख अनुकूलन प्रभावी है: मॉडल के बीच सामान्यता को बढ़ाकर और व्यक्तित्व को दबाकर, प्रतिकूल नमूनों की स्थानांतरणीयता में उल्लेखनीय सुधार होता है
आवृत्ति-डोमेन रणनीति महत्वपूर्ण है: ViTs की विशेषताओं के लिए अनुकूलित मध्य-निम्न आवृत्ति वृद्धि पारंपरिक उच्च-आवृत्ति विधि से अधिक प्रभावी है
अनुकूली दमन श्रेष्ठ है: ग्रेडिएंट-विशेषता सहसंबंध पर आधारित अनुकूली दमन एकीकृत समायोजन से बेहतर है
क्रॉस-आर्किटेक्चर सामान्यीकरण: विधि ViT के बीच और ViT से CNN के स्थानांतरण दोनों में उत्कृष्ट प्रदर्शन करती है
पेपर संबंधित क्षेत्र के महत्वपूर्ण कार्यों का हवाला देता है, जिसमें शामिल हैं:
Vision Transformer मौलिक कार्य Dosovitskiy et al., 2020
प्रतिकूल हमले शास्त्रीय विधियां Goodfellow, 2014; Madry et al., 2017
ViT-विशिष्ट हमले विधियां Zhang et al., 2023; Zhu et al., 2024
आवृत्ति-डोमेन हमले अनुसंधान Long et al., 2022
समग्र मूल्यांकन: यह प्रतिकूल हमले अनुसंधान का एक उच्च-गुणवत्ता वाला पेपर है, जो विधि नवाचार, प्रयोगात्मक डिजाइन और परिणाम विश्लेषण के सभी पहलुओं में उत्कृष्ट प्रदर्शन करता है। COGO विधि सामान्यता वृद्धि और व्यक्तित्व दमन की दोहरी रणनीति के माध्यम से, प्रतिकूल नमूनों की स्थानांतरणीयता में सुधार के लिए एक प्रभावी समाधान प्रदान करती है, जो ViT सुरक्षा अनुसंधान के लिए महत्वपूर्ण मूल्य रखती है।