Vision Transformers (ViTs) এর বৈশিষ্ট্য এবং প্রক্রিয়া বোঝার জন্য কার্যকর এবং স্থানান্তরযোগ্য প্রতিকূল নমুনা অন্বেষণ করা অত্যন্ত গুরুত্বপূর্ণ। তবে প্রক্সি মডেল দ্বারা উৎপাদিত প্রতিকূল নমুনাগুলি কালো বাক্স সেটিংসে অতিফিটিংয়ের কারণে দুর্বল স্থানান্তরযোগ্যতা প্রদর্শন করে। বিদ্যমান পদ্ধতিগুলি বিরক্তিকর ইনপুট বৈচিত্র্যময় করে বা প্রক্সি মডেলের মধ্যে একীভূত গ্রেডিয়েন্ট নিয়মিতকরণ প্রয়োগ করে স্থানান্তরযোগ্যতা উন্নত করে, কিন্তু একই কাজে প্রশিক্ষিত প্রক্সি মডেলগুলির ভাগ করা এবং অনন্য বৈশিষ্ট্যগুলি সম্পূর্ণরূপে ব্যবহার করতে ব্যর্থ হয়, যার ফলে স্থানান্তর কর্মক্ষমতা উপ-সর্বোত্তম হয়। অতএব, প্রক্সি মডেলগুলির ভাগ করা তথ্য বৃদ্ধি করে এমন বিরক্তিকর এবং ব্যক্তিগত বৈশিষ্ট্যগুলির সাথে সম্পর্কিত বিরক্তিকর দমন করা স্থানান্তরযোগ্যতা উন্নত করার একটি কার্যকর পথ প্রদান করে। এই ভিত্তিতে, আমরা একটি সাধারণত্য-ভিত্তিক গ্রেডিয়েন্ট অপ্টিমাইজেশন কৌশল (COGO) প্রস্তাব করি, যা দুটি উপাদান নিয়ে গঠিত: সাধারণত্য বৃদ্ধি (CE) এবং ব্যক্তিত্ব দমন (IS)। CE নিম্ন ফ্রিকোয়েন্সি অঞ্চলে বিরক্তিকর, এই সত্যটি ব্যবহার করে যে একই ডেটাসেটে প্রশিক্ষিত ViTs শ্রেণীবিভাগের জন্য মধ্য-নিম্ন ফ্রিকোয়েন্সি তথ্যের উপর আরও বেশি নির্ভর করে। IS ব্যাকপ্রপাগেশন গ্রেডিয়েন্ট এবং মডেল ব্যক্তিত্বের মধ্যে সম্পর্ক মূল্যায়ন করতে অভিযোজিত থ্রেশহোল্ড ব্যবহার করে, সেই অনুযায়ী গ্রেডিয়েন্টের জন্য ওজন বরাদ্দ করে। ব্যাপক পরীক্ষা দেখায় যে COGO প্রতিকূল আক্রমণের স্থানান্তর সাফল্যের হার উল্লেখযোগ্যভাবে উন্নত করে, বর্তমান অত্যাধুনিক পদ্ধতিগুলিকে ছাড়িয়ে যায়।
এই পত্রটি প্রধানত Vision Transformers (ViTs) প্রতিকূল আক্রমণে স্থানান্তরযোগ্যতা সমস্যা সমাধান করে। নির্দিষ্টভাবে, প্রক্সি মডেল ব্যবহার করে অজানা লক্ষ্য মডেল আক্রমণ করার জন্য প্রতিকূল নমুনা উৎপাদন করার সময়, উৎপাদিত প্রতিকূল নমুনাগুলি প্রায়শই লক্ষ্য মডেলে কার্যকরভাবে স্থানান্তরিত হতে পারে না, যার ফলে আক্রমণ ব্যর্থ হয়।
লেখকরা পর্যবেক্ষণ করেছেন যে একই ডেটাসেটে প্রশিক্ষিত বিভিন্ন ViTs যদিও স্থাপত্য পার্থক্য রয়েছে, তবে সিদ্ধান্ত গ্রহণের প্যাটার্নে সাধারণত্ব রয়েছে, বিশেষ করে মধ্য-নিম্ন ফ্রিকোয়েন্সি তথ্যের উপর নির্ভরতা। অতএব, সাধারণ বৈশিষ্ট্যগুলি বৃদ্ধি করে এবং ব্যক্তিগত বৈশিষ্ট্যগুলি দমন করে, আরও স্থানান্তরযোগ্য প্রতিকূল নমুনা উৎপাদন করা যায়।
১. সাধারণত্য-ভিত্তিক অপ্টিমাইজেশন কৌশল প্রস্তাব: প্রথমবারের মতো গ্রেডিয়েন্ট এবং মডেল বৈশিষ্ট্যের মধ্যে সম্পর্ক বিবেচনা করে, ঐতিহ্যবাহী একীভূত গ্রেডিয়েন্ট সমন্বয় পদ্ধতির বাইরে যায় २. COGO ফ্রেমওয়ার্ক ডিজাইন: সাধারণত্য বৃদ্ধি (CE) এবং ব্যক্তিত্ব দমন (IS) দুটি উপাদান একত্রিত করে, ফ্রিকোয়েন্সি ডোমেইন শক্তি বৃদ্ধি এবং অভিযোজিত থ্রেশহোল্ড প্রক্রিয়া ব্যবহার করে ३. উল্লেখযোগ্য কর্মক্ষমতা উন্নতি: একাধিক বেঞ্চমার্ক পরীক্ষায় বিদ্যমান অত্যাধুনিক পদ্ধতিগুলিকে উল্লেখযোগ্যভাবে ছাড়িয়ে যায়, GNS-HFA এবং ATT অন্তর্ভুক্ত ४. ব্যাপক পরীক্ষা যাচাইকরণ: ViT মধ্যে স্থানান্তর এবং ViT থেকে CNN এর ক্রস-আর্কিটেকচার স্থানান্তরে উভয়ই চমৎকার কর্মক্ষমতা অর্জন করে
পরিষ্কার ইনপুট ছবি দেওয়া, লক্ষ্য হল প্রতিকূল বিরক্তিকর উৎপাদন করা, যাতে প্রক্সি মডেলে সফলভাবে আক্রমণ করতে পারে এবং অজানা লক্ষ্য মডেলে ভাল কালো বাক্স স্থানান্তরযোগ্যতা থাকে।
COGO কৌশলে দুটি মূল উপাদান রয়েছে:
CE মডিউল ফরওয়ার্ড প্রপাগেশন প্রক্রিয়ায় মধ্য-নিম্ন ফ্রিকোয়েন্সি উপাদান বৃদ্ধি করে:
ধাপ ১: বর্তমান বিরক্তিকর এবং গাউসিয়ান শব্দ যোগ করুন
X = X_clean + δ
X_DCT = DCT(X + ε), যেখানে ε ~ N(0, I_N)
ধাপ ২: শক্তি বিতরণ গণনা করুন এবং বৃদ্ধি করুন
E(X_DCT) = Normalize(|X_DCT|)
X'_DCT = X_DCT · (1 + γ · E(X_DCT))
ধাপ ३: স্থান ডোমেইনে রূপান্তর করুন এবং স্থানিক মুখোশ প্রয়োগ করুন
X_IDCT = IDCT(X'_DCT · M)
যেখানে γ বৃদ্ধি শক্তি নিয়ন্ত্রণ করে, M হল HFA থেকে উত্তরাধিকার স্থানিক মুখোশ।
IS মডিউল ব্যাকপ্রপাগেশন প্রক্রিয়ায় প্রক্সি মডেল-নির্দিষ্ট গ্রেডিয়েন্ট দমন করে:
অপ্রয়োজনীয় বৈশিষ্ট্যের দমন:
অতিরিক্ত জ্ঞানের দমন:
१. ফ্রিকোয়েন্সি ডোমেইন সাধারণত্ব ব্যবহার: HFA শুধুমাত্র উচ্চ ফ্রিকোয়েন্সিতে ফোকাস করার বিপরীতে, CE ViTs নির্ভর করে এমন মধ্য-নিম্ন ফ্রিকোয়েন্সি উপাদান লক্ষ্যভাবে বৃদ্ধি করে २. অভিযোজিত গ্রেডিয়েন্ট দমন: IS অভিযোজিত থ্রেশহোল্ড ব্যবহার করে স্থির থ্রেশহোল্ডের পরিবর্তে, মডেল-নির্দিষ্ট গ্রেডিয়েন্ট আরও ভালভাবে চিহ্নিত এবং দমন করে ३. দ্বৈত অপ্টিমাইজেশন কৌশল: CE এবং IS ফরওয়ার্ড এবং ব্যাকওয়ার্ড দুটি দিক থেকে সহযোগিতামূলকভাবে অপ্টিমাইজ করে, পরিপূরক প্রভাব গঠন করে
ViT মধ্যে স্থানান্তর কর্মক্ষমতা:
ক্রস-আর্কিটেকচার স্থানান্তর কর্মক্ষমতা (ViT → CNN):
নির্দিষ্ট সংখ্যা উদাহরণ (Visformer-S প্রক্সি মডেল হিসাবে):
| পদ্ধতি | ViT-B/16 | DeiT-B | TNT-S | Inc-v3 | Inc-v4 |
|---|---|---|---|---|---|
| GNS-HFA | 49.1% | 54.1% | 81.3% | 71.6% | 71.3% |
| COGO | 55.2% | 64.9% | 85.5% | 71.8% | 72.4% |
CE এবং IS উপাদান অবদান:
| CE | IS | ViTs | CNNs | CNNs-adv |
|---|---|---|---|---|
| - | - | 46.64% | 30.45% | 9.80% |
| ✓ | - | 72.56% (+25.92%) | 56.18% (+25.73%) | 32.15% (+22.35%) |
| - | ✓ | 62.38% (+15.74%) | 45.85% (+15.40%) | 22.77% (+12.97%) |
| ✓ | ✓ | 77.97% (+31.33%) | 63.73% (+33.28%) | 36.75% (+26.95%) |
মূল আবিষ্কার:
হাইপারপ্যারামিটার সংবেদনশীলতা:
গ্রেডিয়েন্ট বিচ্ছুরণ সূচক মাধ্যমে বিশ্লেষণ আবিষ্কার করে:
লেখকরা ViT ভেরিয়েন্টগুলিকে দুটি শ্রেণীতে বিভক্ত করেন: १. গণনা দক্ষতা ধরনের: Visformer, PiT ইত্যাদি, মনোযোগ অপারেশন সরলীকরণ করে २. ডেটা দক্ষতা ধরনের: DeiT, CaiT ইত্যাদি, জ্ঞান পাতন ইত্যাদির মাধ্যমে প্রতিনিধিত্ব ক্ষমতা বৃদ্ধি করে
१. সাধারণত্য-ভিত্তিক অপ্টিমাইজেশন কার্যকর: মডেল মধ্যে সাধারণত্ব বৃদ্ধি এবং ব্যক্তিত্ব দমন করে, প্রতিকূল নমুনার স্থানান্তরযোগ্যতা উল্লেখযোগ্যভাবে উন্নত করে २. ফ্রিকোয়েন্সি ডোমেইন কৌশল গুরুত্বপূর্ণ: ViTs বৈশিষ্ট্যের জন্য লক্ষ্যভিত্তিক মধ্য-নিম্ন ফ্রিকোয়েন্সি বৃদ্ধি ঐতিহ্যবাহী উচ্চ ফ্রিকোয়েন্সি পদ্ধতির চেয়ে আরও কার্যকর ३. অভিযোজিত দমন উচ্চতর: গ্রেডিয়েন্ট-বৈশিষ্ট্য সম্পর্কের উপর ভিত্তি করে অভিযোজিত দমন একীভূত সমন্বয়ের চেয়ে উচ্চতর ४. ক্রস-আর্কিটেকচার সাধারণীকরণ: পদ্ধতি ViT মধ্যে এবং ViT থেকে CNN এর স্থানান্তরে উভয়ই চমৎকার কর্মক্ষমতা প্রদর্শন করে
१. গণনা ওভারহেড: ফ্রিকোয়েন্সি ডোমেইন রূপান্তর এবং গ্রেডিয়েন্ট বিশ্লেষণ গণনা খরচ বৃদ্ধি করে २. হাইপারপ্যারামিটার সংবেদনশীলতা: যদিও তুলনামূলকভাবে দৃঢ়, তবুও উপযুক্ত প্যারামিটার সমন্বয়ের প্রয়োজন ३. তাত্ত্বিক বিশ্লেষণ: মধ্য-নিম্ন ফ্রিকোয়েন্সি বৃদ্ধি কেন আরও কার্যকর তার গভীর তাত্ত্বিক বিশ্লেষণ অভাব ४. প্রতিরক্ষা বিবেচনা: লক্ষ্যভিত্তিক প্রতিরক্ষা পদ্ধতির দৃঢ়তা সম্পূর্ণভাবে অন্বেষণ করা হয়নি
१. তাত্ত্বিক উন্নতি: ফ্রিকোয়েন্সি ডোমেইন সাধারণত্বের তাত্ত্বিক ভিত্তি গভীরভাবে বিশ্লেষণ করুন २. দক্ষতা অপ্টিমাইজেশন: গণনা ওভারহেড হ্রাস করুন, ব্যবহারিকতা উন্নত করুন ३. প্রতিরক্ষা গবেষণা: COGO এর বিরুদ্ধে প্রতিরক্ষা প্রক্রিয়া অন্বেষণ করুন ४. প্রসারিত প্রয়োগ: পদ্ধতি অন্যান্য Vision Transformer ভেরিয়েন্টে প্রসারিত করুন
१. শক্তিশালী উদ্ভাবনী: প্রথমবারের মতো সাধারণত্য-ব্যক্তিত্ব দৃষ্টিকোণ থেকে প্রতিকূল নমুনার স্থানান্তরযোগ্যতা বিশ্লেষণ করে, চিন্তাভাবনা উদ্ভাবনী २. পদ্ধতি সুসংগত: CE এবং IS দুটি উপাদান যুক্তিসঙ্গতভাবে ডিজাইন করা হয়েছে, সম্পূর্ণ অপ্টিমাইজেশন ফ্রেমওয়ার্ক গঠন করে ३. পরীক্ষা ব্যাপক: একাধিক মডেল আর্কিটেকচার এবং আক্রমণ পরিস্থিতি কভার করে, ফলাফল প্রভাবশালী ४. কর্মক্ষমতা উল্লেখযোগ্য: বিদ্যমান পদ্ধতির তুলনায় স্পষ্ট উন্নতি, নতুন SOTA স্তর অর্জন করে ५. বিশ্লেষণ গভীর: গ্রেডিয়েন্ট বিচ্ছুরণ বিশ্লেষণ ইত্যাদি গভীর অন্তর্দৃষ্টি প্রদান করে
१. তাত্ত্বিক ভিত্তি: মধ্য-নিম্ন ফ্রিকোয়েন্সি সাধারণত্বের তাত্ত্বিক ব্যাখ্যা যথেষ্ট গভীর নয় २. গণনা দক্ষতা: ফ্রিকোয়েন্সি ডোমেইন রূপান্তর এবং গ্রেডিয়েন্ট বিশ্লেষণ গণনা জটিলতা বৃদ্ধি করে ३. প্রযোজ্য পরিসীমা: প্রধানত ViTs এর জন্য, অন্যান্য আর্কিটেকচারে প্রযোজ্যতা সীমিত ४. প্রতিরক্ষা বিবেচনা: স্ব-অভিযোজিত প্রতিরক্ষার প্রভাব সম্পূর্ণভাবে বিবেচনা করা হয়নি
१. একাডেমিক মূল্য: প্রতিকূল আক্রমণ গবেষণায় নতুন অপ্টিমাইজেশন চিন্তাভাবনা প্রদান করে २. ব্যবহারিক মূল্য: ViTs এর দৃঢ়তা মূল্যায়নে ব্যবহার করা যায় ३. পুনরুৎপাদনযোগ্যতা: বিস্তারিত বাস্তবায়ন বিবরণ এবং হাইপারপ্যারামিটার সেটিং প্রদান করে ४. অনুপ্রেরণামূলক অর্থ: সাধারণত্য-ব্যক্তিত্ব বিশ্লেষণ ফ্রেমওয়ার্ক অন্যান্য সম্পর্কিত গবেষণাকে অনুপ্রাণিত করতে পারে
१. মডেল দৃঢ়তা মূল্যায়ন: প্রতিকূল আক্রমণের অধীনে ViTs এর নিরাপত্তা মূল্যায়ন করুন २. প্রতিকূল প্রশিক্ষণ: আরও চ্যালেঞ্জিং প্রশিক্ষণ নমুনা উৎপাদন করুন ३. নিরাপত্তা গবেষণা: গভীর শেখার মডেলের নিরাপত্তা বোঝা এবং উন্নত করুন ४. ক্রস-মডেল আক্রমণ: লক্ষ্য মডেল তথ্য অ্যাক্সেস করা যায় না এমন কালো বাক্স পরিস্থিতিতে
পত্রটি সম্পর্কিত ক্ষেত্রের গুরুত্বপূর্ণ কাজ উদ্ধৃত করে, যার মধ্যে রয়েছে:
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ মানের প্রতিকূল আক্রমণ গবেষণা পত্র, যা পদ্ধতি উদ্ভাবন, পরীক্ষা ডিজাইন এবং ফলাফল বিশ্লেষণে চমৎকার কর্মক্ষমতা প্রদর্শন করে। COGO পদ্ধতি সাধারণত্য বৃদ্ধি এবং ব্যক্তিত্ব দমনের দ্বৈত কৌশলের মাধ্যমে, প্রতিকূল নমুনার স্থানান্তরযোগ্যতা উন্নত করার জন্য একটি কার্যকর সমাধান প্রদান করে, ViT নিরাপত্তা গবেষণায় গুরুত্বপূর্ণ মূল্য রাখে।