লেবেল ক্ষতি গভীর শিক্ষায় একটি গুরুত্বপূর্ণ সমস্যা, যেখানে অপেশাদার টীকাকরণ বা প্রতিকূল আক্রমণের কারণে প্রশিক্ষণ নমুনার ভুল লেবেলিং মডেলের কর্মক্ষমতা উল্লেখযোগ্যভাবে হ্রাস করে। বড় আকারের নিখুঁত লেবেলযুক্ত ডেটাসেট অর্জন ব্যয়বহুল এবং মডেল পুনরায় প্রশিক্ষণ গণনাগতভাবে ব্যয়বহুল। এই সমস্যার সমাধানের জন্য, এই পেপারটি স্কেলড অ্যাক্টিভেশন প্রজেকশন (SAP) প্রস্তাব করে, যা একটি একবচন মূল্য বিয়োজন (SVD) ভিত্তিক সংশোধনমূলক মেশিন আনলার্নিং অ্যালগরিদম। SAP ক্রস-এন্ট্রপি ক্ষতি ব্যবহার করে অল্প সংখ্যক বিশ্বস্ত নমুনা চিহ্নিত করে এবং মডেল ওজনকে এই বিশ্বস্ত নমুনাগুলি ব্যবহার করে SVD দ্বারা অনুমানিত পরিষ্কার অ্যাক্টিভেশন স্থানে প্রজেক্ট করে লেবেল নয়েজ হ্রাস করে। পরীক্ষা দেখায় যে SAP CIFAR ডেটাসেটে ২৫% সিন্থেটিক ক্ষতির অধীনে ৬% পর্যন্ত সাধারণীকরণ উন্নতি অর্জন করতে পারে, নয়েজ-রোবাস্ট প্রশিক্ষণ পদ্ধতির উপর গড়ে প্রায় ৩.২% উন্নতি, এবং প্রাকৃতিক ক্ষতিগ্রস্ত Clothing1M ডেটাসেটে Vision Transformer মডেলে ২.৩১% সাধারণীকরণ উন্নতি অর্জন করে।
১. লেবেল নয়েজ সমস্যা: বড় আকারের ডেটাসেটে লেবেল ত্রুটি সর্বব্যাপী, যা নিম্নলিখিত উৎস থেকে আসতে পারে:
२. বিদ্যমান সমাধানের সীমাবদ্ধতা:
३. গবেষণা প্রেরণা:
१. SAP অ্যালগরিদম প্রস্তাব: SVD-ভিত্তিক সংশোধনমূলক মেশিন আনলার্নিং অ্যালগরিদম, যা অ্যাক্টিভেশন প্রজেকশনের মাধ্যমে লেবেল নয়েজ প্রভাব হ্রাস করে
२. স্বয়ংক্রিয় বিশ্বস্ত নমুনা নির্বাচন: ক্রস-এন্ট্রপি ক্ষতি ব্যবহার করে স্বয়ংক্রিয়ভাবে বিশ্বস্ত নমুনা চিহ্নিত করে, ম্যানুয়াল টীকাকরণ এড়ায়
३. একক-ধাপ ওজন আপডেট: একটি SVD গণনা এবং ওজন প্রজেকশনের মাধ্যমে দক্ষ মডেল সংশোধন অর্জন করে
४. ব্যাপক পরীক্ষামূলক যাচাইকরণ: সিন্থেটিক এবং বাস্তব-বিশ্ব নয়েজ পরিস্থিতিতে কার্যকারিতা যাচাই করে, একাধিক মডেল আর্কিটেকচার সমর্থন করে
লেবেল নয়েজ সহ প্রশিক্ষণ ডেটাসেট দেওয়া হলে, লক্ষ্য হল প্রশিক্ষিত মডেল পরামিতি সংশোধন করা যাতে এর পরীক্ষা সেটে সাধারণীকরণ কর্মক্ষমতা পরিষ্কার ডেটায় প্রশিক্ষিত মডেলের কাছাকাছি থাকে, পুনরায় প্রশিক্ষণ ছাড়াই।
রৈখিক স্তরের জন্য , SAP অ্যাক্টিভেশন সারিবদ্ধতা ম্যাট্রিক্স এর মাধ্যমে ইনপুট অ্যাক্টিভেশন প্রজেক্ট করে:
ওজন আপডেট নিয়ম:
ক্রস-এন্ট্রপি ক্ষতি ব্যবহার করে সংখ্যক সর্বনিম্ন ক্ষতির নমুনা বিশ্বস্ত সেট হিসাবে নির্বাচন করুন:
যেখানে
প্রতিনিধিত্ব ম্যাট্রিক্সে SVD বিয়োজন প্রয়োগ করুন:
গুরুত্ব ওজন গণনা করুন:
যেখানে হল সাধারণীকৃত একবচন মান, হল স্কেলিং সহগ।
প্রজেকশন ম্যাট্রিক্স নির্মাণ করুন: , যেখানে
१. স্বয়ংক্রিয় প্রক্রিয়াকরণ: ভুল নমুনাগুলি ম্যানুয়ালি চিহ্নিত করার প্রয়োজন নেই, ক্ষতি ফাংশনের মাধ্যমে স্বয়ংক্রিয়ভাবে বিশ্বস্ত নমুনা নির্বাচন করুন
२. দক্ষ আপডেট: একক SVD গণনা এবং ম্যাট্রিক্স গুণ ওজন আপডেট সম্পূর্ণ করে, পুনরাবৃত্তিমূলক অপ্টিমাইজেশন এড়ায়
३. অ্যাক্টিভেশন স্পেস প্রজেকশন: পরিষ্কার অ্যাক্টিভেশন স্থানে প্রজেক্ট করে নয়েজ অ্যাক্টিভেশনের প্রভাব দমন করুন
४. আর্কিটেকচার-অজ্ঞেয়বাদী: রৈখিক এবং কনভোলিউশন স্তরে প্রযোজ্য, একাধিক নেটওয়ার্ক আর্কিটেকচার সমর্থন করে
१. সিন্থেটিক নয়েজ ডেটাসেট:
२. বাস্তব-বিশ্ব নয়েজ ডেটাসেট:
CIFAR-10 এবং CIFAR-100 ডেটাসেটে ফলাফল দেখায়:
| ডেটাসেট | নয়েজ শক্তি | Vanilla | SAP | উন্নতি |
|---|---|---|---|---|
| CIFAR-10 | 25% | 76.68±0.48 | 82.27±0.15 | +5.59% |
| CIFAR-100 | 25% | 50.64±0.60 | 53.31±0.78 | +2.67% |
SAP সমস্ত নয়েজ সেটিংসে অন্যান্য আনলার্নিং পদ্ধতির চেয়ে উন্নত, গড় উন্নতি ১.३६% (CIFAR-10) এবং ०.३९% (CIFAR-100)।
SAP বিদ্যমান নয়েজ-রোবাস্ট পদ্ধতির কর্মক্ষমতা আরও উন্নত করতে পারে:
| পদ্ধতি | CIFAR-10 বেসলাইন | SAP বর্ধিত | উন্নতি |
|---|---|---|---|
| MixUp | 83.12±0.44 | 86.45±0.52 | +3.33% |
| SAM | 83.29±0.28 | 87.29±0.08 | +4.0% |
| গড় | 83.69 | 87.14 | +3.45% |
বাস্তব নয়েজ ডেটাসেটে ফলাফল:
| ডেটাসেট | মডেল | Vanilla | SAP | উন্নতি |
|---|---|---|---|---|
| Clothing1M | ResNet50 | 67.48±0.64 | 69.64±0.57 | +2.16% |
| Clothing1M | ViT-B/16 | 69.12±0.45 | 71.43±0.60 | +2.31% |
পরীক্ষা দেখায় যে বিশ্বস্ত নমুনা সংখ্যা ১০০০ এ বৃদ্ধি করার পরে সুবিধা হ্রাস পায়, তাই কর্মক্ষমতা এবং গণনা দক্ষতার ভারসাম্যের জন্য ১০০০ নমুনা নির্বাচন করুন।
α=३००००० একাধিক সিন্থেটিক নয়েজ সেটিংসে সর্বোত্তম পারফরম্যান্স দেখায়, খুব বড় বা খুব ছোট α মান কর্মক্ষমতা হ্রাস করে।
१. গণনা দক্ষতা: SAP শুধুমাত্র १६ বার হাইপারপ্যারামিটার অনুসন্ধান প্রয়োজন, যখন SCRUB ६७५ বার প্রয়োজন
२. রোবাস্টনেস: বিভিন্ন নয়েজ প্রকার এবং শক্তিতে স্থিতিশীল পারফরম্যান্স
३. স্কেলেবিলিটি: বড় আকারের ডেটাসেট এবং Transformer মডেলে সফলভাবে প্রয়োগ করা হয়েছে
४. সিদ্ধান্ত সীমানা অপ্টিমাইজেশন: ভিজ্যুয়ালাইজেশন পরীক্ষা দেখায় যে SAP সিদ্ধান্ত সীমানা মসৃণ করতে পারে, ওভারফিটিং হ্রাস করে
१. ডেটা পরিষ্কার পদ্ধতি:
२. নয়েজ-রোবাস্ট প্রশিক্ষণ:
३. সংশোধনমূলক মেশিন আনলার্নিং:
বিদ্যমান পদ্ধতির তুলনায়, SAP নিম্নলিখিত সুবিধা রয়েছে:
१. কার্যকারিতা যাচাইকরণ: SAP সিন্থেটিক এবং বাস্তব নয়েজ পরিস্থিতিতে উল্লেখযোগ্যভাবে মডেল সাধারণীকরণ কর্মক্ষমতা উন্নত করে
२. দক্ষতা সুবিধা: একক ওজন আপডেট এবং সহজ হাইপারপ্যারামিটার সমন্বয় SAP কে উল্লেখযোগ্য গণনা সুবিধা প্রদান করে
३. বিস্তৃত প্রযোজ্যতা: একাধিক নেটওয়ার্ক আর্কিটেকচার এবং ডেটাসেট স্কেল সমর্থন করে
४. ব্যবহারিক মূল্য: বিদ্যমান নয়েজ-রোবাস্ট পদ্ধতির সাথে সংমিশ্রণ করা যায়, কর্মক্ষমতা আরও উন্নত করে
१. বিশ্বস্ত নমুনা অনুমান: কম ক্ষতির নমুনাগুলি সত্যিই সঠিকভাবে লেবেলযুক্ত হওয়ার অনুমানের উপর নির্ভর করে
२. হাইপারপ্যারামিটার সংবেদনশীলতা: স্কেলিং সহগ α এর নির্বাচন কর্মক্ষমতায় গুরুত্বপূর্ণ প্রভাব ফেলে
३. নয়েজ প্রকার সীমাবদ্ধতা: প্রধানত লেবেল নয়েজের জন্য, অন্যান্য প্রকার নয়েজ পরিচালনার ক্ষমতা সীমিত
४. তাত্ত্বিক বিশ্লেষণ অপর্যাপ্ত: পদ্ধতির কার্যকারিতার জন্য তাত্ত্বিক গ্যারান্টির অভাব
१. তাত্ত্বিক বিশ্লেষণ: SAP কার্যকারিতার তাত্ত্বিক ভিত্তি স্থাপন করুন
२. স্ব-অভিযোজিত প্যারামিটার নির্বাচন: সর্বোত্তম α স্বয়ংক্রিয়ভাবে নির্বাচন করার পদ্ধতি বিকাশ করুন
३. সম্প্রসারিত প্রয়োগ: অন্যান্য প্রকার নয়েজ এবং কাজে প্রয়োগ অন্বেষণ করুন
४. অন্যান্য কৌশলের সাথে সংমিশ্রণ: ডেটা বর্ধন, প্রতিকূল প্রশিক্ষণ ইত্যাদির সাথে সংমিশ্রণ গবেষণা করুন
१. পদ্ধতি উদ্ভাবনী:
२. পরীক্ষামূলক সম্পূর্ণতা:
३. ব্যবহারিক মূল্য:
४. ফলাফল প্রভাবশালীতা:
१. দুর্বল তাত্ত্বিক ভিত্তি:
२. অনুমান সীমাবদ্ধতা:
३. প্যারামিটার সমন্বয়:
४. তুলনা সীমাবদ্ধতা:
१. একাডেমিক অবদান:
२. ব্যবহারিক প্রয়োগ:
३. পুনরুৎপাদনযোগ্যতা:
१. ডেটাসেট লেবেল গুণমান কম পরিস্থিতি
२. ডেটা পুনরায় টীকাকরণ করা যায় না এমন পরিস্থিতি
३. প্রশিক্ষিত মডেল দ্রুত সংশোধনের প্রয়োজন এমন প্রয়োগ
४. গণনা সম্পদ সীমিত পরিবেশ
পেপারটি সম্পর্কিত ক্ষেত্রের গুরুত্বপূর্ণ কাজ উদ্ধৃত করে, যার মধ্যে রয়েছে:
সামগ্রিক মূল্যায়ন: এই পেপারে প্রস্তাবিত SAP পদ্ধতি লেবেল নয়েজ প্রক্রিয়াকরণে গুরুত্বপূর্ণ মূল্য রাখে, অ্যাক্টিভেশন প্রজেকশনের চতুর ডিজাইনের মাধ্যমে দক্ষ মডেল সংশোধন অর্জন করে। যদিও তাত্ত্বিক বিশ্লেষণে কিছু অভাব রয়েছে, তবে পরীক্ষামূলক যাচাইকরণ পর্যাপ্ত, ব্যবহারিক মূল্য উল্লেখযোগ্য এবং সম্পর্কিত ক্ষেত্রে মূল্যবান অবদান প্রদান করে।