2025-11-25T17:22:18.138717

Assessing reliability of explanations in unbalanced datasets: a use-case on the occurrence of frost events

Vascotto, Blasone, Rodriguez et al.
The usage of eXplainable Artificial Intelligence (XAI) methods has become essential in practical applications, given the increasing deployment of Artificial Intelligence (AI) models and the legislative requirements put forward in the latest years. A fundamental but often underestimated aspect of the explanations is their robustness, a key property that should be satisfied in order to trust the explanations. In this study, we provide some preliminary insights on evaluating the reliability of explanations in the specific case of unbalanced datasets, which are very frequent in high-risk use-cases, but at the same time considerably challenging for both AI models and XAI methods. We propose a simple evaluation focused on the minority class (i.e. the less frequent one) that leverages on-manifold generation of neighbours, explanation aggregation and a metric to test explanation consistency. We present a use-case based on a tabular dataset with numerical features focusing on the occurrence of frost events.
academic

অসন্তুলিত ডেটাসেটে ব্যাখ্যার নির্ভরযোগ্যতা মূল্যায়ন: তুষার ঘটনার সংঘটন সম্পর্কিত একটি ব্যবহার-কেস

মৌলিক তথ্য

  • পেপার আইডি: 2507.09545
  • শিরোনাম: অসন্তুলিত ডেটাসেটে ব্যাখ্যার নির্ভরযোগ্যতা মূল্যায়ন: তুষার ঘটনার সংঘটন সম্পর্কিত একটি ব্যবহার-কেস
  • লেখক: ইলারিয়া ভাস্কোটো, ভ্যালেন্টিনা ব্লাসোন, অ্যালেক্স রডরিগেজ, আলেসান্দ্রো বোনাইটা, লুকা বোর্টোলুসি
  • শ্রেণীবিভাগ: cs.LG (মেশিন লার্নিং)
  • প্রকাশনার সময়/সম্মেলন: দেরিতে প্রকাশিত কাজ, তৃতীয় বিশ্ব ব্যাখ্যাযোগ্য কৃত্রিম বুদ্ধিমত্তা সম্মেলন (জুলাই ০৯–११, २०२५, ইস্তাম্বুল, তুরস্ক)
  • পেপার লিঙ্ক: https://arxiv.org/abs/2507.09545

সারসংক্ষেপ

ব্যাখ্যাযোগ্য কৃত্রিম বুদ্ধিমত্তা (XAI) পদ্ধতির ব্যবহার বাস্তব প্রয়োগে অত্যন্ত গুরুত্বপূর্ণ হয়ে উঠেছে, যা কৃত্রিম বুদ্ধিমত্তা মডেলের ক্রমবর্ধমান স্থাপনা এবং সম্প্রতি প্রস্তাবিত আইনি প্রয়োজনীয়তার কারণে। ব্যাখ্যার শক্তিশালীতা একটি মৌলিক কিন্তু প্রায়শই অবমূল্যায়িত দিক, যা ব্যাখ্যার প্রতি বিশ্বাস স্থাপনের জন্য একটি মূল বৈশিষ্ট্য। এই গবেষণা অসন্তুলিত ডেটাসেটের নির্দিষ্ট পরিস্থিতিতে ব্যাখ্যার নির্ভরযোগ্যতা মূল্যায়নের জন্য কিছু প্রাথমিক অন্তর্দৃষ্টি প্রদান করে। অসন্তুলিত ডেটাসেট উচ্চ-ঝুঁকিপূর্ণ ব্যবহার-কেসে অত্যন্ত সাধারণ, কিন্তু একই সাথে AI মডেল এবং XAI পদ্ধতি উভয়ের জন্য উল্লেখযোগ্য চ্যালেঞ্জ উপস্থাপন করে। আমরা সংখ্যাসূচক বৈশিষ্ট্যের ট্যাবুলার ডেটাসেটের উপর ভিত্তি করে, তুষার ঘটনার সংঘটনকে ব্যবহার-কেস হিসাবে প্রদর্শন করে, একটি সরল মূল্যায়ন পদ্ধতি প্রস্তাব করি যা সংখ্যালঘু শ্রেণীতে (অর্থাৎ কম ফ্রিকোয়েন্সির শ্রেণী) ফোকাস করে এবং বহুগুণ উপর প্রতিবেশী উৎপাদন, ব্যাখ্যা সমন্বয় এবং ব্যাখ্যা সামঞ্জস্যতা পরীক্ষার জন্য মেট্রিক্স ব্যবহার করে।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যা সংজ্ঞা

এই গবেষণার মূল সমস্যা হল: অসন্তুলিত ডেটাসেটে XAI ব্যাখ্যার নির্ভরযোগ্যতা কীভাবে মূল্যায়ন করা যায়। বিশেষভাবে, যখন ডেটাসেটে সংখ্যালঘু শ্রেণীর নমুনা অত্যন্ত কম থাকে, তখন ঐতিহ্যবাহী ব্যাখ্যা পদ্ধতি অবিশ্বাস্য ফলাফল উৎপাদন করতে পারে।

গুরুত্ব বিশ্লেষণ

১. আইনি প্রয়োজনীয়তা: GDPR এবং AI Act এর মতো নিয়মকানুন উচ্চ-ঝুঁকিপূর্ণ প্রয়োগের জন্য স্বচ্ছতার প্রয়োজনীয়তা আরোপ করে २. বাস্তব চাহিদা: চিকিৎসা, জলবায়ু, জালিয়াতি সনাক্তকরণ এবং অন্যান্য উচ্চ-ঝুঁকিপূর্ণ ক্ষেত্র প্রায়শই অসন্তুলিত ডেটা সমস্যার সম্মুখীন হয় ३. বিশ্বাস সংকট: অসন্তুলিত ডেটাসেটে, এমনকি মডেল ৯৯% নির্ভুলতা অর্জন করলেও, এটি কেবল সংখ্যাগুরু শ্রেণী পূর্বাভাস দিতে পারে

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

१. LIME এবং SHAP এর মতো পদ্ধতি অসন্তুলিত ডেটাসেটে দুর্বল শক্তিশালীতা প্রদর্শন করে २. লক্ষ্যবস্তু মূল্যায়নের অভাব: বিদ্যমান পদ্ধতি প্রধানত সামগ্রিক কর্মক্ষমতার উপর ফোকাস করে, সংখ্যালঘু শ্রেণীর বিশেষত্ব উপেক্ষা করে ३. ব্যাখ্যার অস্থিরতা: সমান ইনপুট সম্পূর্ণভাবে ভিন্ন ব্যাখ্যা উৎপাদন করতে পারে

গবেষণা প্রেরণা

লেখকরা বিশ্বাস করেন যে অসন্তুলিত ডেটাসেটে, সংখ্যালঘু শ্রেণীর ব্যাখ্যা নির্ভরযোগ্যতা মূল্যায়ন বিশেষভাবে গুরুত্বপূর্ণ, কারণ:

  • বিরল ঘটনা সঠিকভাবে পূর্বাভাস দেওয়া উচ্চ-ঝুঁকিপূর্ণ প্রয়োগে অত্যন্ত গুরুত্বপূর্ণ
  • সংখ্যাগুরু শ্রেণী সহজে পূর্বাভাসযোগ্য, তার ব্যাখ্যা অগত্যা বিশ্বাসযোগ্য নয়
  • সংখ্যালঘু শ্রেণী ব্যাখ্যার শক্তিশালীতা মূল্যায়নের জন্য বিশেষায়িত পদ্ধতির প্রয়োজন

মূল অবদান

१. অসন্তুলিত ডেটাসেটের জন্য ব্যাখ্যা নির্ভরযোগ্যতা মূল্যায়ন কাঠামো প্রস্তাব করা হয়েছে, যা সংখ্যালঘু শ্রেণীর নমুনায় ফোকাস করে २. বহুগুণ-ভিত্তিক প্রতিবেশী উৎপাদন পদ্ধতি ডিজাইন করা হয়েছে, যা বিঘ্নিত নমুনা ডেটা বহুগুণে থাকে তা নিশ্চিত করে ३. সামঞ্জস্যতা মেট্রিক্স প্রবর্তন করা হয়েছে, মূল ব্যাখ্যা এবং স্থানীয় ওজনযুক্ত গড় ব্যাখ্যা তুলনা করে নির্ভরযোগ্যতা মূল্যায়ন করে ४. প্রকৃত তুষার পূর্বাভাস কাজে পদ্ধতির কার্যকারিতা যাচাই করা হয়েছে, যা অত্যন্ত অসন্তুলিত বৈশিষ্ট্য রাখে (৯९:१)

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

অসন্তুলিত ডেটাসেট D=(X,y)\mathcal{D} = (X,y) দেওয়া, যেখানে P(y=0)P(y=1)P(y=0) \gg P(y=1) (০ সংখ্যাগুরু শ্রেণী, १ সংখ্যালঘু শ্রেণী), একটি স্নায়ু নেটওয়ার্ক f()f(\cdot) প্রশিক্ষণ দিন, লক্ষ্য হল সংখ্যালঘু শ্রেণী নমুনায় ব্যাখ্যা পদ্ধতি ee এর নির্ভরযোগ্যতা মূল্যায়ন করা।

মডেল আর্কিটেকচার

१. প্রতিবেশী উৎপাদন (Neighbourhood Generation)

k-medoids ক্লাস্টারিং-ভিত্তিক বহুগুণ উপর প্রতিবেশী উৎপাদন গ্রহণ করুন:

পদক্ষেপ:

  • যাচাইকরণ সেটে k-medoids ক্লাস্টারিং প্রয়োগ করুন, kmedoidsk_{medoids} ক্লাস্টার পান
  • প্রতিটি ক্লাস্টারের গড় আকার nk=10n_k = 10
  • প্রতিটি ক্লাস্টারের medoid প্রতিনিধি পয়েন্ট হিসাবে নিষ্কাশন করুন
  • পরীক্ষার নমুনার জন্য, এর সংশ্লিষ্ট medoid এবং এর knn=5k_{nn}=5 নিকটতম প্রতিবেশী খুঁজুন

বিঘ্নিত সূত্র: x~j=(1λˉ)xj+λˉxMj\tilde{x}_j = (1-\bar{\lambda}) \cdot x_j + \bar{\lambda} \cdot x_{M_j} যেখানে λˉBeta(λ100,(1λ)100)\bar{\lambda} \sim Beta(\lambda \cdot 100, (1-\lambda) \cdot 100)

२. স্থানীয় গড়কর (Local Averaging)

সংখ্যালঘু শ্রেণী নমুনার জন্য ওজনযুক্ত গড় ব্যাখ্যা গণনা করুন: eˉ(x)=x~Ne(x~)π(x,x~)x~Nπ(x,x~)\bar{e}(x) = \frac{\sum_{\tilde{x} \in \mathcal{N}} e(\tilde{x}) \cdot \pi(x,\tilde{x})}{\sum_{\tilde{x} \in \mathcal{N}} \pi(x,\tilde{x})} যেখানে ওজন π(x,x~)=1dist(x,x~)\pi(x,\tilde{x}) = \frac{1}{dist(x,\tilde{x})}

३. নির্ভরযোগ্যতা মূল্যায়ন

দুটি মূল্যায়ন সূচক সংজ্ঞায়িত করুন:

স্থানীয় শক্তিশালীতা: R^(x)=1Nx~Nρ(e(x),e(x~))\hat{\mathcal{R}}(x) = \frac{1}{|\mathcal{N}|} \sum_{\tilde{x} \in \mathcal{N}} \rho(e(x), e(\tilde{x}))

সামঞ্জস্যতা: C^(x)=ρ(e(x),eˉ(x))\hat{\mathcal{C}}(x) = \rho(e(x), \bar{e}(x)) যেখানে ρ\rho Spearman র‍্যাঙ্ক সহসম্পর্ক সহগ

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

१. বহুগুণ-সচেতন প্রতিবেশী উৎপাদন: র‍্যান্ডম গাউসীয় শব্দের তুলনায়, medoid-ভিত্তিক পদ্ধতি ডেটা বিতরণের সাথে আরও সামঞ্জস্যপূর্ণ প্রতিবেশী উৎপাদন করতে পারে २. সংখ্যালঘু শ্রেণীর জন্য বিশেষায়িত মূল্যায়ন: সবচেয়ে গুরুত্বপূর্ণ কিন্তু সবচেয়ে দুর্বল সংখ্যালঘু শ্রেণী নমুনায় ফোকাস করুন ३. সামঞ্জস্যতা মেট্রিক্সের প্রবর্তন: মূল ব্যাখ্যা এবং সমন্বিত ব্যাখ্যা তুলনা করে স্থানীয় সামঞ্জস্যতা মূল্যায়ন করুন ४. দূরত্ব-ওজনযুক্ত ব্যাখ্যা সমন্বয়: নমুনা মধ্যে দূরত্ব অনুযায়ী ব্যাখ্যা ওজনযুক্ত গড় করুন

পরীক্ষামূলক সেটআপ

ডেটাসেট

তুষার পূর্বাভাস ডেটাসেট:

  • উৎস: ERA5 পুনর্বিশ্লেষণ ডেটা (ECMWF) + বীমা কোম্পানির মালিকানাধীন ডেটা
  • সময়কাল: २००९-२०२४ (१५ বছর)
  • ভৌগোলিক পরিসীমা: পোল্যান্ড জুড়ে
  • বৈশিষ্ট্য: ८টি সংখ্যাসূচক বায়ুমণ্ডলীয় পরিবর্তনশীল (স্ট্যান্ডার্ডাইজড প্রক্রিয়াকরণ)
  • লক্ষ্য: দ্বিশ্রেণী (তুষার ঘটনা সংঘটন বা না)
  • অসন্তুলন মাত্রা: ९९% বনাম १% (অত্যন্ত অসন্তুলিত)
  • ডেটা বিভাজন: প্রশিক্ষণ সেট ७५%, যাচাইকরণ সেট १५%, পরীক্ষা সেট १०% (ভৌগোলিক স্তরবিন্যাস দ্বারা)

মূল্যায়ন মেট্রিক্স

  • মডেল কর্মক্ষমতা: F१-স্কোর (অসন্তুলিত ডেটাসেটের জন্য উপযুক্ত)
  • ব্যাখ্যা নির্ভরযোগ্যতা: স্থানীয় শক্তিশালীতা R^(x)\hat{\mathcal{R}}(x) এবং সামঞ্জস্যতা C^(x)\hat{\mathcal{C}}(x)
  • সম্পর্ক মেট্রিক্স: Spearman র‍্যাঙ্ক সহসম্পর্ক সহগ

তুলনামূলক পদ্ধতি

ব্যাখ্যা পদ্ধতি: १. Integrated Gradients: গ্রেডিয়েন্ট ইন্টিগ্রেশন-ভিত্তিক অ্যাট্রিবিউশন পদ্ধতি २. DeepLIFT: সক্রিয়করণ পার্থক্য প্রচার-ভিত্তিক পদ্ধতি ३. Layer-wise Relevance Propagation (LRP): স্তর-অনুযায়ী প্রাসঙ্গিকতা প্রচার ४. Ensemble পদ্ধতি: উপরোক্ত তিনটি পদ্ধতির ওজনযুক্ত সমন্বয়

প্রতিবেশী উৎপাদন তুলনা:

  • র‍্যান্ডম গাউসীয় শব্দ উৎপাদন বনাম medoid-ভিত্তিক বহুগুণ উৎপাদন

বাস্তবায়ন বিবরণ

  • মডেল আর্কিটেকচার: ५-স্তরীয় সম্পূর্ণ সংযুক্ত স্নায়ু নেটওয়ার্ক, ReLU সক্রিয়করণ, sigmoid আউটপুট
  • ক্ষতি ফাংশন: Focal Loss (γ=.,α=.७५\gamma=२.५, \alpha=०.७५)
  • অপ্টিমাইজার: RAdam, শিক্ষার হার ०.०००१
  • প্রশিক্ষণ সেটআপ: १००টি epoch, ব্যাচ আকার २५६
  • প্রতিবেশী প্যারামিটার: knn=,λ=.०५k_{nn}=५, \lambda=०.०५, প্রতিবেশী আকার n=१००n=१००

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

মডেল কর্মক্ষমতা

ডেটাসেটসংখ্যাগুরু শ্রেণী F१সংখ্যালঘু শ্রেণী F१সংখ্যালঘু শ্রেণী নমুনা সংখ্যা
প্রশিক্ষণ সেট१.०००.६६~२,५००
যাচাইকরণ সেট१.०००.५०~४५०
পরীক্ষা সেট१.०००.५१~३००

ব্যাখ্যা পদ্ধতি কর্মক্ষমতা তুলনা

পদ্ধতিশক্তিশালীতা R^(x)\hat{\mathcal{R}}(x)সামঞ্জস্যতা C^(x)\hat{\mathcal{C}}(x)
Integrated Gradients८९.३४% (±८.३५%)९७.५६% (±३.५८%)
DeepLIFT९७.६९% (±२.२६%)९९.४०% (±१.५१%)
LRP७६.७७% (±१५.७०%)८९.८६% (±१९.९५%)
Ensemble७९.०३% (±१२.५६%)८९.२०% (±१३.७३%)

মূল আবিষ্কার

१. প্রতিবেশী উৎপাদন পদ্ধতির গুরুত্ব: medoid-ভিত্তিক পদ্ধতি র‍্যান্ডম শব্দের তুলনায় সংখ্যালঘু শ্রেণীতে উল্লেখযোগ্যভাবে ভাল কর্মক্ষমতা প্রদর্শন করে २. DeepLIFT সর্বোত্তম কর্মক্ষমতা: শক্তিশালীতা এবং সামঞ্জস্যতা উভয় মেট্রিক্সে সর্বোচ্চ স্কোর এবং সর্বনিম্ন মান বিচ্যুতি অর্জন করে ३. LRP এর অস্থিরতা: গ্রেডিয়েন্ট অদৃশ্য সমস্যার কারণে, LRP সবচেয়ে অস্থির কর্মক্ষমতা প্রদর্শন করে ४. সংখ্যালঘু শ্রেণীর দুর্বলতা: সংখ্যালঘু শ্রেণী ব্যাখ্যা সংখ্যাগুরু শ্রেণী ব্যাখ্যার চেয়ে প্রতিবেশী উৎপাদন পদ্ধতির প্রভাবের জন্য আরও সহজ

অ্যাবলেশন পরীক্ষা

র‍্যান্ডম প্রতিবেশী উৎপাদন এবং medoid-ভিত্তিক প্রতিবেশী উৎপাদনের তুলনা করে প্রমাণ করে:

  • র‍্যান্ডম পদ্ধতি সংখ্যালঘু শ্রেণীতে বৃহত্তর বিতরণ স্থানান্তর উৎপাদন করে
  • medoid-ভিত্তিক পদ্ধতি ডেটা বহুগুণ কাঠামো আরও ভালভাবে সংরক্ষণ করতে পারে
  • সংখ্যালঘু শ্রেণী প্রতিবেশী উৎপাদন পদ্ধতির পছন্দের জন্য আরও সংবেদনশীল

সম্পর্কিত কাজ

XAI শক্তিশালীতা গবেষণা

  • LIME এবং SHAP এর সীমাবদ্ধতা: বিদ্যমান গবেষণা দেখায় যে এই পদ্ধতিগুলি প্রতিকূল আক্রমণের অধীনে দুর্বল কর্মক্ষমতা প্রদর্শন করে
  • ব্যাখ্যা স্থিতিশীলতা: বিদ্যমান কাজ প্রধানত সাধারণ পরিস্থিতিতে ব্যাখ্যা স্থিতিশীলতার উপর ফোকাস করে, অসন্তুলিত ডেটার জন্য বিশেষায়িত গবেষণার অভাব

অসন্তুলিত শিক্ষা

  • ঐতিহ্যবাহী পদ্ধতি: পুনঃনমুনা, খরচ-সংবেদনশীল শিক্ষা ইত্যাদি
  • গভীর শিক্ষা পদ্ধতি: Focal Loss এর মতো অসন্তুলিত ডেটা পরিচালনার জন্য বিশেষায়িত ক্ষতি ফাংশন
  • মূল্যায়ন চ্যালেঞ্জ: ঐতিহ্যবাহী মূল্যায়ন মেট্রিক্স অত্যন্ত অসন্তুলিত ডেটায় ব্যর্থ হয়

এই পেপারের অবদান

বিদ্যমান কাজের তুলনায়, এই পেপার প্রথমবারের মতো অসন্তুলিত ডেটাসেটে XAI পদ্ধতির নির্ভরযোগ্যতা সমস্যা সিস্টেমেটিকভাবে অধ্যয়ন করে এবং একটি বিশেষায়িত মূল্যায়ন কাঠামো প্রস্তাব করে।

উপসংহার এবং আলোচনা

প্রধান উপসংহার

१. অসন্তুলিত ডেটাসেটে ব্যাখ্যা নির্ভরযোগ্যতা একটি গুরুত্বপূর্ণ কিন্তু উপেক্ষিত সমস্যা २. সংখ্যালঘু শ্রেণী ব্যাখ্যার জন্য বিশেষ মূল্যায়ন পদ্ধতির প্রয়োজন, ঐতিহ্যবাহী পদ্ধতি বিভ্রান্তিকর ফলাফল উৎপাদন করতে পারে ३. বহুগুণ-ভিত্তিক প্রতিবেশী উৎপাদন মূল্যায়নের নির্ভরযোগ্যতা উল্লেখযোগ্যভাবে উন্নত করতে পারে ४. DeepLIFT তুষার পূর্বাভাস কাজে সর্বোত্তম কর্মক্ষমতা প্রদর্শন করে, উচ্চ শক্তিশালীতা এবং সামঞ্জস্যতা সহ

সীমাবদ্ধতা

१. পদ্ধতি এখনও প্রাথমিক পর্যায়ে রয়েছে: আরও ডেটাসেট এবং পরিস্থিতিতে যাচাইকরণের প্রয়োজন २. শুধুমাত্র ট্যাবুলার ডেটা বিবেচনা করা হয়েছে: চিত্র, পাঠ্য এবং অন্যান্য ডেটা ধরনের সাথে জড়িত নয় ३. মূল্যায়ন মেট্রিক্সের সীমাবদ্ধতা: বর্তমান মেট্রিক্স ব্যাখ্যার গুণমান সম্পূর্ণভাবে ক্যাপচার করতে পারে না ४. গণনা ওভারহেড: প্রতিটি নমুনার জন্য বড় সংখ্যক প্রতিবেশী উৎপাদন গণনা খরচ বৃদ্ধি করে

ভবিষ্যত দিকনির্দেশনা

१. বিভিন্ন অসন্তুলন অনুপাতে সম্প্রসারণ: বিভিন্ন অসন্তুলন মাত্রায় পদ্ধতির কর্মক্ষমতা অধ্যয়ন করুন २. মাল্টিমোডাল ডেটা: চিত্র, পাঠ্য এবং অন্যান্য ডেটা ধরনে পদ্ধতি সম্প্রসারণ করুন ३. অনিশ্চয়তা বিশ্লেষণ: অনিশ্চয়তা পরিমাণকরণ একত্রিত করে সংখ্যালঘু শ্রেণী মূল্যায়ন উন্নত করুন ४. স্থানকালীন ডেটা: স্থানকালীন মাত্রার বিশেষ বৈশিষ্ট্য বিবেচনা করুন

গভীর মূল্যায়ন

শক্তি

१. সমস্যার গুরুত্ব: XAI ক্ষেত্রে একটি গুরুত্বপূর্ণ কিন্তু উপেক্ষিত সমস্যায় মনোযোগ দেয় २. পদ্ধতির উদ্ভাবনী: লক্ষ্যবস্তু মূল্যায়ন কাঠামো প্রস্তাব করে, তাত্ত্বিক ভিত্তি সহ ३. পরীক্ষার সম্পূর্ণতা: বাস্তব পরিস্থিতিতে যাচাই করা হয়, বাস্তব প্রয়োগ মূল্য রয়েছে ४. লেখার স্পষ্টতা: পেপার কাঠামো স্পষ্ট, পদ্ধতি বর্ণনা বিস্তারিত

অপূর্ণতা

१. পরীক্ষার স্কেল সীমিত: শুধুমাত্র একটি ডেটাসেটে যাচাই করা হয়েছে, সর্বজনীনতা প্রমাণের অভাব २. তাত্ত্বিক বিশ্লেষণ অপর্যাপ্ত: পদ্ধতির তাত্ত্বিক বৈশিষ্ট্যের গভীর বিশ্লেষণের অভাব ३. বেসলাইন পদ্ধতির সীমাবদ্ধতা: অসন্তুলিত ডেটা পরিচালনার জন্য বিশেষায়িত অন্যান্য XAI পদ্ধতির সাথে তুলনা নেই ४. মূল্যায়ন মেট্রিক্স একক: প্রধানত সম্পর্ক মেট্রিক্সের উপর নির্ভর করে, ব্যাখ্যার গুণমান সম্পূর্ণভাবে প্রতিফলিত করতে পারে না

প্রভাব

१. একাডেমিক অবদান: অসন্তুলিত ডেটায় XAI প্রয়োগের জন্য নতুন চিন্তাভাবনা প্রদান করে २. বাস্তব মূল্য: উচ্চ-ঝুঁকিপূর্ণ প্রয়োগে XAI স্থাপনার জন্য নির্দেশনা প্রদান করে ३. পুনরুৎপাদনযোগ্যতা: কোড খোলা উৎস, পুনরুৎপাদন এবং সম্প্রসারণ সহজ করে

প্রযোজ্য পরিস্থিতি

  • উচ্চ-ঝুঁকিপূর্ণ প্রয়োগ: চিকিৎসা নির্ণয়, আর্থিক ঝুঁকি নিয়ন্ত্রণ, আবহাওয়া সতর্কতা ইত্যাদি
  • অত্যন্ত অসন্তুলিত ডেটা: জালিয়াতি সনাক্তকরণ, অসামান্যতা সনাক্তকরণ, বিরল ঘটনা পূর্বাভাস
  • কঠোর নিয়ন্ত্রক প্রয়োজনীয়তা সহ ক্ষেত্র: ব্যাখ্যাযোগ্য AI প্রয়োজনীয় শিল্প প্রয়োগ

সংদর্ভ

পেপারটি XAI ক্ষেত্রের গুরুত্বপূর্ণ কাজ উদ্ধৃত করে, যার মধ্যে রয়েছে:

  • LIME এবং SHAP এর মতো ক্লাসিক পদ্ধতি
  • Integrated Gradients ११, DeepLIFT १२, LRP १३ এর মতো স্নায়ু নেটওয়ার্ক ব্যাখ্যা পদ্ধতি
  • Focal Loss এর মতো অসন্তুলিত শিক্ষা প্রযুক্তি
  • সম্পর্কিত শক্তিশালীতা বিশ্লেষণ কাজ ५, ९, १०

সামগ্রিক মূল্যায়ন: এটি একটি গুরুত্বপূর্ণ বাস্তব সমস্যায় মনোযোগ দেওয়া প্রাথমিক গবেষণা কাজ। যদিও পরীক্ষার স্কেল এবং তাত্ত্বিক গভীরতায় উন্নতির জায়গা রয়েছে, তবে এটি অসন্তুলিত ডেটাসেটে XAI নির্ভরযোগ্যতা মূল্যায়নের জন্য গবেষণার একটি নতুন দিক খুলে দেয় এবং ভাল প্রয়োগ সম্ভাবনা রয়েছে।