The usage of eXplainable Artificial Intelligence (XAI) methods has become essential in practical applications, given the increasing deployment of Artificial Intelligence (AI) models and the legislative requirements put forward in the latest years. A fundamental but often underestimated aspect of the explanations is their robustness, a key property that should be satisfied in order to trust the explanations. In this study, we provide some preliminary insights on evaluating the reliability of explanations in the specific case of unbalanced datasets, which are very frequent in high-risk use-cases, but at the same time considerably challenging for both AI models and XAI methods. We propose a simple evaluation focused on the minority class (i.e. the less frequent one) that leverages on-manifold generation of neighbours, explanation aggregation and a metric to test explanation consistency. We present a use-case based on a tabular dataset with numerical features focusing on the occurrence of frost events.
- معرّف الورقة: 2507.09545
- العنوان: تقييم موثوقية التفسيرات في مجموعات البيانات غير المتوازنة: دراسة حالة حول حدوث أحداث الصقيع
- المؤلفون: Ilaria Vascotto, Valentina Blasone, Alex Rodriguez, Alessandro Bonaita, Luca Bortolussi
- التصنيف: cs.LG (التعلم الآلي)
- وقت النشر/المؤتمر: عمل متأخر، المؤتمر العالمي الثالث للذكاء الاصطناعي القابل للتفسير (9-11 يوليو 2025، إسطنبول، تركيا)
- رابط الورقة: https://arxiv.org/abs/2507.09545
أصبح استخدام طرق الذكاء الاصطناعي القابل للتفسير (XAI) حاسماً في التطبيقات العملية، وذلك بفضل النشر المتزايد لنماذج الذكاء الاصطناعي والمتطلبات التشريعية المقترحة في السنوات الأخيرة. تعتبر قوة التفسيرات جانباً أساسياً لكن غالباً ما يتم التقليل من شأنه، وهي خاصية رئيسية يجب أن تفي بها التفسيرات الموثوقة. تقدم هذه الدراسة رؤى أولية حول تقييم موثوقية التفسيرات في الحالة المحددة لمجموعات البيانات غير المتوازنة. تعتبر مجموعات البيانات غير المتوازنة شائعة جداً في حالات الاستخدام عالية المخاطر، لكنها تشكل في الوقت ذاته تحديات كبيرة لنماذج الذكاء الاصطناعي وطرق XAI. نقترح طريقة تقييم بسيطة تركز على الفئة الأقلية (أي الفئات ذات التكرار المنخفض)، والتي تستخدم توليد الجيران على المتشعبات والتجميع التفسيري وقياس اختبار اتساق التفسيرات. قدمنا عرضاً توضيحياً بناءً على مجموعة بيانات جدولية للميزات الرقمية، مع استخدام حدوث أحداث الصقيع كحالة استخدام.
المشكلة الأساسية التي تسعى هذه الدراسة إلى حلها هي: كيفية تقييم موثوقية تفسيرات XAI في مجموعات البيانات غير المتوازنة. بشكل محدد، عندما تكون عينات الفئة الأقلية نادرة جداً في مجموعة البيانات، قد تنتج الطرق التفسيرية التقليدية نتائج غير موثوقة.
- المتطلبات التشريعية: تفرض اللوائح مثل GDPR وقانون الذكاء الاصطناعي متطلبات الشفافية للتطبيقات عالية المخاطر
- الاحتياجات العملية: تواجه المجالات عالية المخاطر مثل الطب والمناخ والكشف عن الاحتيال مشاكل عدم التوازن بشكل متكرر
- أزمة الثقة: في مجموعات البيانات غير المتوازنة، حتى لو حقق النموذج دقة 99%، قد يكون ذلك مجرد تنبؤ بسيط للفئة الأكثر
- تظهر طرق LIME و SHAP قوة رديئة في مجموعات البيانات غير المتوازنة
- نقص التقييم الموجه: تركز الطرق الموجودة بشكل أساسي على الأداء الكلي، متجاهلة الخصوصية الفئة الأقلية
- عدم استقرار التفسيرات: قد تنتج المدخلات المتشابهة تفسيرات مختلفة تماماً
يعتقد المؤلفون أن تقييم موثوقية التفسيرات للفئة الأقلية في مجموعات البيانات غير المتوازنة مهم بشكل خاص لأن:
- التنبؤ الدقيق بالأحداث النادرة حاسم في التطبيقات عالية المخاطر
- الفئة الأكثر سهلة التنبؤ بها، وتفسيراتها قد لا تكون موثوقة بالضرورة
- هناك حاجة إلى طرق متخصصة لتقييم قوة تفسيرات الفئة الأقلية
- اقتراح إطار عمل لتقييم موثوقية التفسيرات في مجموعات البيانات غير المتوازنة، مع التركيز على عينات الفئة الأقلية
- تصميم طريقة توليد جيران قائمة على المتشعبات، مما يضمن أن العينات المشوشة تقع على متشعب البيانات
- إدخال قياس الاتساق، من خلال مقارنة التفسير الأصلي مع متوسط التفسير المرجح محلياً لتقييم الموثوقية
- التحقق من فعالية الطريقة على مهمة التنبؤ بالصقيع الحقيقية، وهي مهمة غير متوازنة بشدة (99:1)
بالنظر إلى مجموعة بيانات غير متوازنة D=(X,y)، حيث P(y=0)≫P(y=1) (0 للفئة الأكثر، 1 للفئة الأقلية)، تدريب شبكة عصبية f(⋅)، والهدف هو تقييم موثوقية طريقة التفسير e على عينات الفئة الأقلية.
استخدام توليد جيران على المتشعبات بناءً على تجميع k-medoids:
الخطوات:
- تطبيق تجميع k-medoids على مجموعة التحقق، للحصول على kmedoids مجموعة
- متوسط حجم كل مجموعة nk=10
- استخراج medoid لكل مجموعة كنقطة تمثيلية
- بالنسبة لعينة الاختبار، البحث عن medoid المقابل لها و knn=5 أقرب جيران
صيغة التشويش:
x~j=(1−λˉ)⋅xj+λˉ⋅xMj
حيث λˉ∼Beta(λ⋅100,(1−λ)⋅100)
حساب متوسط التفسير المرجح للفئة الأقلية:
eˉ(x)=∑x~∈Nπ(x,x~)∑x~∈Ne(x~)⋅π(x,x~)
حيث الوزن π(x,x~)=dist(x,x~)1
تعريف مؤشري تقييم:
القوة المحلية:
R^(x)=∣N∣1∑x~∈Nρ(e(x),e(x~))
الاتساق:
C^(x)=ρ(e(x),eˉ(x))
حيث ρ هو معامل ارتباط رتبة Spearman
- توليد جيران يدرك المتشعبات: مقارنة بالضوضاء الغاوسية العشوائية، تستطيع الطريقة القائمة على medoid توليد جيران أكثر توافقاً مع توزيع البيانات
- تقييم متخصص للفئة الأقلية: التركيز على عينات الفئة الأقلية الأكثر أهمية لكن الأكثر هشاشة
- إدخال قياس الاتساق: تقييم الاتساق المحلي من خلال مقارنة التفسير الأصلي مع التفسير المجمع
- تجميع التفسيرات المرجح بالمسافة: حساب متوسط التفسيرات مرجحاً بناءً على المسافة بين العينات
مجموعة بيانات التنبؤ بالصقيع:
- المصدر: بيانات إعادة التحليل ERA5 (ECMWF) + بيانات شركة التأمين الملكية
- الفترة الزمنية: 2009-2024 (15 سنة)
- النطاق الجغرافي: جميع أنحاء بولندا
- الميزات: 8 متغيرات جوية رقمية (معالجة معيارية)
- الهدف: تصنيف ثنائي (حدوث الصقيع أم لا)
- درجة عدم التوازن: 99% مقابل 1% (غير متوازن بشدة)
- تقسيم البيانات: مجموعة التدريب 75%، مجموعة التحقق 15%، مجموعة الاختبار 10% (تقسيم طبقي حسب المنطقة)
- أداء النموذج: F1-score (مناسب لمجموعات البيانات غير المتوازنة)
- موثوقية التفسير: القوة المحلية R^(x) والاتساق C^(x)
- قياس الارتباط: معامل ارتباط رتبة Spearman
طرق التفسير:
- Integrated Gradients: طريقة إسناد قائمة على تكامل التدرج
- DeepLIFT: طريقة قائمة على نشر الفروقات في التفعيل
- Layer-wise Relevance Propagation (LRP): نشر الملاءمة على مستوى الطبقة
- طريقة المجموعة: مزيج مرجح من الطرق الثلاث أعلاه
مقارنة توليد الجيران:
- توليد ضوضاء غاوسية عشوائية مقابل توليد متشعب قائم على medoid
- معمارية النموذج: شبكة عصبية متصلة بالكامل من 5 طبقات، تفعيل ReLU، إخراج sigmoid
- دالة الخسارة: Focal Loss (γ=2.5,α=0.75)
- محسّن: RAdam، معدل التعلم 0.0001
- إعدادات التدريب: 100 حقبة، حجم الدفعة 256
- معاملات الجيران: knn=5,λ=0.05، حجم الجيران n=100
| مجموعة البيانات | F1 للفئة الأكثر | F1 للفئة الأقلية | عدد عينات الفئة الأقلية |
|---|
| مجموعة التدريب | 1.00 | 0.66 | ~2,500 |
| مجموعة التحقق | 1.00 | 0.50 | ~450 |
| مجموعة الاختبار | 1.00 | 0.51 | ~300 |
| الطريقة | القوة R^(x) | الاتساق C^(x) |
|---|
| Integrated Gradients | 89.34% (±8.35%) | 97.56% (±3.58%) |
| DeepLIFT | 97.69% (±2.26%) | 99.40% (±1.51%) |
| LRP | 76.77% (±15.70%) | 89.86% (±19.95%) |
| المجموعة | 79.03% (±12.56%) | 89.20% (±13.73%) |
- أهمية طريقة توليد الجيران: تظهر الطريقة القائمة على medoid أداءً أفضل بشكل ملحوظ على الفئة الأقلية مقارنة بالضوضاء العشوائية
- أداء DeepLIFT الأمثل: حققت أعلى درجات وأقل انحراف معياري في كلا المؤشرين
- عدم استقرار LRP: بسبب مشكلة اختفاء التدرج، تظهر LRP أقل استقراراً
- هشاشة الفئة الأقلية: تفسيرات الفئة الأقلية أكثر عرضة للتأثر بطريقة توليد الجيران
من خلال مقارنة توليد الجيران العشوائي وتوليد الجيران القائم على medoid، تم إثبات:
- تنتج الطريقة العشوائية تحولاً توزيعياً أكبر على الفئة الأقلية
- تستطيع الطريقة القائمة على medoid الحفاظ بشكل أفضل على هيكل متشعب البيانات
- الفئة الأقلية أكثر حساسية لاختيار طريقة توليد الجيران
- حدود LIME و SHAP: أظهرت الأبحاث السابقة أن هذه الطرق تؤدي أداءً سيئاً تحت الهجمات العدائية
- استقرار التفسيرات: يركز العمل الموجود بشكل أساسي على استقرار التفسيرات في الحالات العامة، مع نقص الأبحاث المتخصصة حول البيانات غير المتوازنة
- الطرق التقليدية: إعادة العينات، التعلم الحساس للتكلفة، وغيرها
- طرق التعلم العميق: Focal Loss وغيرها من دوال الخسارة المتخصصة في معالجة عدم التوازن
- تحديات التقييم: تفشل مؤشرات التقييم التقليدية على البيانات غير المتوازنة بشدة
بالمقارنة مع الأعمال الموجودة، تدرس هذه الورقة لأول مرة بشكل منهجي مشكلة موثوقية طرق XAI في مجموعات البيانات غير المتوازنة، وتقترح إطار عمل تقييم متخصص.
- موثوقية التفسيرات في مجموعات البيانات غير المتوازنة مشكلة مهمة لكن مهملة
- تحتاج تفسيرات الفئة الأقلية إلى طرق تقييم خاصة، قد تنتج الطرق التقليدية نتائج مضللة
- يستطيع توليد الجيران القائم على المتشعبات تحسين موثوقية التقييم بشكل ملحوظ
- يظهر DeepLIFT أداءً أفضل في مهمة التنبؤ بالصقيع، مع قوة واتساق عاليين
- الطريقة لا تزال في مرحلة أولية: تحتاج إلى التحقق على مجموعات بيانات وسيناريوهات أكثر
- تقتصر على البيانات الجدولية: لم تتناول أنواع بيانات أخرى مثل الصور والنصوص
- قيود مؤشرات التقييم: قد لا تتمكن المؤشرات الحالية من التقاط جودة التفسير بالكامل
- التكلفة الحسابية: يزيد توليد عدد كبير من الجيران لكل عينة من التكلفة الحسابية
- التوسع إلى نسب عدم توازن مختلفة: دراسة أداء الطريقة عند درجات عدم توازن مختلفة
- البيانات متعددة الأنماط: توسيع الطريقة إلى أنواع بيانات مثل الصور والنصوص
- تحليل عدم اليقين: دمج تقدير عدم اليقين لتحسين تقييم الفئة الأقلية
- البيانات الزمكانية: الأخذ في الاعتبار الخصائص الخاصة للأبعاد الزمانية والمكانية
- أهمية المشكلة: تركز على مشكلة مهمة لكن مهملة في مجال XAI
- ابتكار الطريقة: تقترح إطار عمل تقييم موجه بأساس نظري
- كفاية التجارب: التحقق في سيناريو حقيقي، ذو قيمة تطبيقية عملية
- وضوح الكتابة: هيكل الورقة واضح، وصف الطريقة مفصل
- نطاق التجارب محدود: تم التحقق على مجموعة بيانات واحدة فقط، افتقار إلى إثبات الشمولية
- نقص التحليل النظري: افتقار إلى تحليل عميق للخصائص النظرية للطريقة
- قيود طرق الأساس: عدم المقارنة مع طرق XAI متخصصة أخرى في معالجة البيانات غير المتوازنة
- وحدة مؤشرات التقييم: الاعتماد الأساسي على مؤشرات الارتباط، قد لا تعكس جودة التفسير بشكل شامل
- المساهمة الأكاديمية: توفير أفكار جديدة لتطبيق XAI على البيانات غير المتوازنة
- القيمة العملية: توجيه لنشر XAI في التطبيقات عالية المخاطر
- قابلية إعادة الإنتاج: تم نشر الكود مفتوح المصدر، مما يسهل إعادة الإنتاج والتوسع
- التطبيقات عالية المخاطر: التشخيص الطبي، التحكم في المخاطر المالية، التنبيهات الأرصادية، وغيرها
- البيانات غير المتوازنة بشدة: الكشف عن الاحتيال، الكشف عن الشذوذ، التنبؤ بالأحداث النادرة
- المجالات ذات المتطلبات التنظيمية الصارمة: الصناعات التي تتطلب ذكاءً اصطناعياً قابلاً للتفسير
استشهدت الورقة بأعمال مهمة في مجال XAI، بما في ذلك:
- الطرق الكلاسيكية LIME 3 و SHAP 4
- طرق تفسير الشبكات العصبية Integrated Gradients 11 و DeepLIFT 12 و LRP 13
- تقنيات التعلم غير المتوازن مثل Focal Loss 7
- أعمال تحليل القوة ذات الصلة 5, 9, 10
التقييم الشامل: هذه ورقة بحثية أولية تركز على مشكلة عملية مهمة. على الرغم من وجود مجال للتحسين في نطاق التجارب والعمق النظري، فإنها تفتح اتجاهاً بحثياً جديداً لتقييم موثوقية XAI في مجموعات البيانات غير المتوازنة، وتتمتع بآفاق تطبيقية جيدة.