2025-11-19T09:40:14.113488

Beyond single-model XAI: aggregating multi-model explanations for enhanced trustworthiness

Vascotto, Rodriguez, Bonaita et al.
The use of Artificial Intelligence (AI) models in real-world and high-risk applications has intensified the discussion about their trustworthiness and ethical usage, from both a technical and a legislative perspective. The field of eXplainable Artificial Intelligence (XAI) addresses this challenge by proposing explanations that bring to light the decision-making processes of complex black-box models. Despite being an essential property, the robustness of explanations is often an overlooked aspect during development: only robust explanation methods can increase the trust in the system as a whole. This paper investigates the role of robustness through the usage of a feature importance aggregation derived from multiple models ($k$-nearest neighbours, random forest and neural networks). Preliminary results showcase the potential in increasing the trustworthiness of the application, while leveraging multiple model's predictive power.
academic

ما وراء XAI أحادي النموذج: تجميع التفسيرات متعددة النماذج لتعزيز الموثوقية

المعلومات الأساسية

  • معرّف الورقة: 2510.11164
  • العنوان: Beyond single-model XAI: aggregating multi-model explanations for enhanced trustworthiness
  • المؤلفون: Ilaria Vascotto, Alex Rodriguez, Alessandro Bonaita, Luca Bortolussi
  • التصنيف: cs.LG (التعلم الآلي)
  • وقت النشر/المؤتمر: TRUST-AI: The European Workshop on Trustworthy AI (ECAI 2025)
  • رابط الورقة: https://arxiv.org/abs/2510.11164

الملخص

مع الاستخدام الواسع لنماذج الذكاء الاصطناعي في التطبيقات عالية المخاطر في العالم الحقيقي، أصبحت قضايا الموثوقية والاستخدام الأخلاقي محل اهتمام متزايد من الناحية التقنية والتشريعية. يعالج مجال الذكاء الاصطناعي القابل للتفسير (XAI) هذا التحدي من خلال توفير تفسيرات تكشف عملية اتخاذ القرار في النماذج السوداء المعقدة. على الرغم من أن المتانة تمثل خاصية مهمة، إلا أنها غالباً ما يتم تجاهلها أثناء التطوير: فقط طرق التفسير القوية يمكنها زيادة الثقة في النظام بأكمله. تستكشف هذه الورقة دور المتانة من خلال استخدام أهمية الميزات المجمعة من نماذج متعددة (k-nearest neighbors والغابات العشوائية والشبكات العصبية). تُظهر النتائج الأولية إمكانية تحسين موثوقية التطبيق مع الاستفادة من قدرات التنبؤ لنماذج متعددة.

السياق البحثي والدافع

تعريف المشكلة

تركز هذه الدراسة على معالجة عيبين رئيسيين في طرق XAI الحالية:

  1. عدم كفاية متانة التفسيرات: ثبت أن الطرق الشهيرة مثل LIME و SHAP تفتقر إلى المتانة في دراسات متعددة، لكنها لا تزال تُستخدم على نطاق واسع في السيناريوهات عالية المخاطر
  2. مشكلة التضارب في التفسيرات: عندما يتم تطبيق طرق تفسير متعددة على نفس الحالة، تنتج تفسيرات متناقضة، وبسبب عدم وجود معيار حقيقي للتفسيرات، لا يمكن اختيار الطريقة المثلى

الأهمية

مع متطلبات التشريعات مثل GDPR وقانون الذكاء الاصطناعي للشفافية، أصبحت موثوقية التفسيرات حاسمة. يمكن بناء الثقة في النموذج نفسه فقط من خلال الثقة في التفسيرات، وهذا مهم بشكل خاص في التطبيقات عالية المخاطر.

قيود الطرق الموجودة

  • الطرق السائدة مثل LIME و SHAP تعاني من مشاكل المتانة، مما ينتج عنه تفسيرات غير متسقة للمدخلات المتشابهة
  • طرق التفسير أحادية النموذج لا تستطيع الاستفادة الكاملة من قدرات التنبؤ لنماذج متعددة
  • يوجد نقص في استراتيجيات تجميع التفسيرات الفعالة للتعامل مع التضارب بين النماذج المختلفة

الدافع البحثي

بناءً على العمل السابق في شرح مجموعات الشبكات العصبية، تقترح هذه الورقة توسيع الطريقة لتشمل نماذج من فئات مختلفة، بهدف تحسين الموثوقية الكلية للنظام من خلال تجميع التفسيرات من عمليات اتخاذ القرار المختلفة.

المساهمات الأساسية

  1. اقتراح طريقتي نسب ميزات جديدتين:
    • طريقة أهمية الميزات المستندة إلى المسافة لنماذج k-nearest neighbors
    • طريقة نسب الميزات المستندة إلى نقاء العقد للغابات العشوائية
  2. تطوير إطار عمل لتجميع التفسيرات متعددة النماذج:
    • دمج التفسيرات من k-NN والغابات العشوائية والشبكات العصبية
    • تجميع أهمية الميزات من خلال المتوسط الحسابي
  3. إدخال آلية تقييم المتانة:
    • استخدام طريقة توليد الحي المستندة إلى نقطة المركز
    • تحديد كمية متانة التفسيرات من خلال معامل ارتباط Spearman
  4. التحقق من العلاقة بين اتساق النموذج ومتانة التفسيرات:
    • إثبات أن اتساق التنبؤ متعدد النماذج يمكن أن يكون مؤشراً على موثوقية التفسيرات

شرح الطريقة

تعريف المهمة

تركز هذه الورقة على مهام التصنيف الثنائي للبيانات الجدولية، بهدف توليد تفسيرات موثوقة لأهمية الميزات لكل حالة تنبؤ. المدخل عبارة عن حالة بيانات جدولية، والمخرج عبارة عن متجه نسب ميزات معياري.

بنية النموذج

طريقة شرح k-nearest neighbors

تستند الخوارزمية إلى آلية الاستدلال بالمسافة في k-NN:

  1. بالنسبة لنقطة التنبؤ x، يتم اختيار k' من أقرب الجيران من فئة التنبؤ c والفئة المعاكسة ¬c على حدة
  2. حساب متوسط مسافة الميزات لكل مجموعة من الجيران D_c و D_¬c
  3. يتم تعريف أهمية الميزة كـ: e = D_¬c - D_c
  4. تطبيع كمتجه وحدة لضمان المقارنة

طريقة شرح الغابات العشوائية

مستندة إلى نقاء العقد في مسارات القرار:

  1. لكل شجرة في الغابة، تتبع مسار القرار لنقطة البيانات
  2. بناءً على ما إذا كان التنبؤ بشجرة واحدة متطابقاً مع تنبؤ الغابة، تراكم نقاء العقد إلى e_c أو e_¬c على التوالي
  3. التفسير النهائي هو: e = (p_¬c + ε) × e_c - p_c × e_¬c
  4. حيث p_c و p_¬c هما احتمالات التنبؤ، و ε=0.01 لتجنب القيم الصفرية

استراتيجية التجميع

استخدام المتوسط الحسابي على مستوى الميزة:

a_agg = (1/L) × Σ(l=1 to L) a_l

حيث L=3 هو عدد النماذج. عندما تكون تنبؤات النموذج غير متسقة، يتم عكس إشارة التفسيرات للنماذج المتضاربة لضمان توجيه التفسيرات نحو نفس الفئة.

تقييم المتانة

توليد الحي

استخدام طريقة مستندة إلى نقطة المركز:

  1. إجراء تجميع k-medoid على مجموعة التحقق
  2. لكل نقطة بيانات، البحث عن مركز الكتلة المقابل و k_M من أقرب مراكز الكتل
  3. توليد اضطرابات متوافقة مع مشعب البيانات من خلال توزيع Beta والاستبدال الاحتمالي

حساب المتانة

استخدام معامل ارتباط Spearman الترتيبي:

R̂(x,N,e,f) = (1/|N|) × Σ(x̃∈N) ρ(e(x), e(x̃))

حيث N هي مجموعة نقاط الحي التي تحافظ على اتساق التنبؤ.

إعداد التجارب

مجموعات البيانات

استخدام 5 مجموعات بيانات جدولية عامة لمهام التصنيف الثنائي:

  • Adult: 36,177/8,045/1,000 (تدريب/تحقق/اختبار)، 5 ميزات عددية، 7 ميزات فئوية
  • Bank: 36,168/8,043/1,000، 5 ميزات عددية، 9 ميزات فئوية
  • HELOC: 8,367/1,592/500، 14 ميزة عددية، ميزتان فئويتان
  • Cancer: 397/121/50، 15 ميزة عددية، 0 ميزات فئوية
  • White Wine: 3,918/780/200، 9 ميزات عددية، 0 ميزات فئوية

مؤشرات التقييم

  • درجة المتانة: بناءً على متوسط معامل ارتباط Spearman
  • حجم الحي: نسبة نقاط الاضطراب المحتفظ بها بعد التصفية
  • قيمة AUC: المساحة تحت منحنى ROC بناءً على اتساق النموذج

طرق المقارنة

  • طريقة التفسير المخصصة لـ k-NN
  • طريقة التفسير المخصصة للغابات العشوائية
  • طريقة DeepLIFT للشبكات العصبية
  • نتائج تجميع الطرق الثلاث
  • المقارنة مع LIME و SHAP في الملحق

تفاصيل التنفيذ

  • k-NN: k=15 (adult, bank)، k=5 (غيرها)
  • الغابات العشوائية: 25 متعلماً أساسياً
  • الشبكات العصبية: شبكة إدراك متعدد الطبقات قياسية
  • توليد الحي: k_M=5, α=0.05, α_cat=0.05
  • نسبة الاحتفاظ بالحي المستهدفة: ≥95%

نتائج التجارب

النتائج الرئيسية

أداء النموذج

حققت جميع النماذج دقة تزيد عن 80% على جميع مجموعات البيانات (باستثناء k-NN على HELOC بنسبة 75.51%). تُظهر الشبكات العصبية أفضل أداء على مجموعات البيانات المعقدة، والغابات العشوائية تُظهر أفضل أداء على مجموعات البيانات البسيطة.

مقارنة المتانة

متوسط درجات المتانة (%):

مجموعة البياناتk-NNRFNNالتجميع
Adult61.1288.6785.0374.58
Bank52.2773.5278.7465.75
HELOC71.0180.5684.2377.92
Cancer83.3181.0798.4084.93
Wine69.5566.6092.9666.74

تُظهر النتائج:

  • طريقة k-NN لديها أقل متانة، وهو ما يتوافق مع اعتمادها على الجيران البعيدين
  • طريقة الشبكات العصبية لديها أعلى متانة
  • متانة طريقة التجميع تقع بين الطرق المكونة لها، وهو ما يتوافق مع التوقعات النظرية

تحليل اتساق النموذج

تم التحقق من العلاقة بين اتساق التنبؤ متعدد النماذج وحجم الحي، مما يؤكد الفرضية: عندما تتنبأ النماذج الثلاثة بشكل متسق، يمكن عادة الحصول على حجم حي أكبر، مما يشير إلى أن هذه المنطقة تتمتع بمتانة تفسير أفضل.

التقييم التحقق

التحقق من العلاقة بين اتساق النموذج ومتانة التفسيرات من خلال تحليل ROC:

مقارنة قيم AUC:

مجموعة البياناتk-NNRFNNالتجميع
Adult0.44800.54170.69700.5901
Bank0.41280.62570.38610.6097
HELOC0.65730.60490.67480.6095
Cancer0.83970.92120.71200.9212
Wine0.50880.46980.04690.4951

تُظهر طريقة التجميع أداءً جيداً في معظم الحالات، لكن طريقة k-NN تُظهر نتائج سيئة في بعض السيناريوهات.

المقارنة مع LIME/SHAP

تُظهر النتائج في الملحق أن درجات متانة LIME و SHAP أقل بكثير من عتبة 0.5، مما يؤكد النتائج في الأدبيات حول عدم استقرار هذه الطرق، ويدعم قرار استبعادها.

الأعمال ذات الصلة

تطور مجال XAI

  • طرق التفسير المحلي: LIME و SHAP وطرق أخرى مستقلة عن النموذج
  • طرق خاصة بالشبكات العصبية: DeepLIFT و Integrated Gradients و LRP وغيرها
  • أبحاث المتانة: تقييم واستحسان استقرار طرق التفسير

أبحاث تجميع التفسيرات

  • ركزت الأعمال السابقة بشكل أساسي على نماذج متعددة من نوع واحد
  • تمتد هذه الورقة إلى تجميع التفسيرات من أنواع نماذج مختلفة

الاحتياجات المدفوعة بالتشريعات

  • متطلبات "الحق في التفسير" في GDPR
  • متطلبات الشفافية لتطبيقات عالية المخاطر في قانون الذكاء الاصطناعي الأوروبي

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. جدوى التجميع متعدد النماذج: إثبات أن التفسيرات من أنواع نماذج مختلفة يمكن تجميعها بفعالية
  2. العلاقة بين المتانة والاتساق: التحقق من أن اتساق التنبؤ متعدد النماذج يمكن أن يكون مؤشراً على موثوقية التفسيرات
  3. استراتيجية التفسير المحافظة: توفر طريقة التجميع استراتيجية تفسير محافظة لكن موثوقة

القيود

  1. بساطة طريقة التجميع: الاستخدام الحالي للمتوسط الحسابي لا يمكنه التعامل مع أنماط التضارب المعقدة
  2. اعتماد طريقة k-NN: حساسة لمعامل البحث k' مع تباين كبير
  3. اكتمال التقييم: يتطلب التحقق في سيناريوهات تطبيق فعلية أكثر شمولاً
  4. قيود نوع النموذج: تم الاختبار على ثلاثة أنواع نماذج فقط

الاتجاهات المستقبلية

حدد المؤلفون بوضوح أربعة اتجاهات للتحسين:

  1. تطوير استراتيجيات تجميع أكثر تعقيداً للتعامل مع حالات التضارب الشديد
  2. تحسين طريقة شرح k-NN لتقليل الاعتماد على معاملات البحث
  3. إجراء تقييم تحقق أكثر شمولاً في حالات الاستخدام الفعلية
  4. التوسع ليشمل أنواع نماذج وطرق XAI أخرى

التقييم المتعمق

المميزات

  1. أهمية المشكلة: معالجة مشكلة حاسمة في مجال XAI - متانة التفسيرات والموثوقية
  2. ابتكار الطريقة:
    • أول اقتراح لتجميع التفسيرات عبر أنواع النماذج
    • طرق جديدة لنسب الميزات في k-NN و RF
    • إطار عمل منهجي لتقييم المتانة
  3. كفاية التجارب:
    • التحقق على مجموعات بيانات متعددة
    • تحليل استبدالي كامل
    • مقارنة مع الطرق السائدة
  4. الأساس النظري: إنشاء ارتباط نظري بين اتساق النموذج ومتانة التفسيرات

أوجه القصور

  1. قيود الطريقة:
    • استراتيجية التجميع بسيطة جداً وقد تفقد معلومات مهمة
    • الأساس النظري لطريقة k-NN ضعيف نسبياً
    • تنطبق فقط على مهام التصنيف الثنائي
  2. إعداد التجارب:
    • حجم مجموعات البيانات صغير نسبياً
    • نقص التحقق في سيناريوهات تطبيق عالية المخاطر فعلية
    • تحليل غير كافٍ للتكاليف الحسابية
  3. عمق التحليل:
    • تحليل غير كافٍ لحالات فشل طريقة التجميع
    • نقص التحليل الكمي لمساهمة أنواع النماذج المختلفة

التأثير

  1. المساهمة الأكاديمية: توفير أفكار جديدة لأبحاث متانة XAI، خاصة في اتجاه التجميع متعدد النماذج
  2. القيمة العملية: توفير إطار عمل عملي للذكاء الاصطناعي الموثوق في التطبيقات عالية المخاطر
  3. قابلية التكرار: وصف الطريقة واضح، وتنفيذ الخوارزمية بسيط نسبياً

السيناريوهات المناسبة

  • سيناريوهات القرار عالية المخاطر: المجالات المالية والطبية وغيرها التي تتطلب ذكاء اصطناعي قابل للتفسير وموثوق
  • الامتثال التنظيمي: التطبيقات التي تحتاج إلى الامتثال لمتطلبات GDPR وغيرها
  • تدقيق النموذج: السيناريوهات التي تتطلب تقييم موثوقية أنظمة الذكاء الاصطناعي
  • منصات البحث: توفير إطار عمل أساسي لأبحاث متانة XAI

المراجع

تستشهد الورقة بالأدبيات المهمة في مجال XAI، بما في ذلك:

  • الأوراق الأصلية لـ LIME و SHAP والانتقادات لمتانتها
  • طرق شرح الشبكات العصبية مثل DeepLIFT و Integrated Gradients و LRP
  • الأبحاث ذات الصلة بتقييم المتانة وتجميع التفسيرات
  • الوثائق التشريعية مثل GDPR وقانون الذكاء الاصطناعي الأوروبي

التقييم الشامل: هذه ورقة ذات مساهمة مهمة في اتجاه أبحاث متانة XAI. على الرغم من أن الطريقة بسيطة نسبياً، إلا أنها تعالج مشكلة عملية مهمة وتوفر أداة قيمة لتطوير الذكاء الاصطناعي الموثوق. تكمن القيمة الرئيسية للورقة في فتح اتجاه بحثي جديد لتجميع التفسيرات عبر أنواع النماذج وتوفير إطار عمل تقييم منهجي. الاتجاهات المستقبلية واضحة، مما يضع أساساً متيناً لمزيد من التطوير في هذا المجال.