Beyond single-model XAI: aggregating multi-model explanations for enhanced trustworthiness
Vascotto, Rodriguez, Bonaita et al.
The use of Artificial Intelligence (AI) models in real-world and high-risk applications has intensified the discussion about their trustworthiness and ethical usage, from both a technical and a legislative perspective. The field of eXplainable Artificial Intelligence (XAI) addresses this challenge by proposing explanations that bring to light the decision-making processes of complex black-box models. Despite being an essential property, the robustness of explanations is often an overlooked aspect during development: only robust explanation methods can increase the trust in the system as a whole. This paper investigates the role of robustness through the usage of a feature importance aggregation derived from multiple models ($k$-nearest neighbours, random forest and neural networks). Preliminary results showcase the potential in increasing the trustworthiness of the application, while leveraging multiple model's predictive power.
academic
ما وراء XAI أحادي النموذج: تجميع التفسيرات متعددة النماذج لتعزيز الموثوقية
مع الاستخدام الواسع لنماذج الذكاء الاصطناعي في التطبيقات عالية المخاطر في العالم الحقيقي، أصبحت قضايا الموثوقية والاستخدام الأخلاقي محل اهتمام متزايد من الناحية التقنية والتشريعية. يعالج مجال الذكاء الاصطناعي القابل للتفسير (XAI) هذا التحدي من خلال توفير تفسيرات تكشف عملية اتخاذ القرار في النماذج السوداء المعقدة. على الرغم من أن المتانة تمثل خاصية مهمة، إلا أنها غالباً ما يتم تجاهلها أثناء التطوير: فقط طرق التفسير القوية يمكنها زيادة الثقة في النظام بأكمله. تستكشف هذه الورقة دور المتانة من خلال استخدام أهمية الميزات المجمعة من نماذج متعددة (k-nearest neighbors والغابات العشوائية والشبكات العصبية). تُظهر النتائج الأولية إمكانية تحسين موثوقية التطبيق مع الاستفادة من قدرات التنبؤ لنماذج متعددة.
تركز هذه الدراسة على معالجة عيبين رئيسيين في طرق XAI الحالية:
عدم كفاية متانة التفسيرات: ثبت أن الطرق الشهيرة مثل LIME و SHAP تفتقر إلى المتانة في دراسات متعددة، لكنها لا تزال تُستخدم على نطاق واسع في السيناريوهات عالية المخاطر
مشكلة التضارب في التفسيرات: عندما يتم تطبيق طرق تفسير متعددة على نفس الحالة، تنتج تفسيرات متناقضة، وبسبب عدم وجود معيار حقيقي للتفسيرات، لا يمكن اختيار الطريقة المثلى
مع متطلبات التشريعات مثل GDPR وقانون الذكاء الاصطناعي للشفافية، أصبحت موثوقية التفسيرات حاسمة. يمكن بناء الثقة في النموذج نفسه فقط من خلال الثقة في التفسيرات، وهذا مهم بشكل خاص في التطبيقات عالية المخاطر.
بناءً على العمل السابق في شرح مجموعات الشبكات العصبية، تقترح هذه الورقة توسيع الطريقة لتشمل نماذج من فئات مختلفة، بهدف تحسين الموثوقية الكلية للنظام من خلال تجميع التفسيرات من عمليات اتخاذ القرار المختلفة.
تركز هذه الورقة على مهام التصنيف الثنائي للبيانات الجدولية، بهدف توليد تفسيرات موثوقة لأهمية الميزات لكل حالة تنبؤ. المدخل عبارة عن حالة بيانات جدولية، والمخرج عبارة عن متجه نسب ميزات معياري.
حققت جميع النماذج دقة تزيد عن 80% على جميع مجموعات البيانات (باستثناء k-NN على HELOC بنسبة 75.51%). تُظهر الشبكات العصبية أفضل أداء على مجموعات البيانات المعقدة، والغابات العشوائية تُظهر أفضل أداء على مجموعات البيانات البسيطة.
تم التحقق من العلاقة بين اتساق التنبؤ متعدد النماذج وحجم الحي، مما يؤكد الفرضية: عندما تتنبأ النماذج الثلاثة بشكل متسق، يمكن عادة الحصول على حجم حي أكبر، مما يشير إلى أن هذه المنطقة تتمتع بمتانة تفسير أفضل.
تُظهر النتائج في الملحق أن درجات متانة LIME و SHAP أقل بكثير من عتبة 0.5، مما يؤكد النتائج في الأدبيات حول عدم استقرار هذه الطرق، ويدعم قرار استبعادها.
تستشهد الورقة بالأدبيات المهمة في مجال XAI، بما في ذلك:
الأوراق الأصلية لـ LIME و SHAP والانتقادات لمتانتها
طرق شرح الشبكات العصبية مثل DeepLIFT و Integrated Gradients و LRP
الأبحاث ذات الصلة بتقييم المتانة وتجميع التفسيرات
الوثائق التشريعية مثل GDPR وقانون الذكاء الاصطناعي الأوروبي
التقييم الشامل: هذه ورقة ذات مساهمة مهمة في اتجاه أبحاث متانة XAI. على الرغم من أن الطريقة بسيطة نسبياً، إلا أنها تعالج مشكلة عملية مهمة وتوفر أداة قيمة لتطوير الذكاء الاصطناعي الموثوق. تكمن القيمة الرئيسية للورقة في فتح اتجاه بحثي جديد لتجميع التفسيرات عبر أنواع النماذج وتوفير إطار عمل تقييم منهجي. الاتجاهات المستقبلية واضحة، مما يضع أساساً متيناً لمزيد من التطوير في هذا المجال.