Formal XAI is an emerging field that focuses on providing explanations with mathematical guarantees for the decisions made by machine learning models. A significant amount of work in this area is centered on the computation of "sufficient reasons". Given a model $M$ and an input instance $\vec{x}$, a sufficient reason for the decision $M(\vec{x})$ is a subset $S$ of the features of $\vec{x}$ such that for any instance $\vec{z}$ that has the same values as $\vec{x}$ for every feature in $S$, it holds that $M(\vec{x}) = M(\vec{z})$. Intuitively, this means that the features in $S$ are sufficient to fully justify the classification of $\vec{x}$ by $M$. For sufficient reasons to be useful in practice, they should be as small as possible, and a natural way to reduce the size of sufficient reasons is to consider a probabilistic relaxation; the probability of $M(\vec{x}) = M(\vec{z})$ must be at least some value $δ\in (0,1]$, for a random instance $\vec{z}$ that coincides with $\vec{x}$ on the features in $S$. Computing small $δ$-sufficient reasons ($δ$-SRs) is known to be a theoretically hard problem; even over decision trees--traditionally deemed simple and interpretable models--strong inapproximability results make the efficient computation of small $δ$-SRs unlikely. We propose the notion of $(δ, ε)$-SR, a simple relaxation of $δ$-SRs, and show that this kind of explanation can be computed efficiently over linear models.
تبحث هذه الورقة مشكلة حساب "الأسباب الكافية" في الذكاء الاصطناعي القابل للتفسير الرسمي (Formal XAI). بالنظر إلى نموذج M وعينة إدخال x، فإن السبب الكافي هو مجموعة فرعية S من الميزات بحيث أن أي عينة z متطابقة مع x على S لديها M(x)=M(z). لتقليل حجم الأسباب الكافية، يأخذ المؤلفون في الاعتبار تخفيفاً احتمالياً: يتطلب أن تكون احتمالية M(x)=M(z) عندما تتطابق عينة عشوائية z مع x على مجموعة الميزات على الأقل δ∈(0,1]. حساب الأسباب الكافية δ-الصغيرة (δ-SRs) صعب نظرياً، حتى بالنسبة للنماذج "القابلة للتفسير" مثل أشجار القرار. تقدم الورقة مفهوم (δ,ε)-SR، وهو تخفيف بسيط لـ δ-SRs، وتثبت أن هذه الشروح يمكن حسابها بكفاءة على النماذج الخطية.
المشكلة الأساسية: كيفية توفير شروح صغيرة الحجم بضمانات رياضية لقرارات نماذج التعلم الآلي. تتطلب الأسباب الكافية التقليدية 100% من اليقين، لكن هذا غالباً ما يؤدي إلى شروح كبيرة جداً وغير مناسبة للفهم البشري.
أهمية المشكلة:
أشار ميلر (1956) إلى أن الشروح التي تتجاوز 9 ميزات قد تكون كبيرة جداً على البشر
تشير الدراسات التجريبية إلى أن الشروح يجب أن تكون موجزة (Narayanan et al., 2018; Lage et al., 2019)
في التطبيقات العملية، يهتم المستخدمون بحجم الشرح أكثر من الاختلافات الطفيفة في الضمانات الاحتمالية
قيود الطرق الموجودة:
حساب الحد الأدنى من δ-SRs هو NP-hard حتى بالنسبة لأشجار القرار
بالنسبة للنماذج الخطية، الحساب الدقيق للاحتمالية هو #P-hard
توجد نتائج قوية لعدم القابلية للتقريب: لا يمكن الحصول على نسب تقريب جيدة في الوقت متعدد الحدود
الدافع البحثي:
حساسية المستخدمين لحجم الشرح أعلى من حساسيتهم للتغييرات الطفيفة في الضمانات الاحتمالية
الحاجة إلى إيجاد توازن بين القابلية النظرية للمعالجة والعملية
قد تسمح البنية الخاصة للنماذج الخطية بخوارزميات فعالة
الإدخال: نموذج خطي L، عينة x، معاملات δ، ε، β
1. δ* ← عينة موحدة من [δ-ε, δ+ε]
2. حساب جميع تقييمات الميزات s_i
3. بناء سلسلة عينات جزئية y^(0), ..., y^(n)
4. تعيين عدد العينات m = (log 2n)/(2ε²δ²) log(2log n/β)
5. استخدام البحث الثنائي للعثور على الحد الأدنى k بحيث الاحتمالية المقدرة ≥ δ*
6. إرجاع (δ*, y^(k*))
Darwiche, A. and Hirth, A. (2020). On the Reasons Behind Decisions. ECAI 2020.
Barceló, P., Monet, M., Pérez, J., and Subercaseaux, B. (2020). Model interpretability through the lens of computational complexity. NeurIPS 2020.
Wäldchen, S., MacDonald, J., Hauch, S., and Kutyniok, G. (2021). The computational complexity of understanding binary classifier decisions. JAIR.
Arenas, M., Barceló, P., Romero Orth, M., and Subercaseaux, B. (2022). On computing probabilistic explanations for decision trees. NeurIPS 2022.
Kozachinskiy, A. (2023). Inapproximability of sufficient reasons for decision trees. arXiv:2304.02781.
تقدم هذه الورقة مساهمة نظرية مهمة في مجال الذكاء الاصطناعي القابل للتفسير الرسمي، حيث تثبت للمرة الأولى قابلية معالجة الشروح الاحتمالية على النماذج الخطية، مما يوفر نتيجة إيجابية نادرة لهذا المجال. على الرغم من وجود مجال للتحسين من حيث العملية، فإن قيمتها النظرية والابتكار الطريقة تجعلها عملاً مهماً في هذا المجال.